Mesterséges intelligencia által generált kép Tokióban 2023. január 31-én. ( AFP / RICHARD A. BROOKS)

A mesterséges intelligencia által generált képek könnyen átverhetnek minket. Néhány tipp a felismerésükhöz

Egy kép Donald Trumpról rácsok mögött? Vlagyimir Putyin orosz elnök kínai kollégája, Hszi Csin-ping előtt térdel? Ezek az élethű képek a generatív mesterséges intelligencia gyors fejlődésének eredményei, amelyeket általánosan Generatív AI-nak neveznek. Az ilyen technológia térnyerésével egyre nehezebb megkülönböztetni a valódi és a számítógép által generált képeket. Bár nincs tökéletes módszer az AI által generált képek azonosítására, szakértők szerint bizonyos vizuális és kontextuális jelek segítségével meg lehet különböztetni őket a valódi fotóktól.

A közelmúltban kifejlesztett mesterséges intelligencia eszközök, mint például a Midjourney, a DALL-E, a Craiyon vagy a Stable Diffusion végtelen számú képet tudnak generálni felhasználva a rendezésükre álló hatalmas adatbázisokat.

Sokan humoros vagy művészi célokra használják ezeket az eszközöket, mások azonban politikai hírekről szóló képeket készítenek a segítségükkel.

Vlagyimir Putyin és Hszi Csin-ping 2023. március 20-i találkozója után például mesterséges intelligencia által generált képek egész sora kezdett terjedni a Twitteren. Mások Emmanuel Macron francia elnököt ábrázolták szemétszedés közben, miközben a párizsi utcákon a vitatott nyugdíjreformok miatti tömeges sztrájkok közepette halmozódott a szemét.

Bár a legtöbb alkotó egyértelműen jelzi, hogy ezek a széles körben megosztott képek hamisítványok, egyes fotók kontextus nélkül is terjedni kezdtek, vagy egyenesen azzal az állítással osztották meg őket, hogy azok valódi eseményeket ábrázolnak.

A fejlesztők olyan eszközökkel kisérleteznek, mint a Hugging Face, hogy így próbálják meg felismerni a generált képeket. De az AFP tapasztalatai szerint ezek az eszközök vegyes eredményeket produkálnak és néha félrevezetőek.

"Amikor a mesterséges intelligencia (a semmiből) képeket generál, általában nincs egyetlen eredeti kép sem, amelyből a részek származnának" – mondta el David Fischinger, az Osztrák Technológiai Intézet mesterséges intelligencia-specialistája és mérnöke az AFP-nek március 21-én. "Több ezer/millió fotó van, amelyekből több milliárd paramétert tanultak meg".

Vincent Terrasi, a Draft & Goal nevű startup társalapítója, aki egy mesterséges intelligencia detektoron dolgozik egyetemek számára, hozzátette: "A mesterséges intelligencia összekeveri ezeket a képeket az adatbázisából, dekonstruálja őket, majd pixelről pixelre rekonstruálja a fotót, ami azt jelenti, hogy a végső renderelésnél már nem vesszük észre a különbséget az eredeti képek között." 

Ezért a manipulációt felismerő szoftverek rosszul, vagy egyáltalán nem működnek a mesterséges intelligenciával létrehozott képek azonosításában. A kép metaadatai, amelyek néha elárulják a mesterséges intelligencia által generált kép forrását, szintén nem segítenek. 

"Sajnos nem lehet a metaadatokra támaszkodni, mivel a közösségi médiában ezeket teljesen eltávolítják" – mondta az AFP-nek Annalisa Verdoliva AI-szakértő, a nápolyi Második Frigyes Egyetem professzora. 

A kép eredetének visszakeresése

A szakértők szerint az egyik fontos nyom az, ha megtaláljuk, mikor került először fel a kép az internetre. Bizonyos esetekben a kép eredeti készítője világosan jelzi, hogy a képet mesterséges intelligenciával készítették, és megjelöli a használt eszközt is. 

Egy fordított képkeresés is segíthet, ami megnézi, hogy a képet indexelték-e már a keresőmotorok, és adott esetben megtalálja az azonos fotót tartalmazó korábbi bejegyzéseket. 

Ezzel a módszerrel sikerült például megtalálni azoknak a képeknek a forrását, amelyeken állítólag azt lehetett látni, hogy Donald Trump volt amerikai elnök rendőrökkel dulakodik. 

A Google képkeresője az egyik ilyen képen végzett keresésre Eliot Higgins, a Bellingcat oknyomozó kollektíva alapítójának egy 2023. március 20-án közzétett Twitter-bejegyzését adta ki. 

Higgins leírta, hogy a képsorozatot a Midjourney legújabb verziójával készítette. 

Image
Képernyőmentés egy Google-keresésből, 2023. március 22.

Egy fordított képkeresés még akkor is segíthet, ha nem találjuk az eredeti képet. A segítségével találhatunk jobb minőségű változatokat, akkor is, ha a képet időközben megvágták vagy manipulálták. A jobb minőségű változatot könnyebb elemezni is, és például olyan hibákat találni rajta, amelyek generált képre utalhatnak.  

A fordított képkereséssel ráadásul találhatunk hasonló – de valódi – képeket, ami hasznos lehet, mivel így össze tudjuk hasonlítani az AI-gyanús képeket más, megbízható forrásból származó képekkel. 

Azoknak a virálisan terjedő képeknek az esetében például, amin azt látni, ahogyan Putyin Hszi Csin-ping előtt térdel, a Twitter-felhasználók több eltérést is felfedeztek a hivatalos sajtófotókhoz képest. David Puente olasz újságíró például arra hívta fel a figyelmet, hogy a a szoba dekorációja eltér attól, amit az eseményről szóló hivatalos képeken látni. 

Image
Képernyőkép a Twitterről, 2023. március 23.

A képeken látható feliratok és az online kommentek szintén hasznosak lehetnek az AI által generált tartalom egy bizonyos fajtájának a felismerésében. A DALL-E például ultrarealisztikus dizájnjairól, a Midjourney pedig hírességeket bemutató jeleneteiről ismert.

Bizonyos programok esetében, mint a Midjourney, a képgenerálás folyamata is visszakövethető bizonyos mértékig, mivel az nyilvános csatornákon történik. 

Vizuális nyomok

De még a fénykép forrásának ismerete nélkül is lehetséges elemezni a képeken fellelhető vizuális nyomokat. 

  • Vízjelek

Egyes esetekben megtalálhatjuk a képet generáló program vízjelét az AI-generálta fotókon. 

A DALL-E például egy kis színskálát rak minden kép jobb alsó sarkában. A Crayion egy kis piros zsírkrétát tesz ugyanoda. 

Image
Az AFP által generált kép 2023. március 22-én a DALL-E és a következő mondat felhasználásával: "Egy nyalókát tart egy gyerek a kezében a tengerparton".
Image
A Craiyon.com által generált kép 2023. március 22-én a következő kifejezéssel: "Toll az asztalon"

De nem minden mesterséges intelligencia által generált képen van vízjel – és ha van, az is eltávolítható, levágható vagy elrejthető.

  • Tippek a művészvilágból

Tina Nikoukhah, az ENS Paris-Saclay Egyetem képfeldolgozással foglalkozó doktorandusza az AFP-nek elmondta: "Ha kétségeink vannak, nézzük meg a kép szemcsézettségét, amely egy mesterséges intelligencia által generált fotó esetében nagyon különbözik egy valódi fotóétól". 

Az AFP több AI-képgeneráló program ingyenes verzióit használva olyan képeket generált, amelyek stílusa inkább a hiperrealista mozgalom festményeihez hasonlít: mint például az alábbi bal oldali példa, amely Brad Pittet hivatott ábrázolni Párizsban. 

A jobb oldali kép hasonló kulcsszavakkal készült a DALL-E-n. Erről a képről első ránézésre már nem olyan könnyű megmondani, hogy azt egy program generálta.

Image
Mesterséges intelligencia által generált kép a Stable Diffusion használatával 2023. március 22-én a következő kifejezéssel: "Brad Pitt, Párizs utcája, kora reggel, napsütéses idő, kezében croissant, pékség és régi francia autó mellett, fehér ingben, mosolyogva, realisztikus, 4K"
Image
Mesterséges intelligencia által generált kép, 2023. március 22-én készült a DALL-E és a következő mondat felhasználásával: "Brad Pitt Párizsban, fotó, boltok a háttérben, 4K"
  • Hibák és következetlenségek a képeken

A generatív mesterséges intelligencia terén elért ugrásszerű fejlődés ellenére a mesterséges intelligencia által generált tartalmak még mindig tartalmaznak hibákat. Ezek a hibák a legjobb módjai annak, hogy felismerjük a hamisított képet – mondták el szakemberek az AFP-nek. 

"Egyes jellemzők, gyakran ugyanazok, problémát jelentenek a mesterséges intelligencia számára. Ezeket a következetlenségeket és jellegzetes elemeket kell megvizsgálni, mint egy játékban, ahol két kép között kell a különbséget megtalálni" – mondta Vincent Terrasi a Draft & Goal munkatársa. 

"A generálási módszerek idővel folyamatosan javulnak, és egyre kevesebb szintetikus hibás részletet produkálnak, ezért én hosszú távon nem hagyatkoznék a vizuális nyomokra” – mondta Annalisa Verdoliva AI-szakértő, a nápolyi Második Frigyes Egyetem professzora. 

Például 2023 áprilisában még mindig nehéz élethű emberi kezeket generálni. Az AFP mesterséges intelligenciával generált fotója Brad Pittről a színészt aránytalanul nagy ujjakkal mutatja.

Az AFP egyik újságírója 2023 februárjában például arra hívta fel a figyelmet, hogy egy rendőrnek hat ujja van egy képsorozaton, amely állítólag a francia nyugdíjrendszer reformja elleni tüntetésen készült 2023. február 7-én. 

"Jelenleg a mesterséges intelligenciával készült képek nagyon nehezen generálnak tükröződéseket" – mondta Vincent Terrasi. "A mesterséges intelligencia felismerésének jó módja, ha árnyékokat, tükröket, vizet keresünk, de a szemekre is ráközelítünk, és elemezhetjük a pupillákat, mivel a valódi fényképek  készítésekor általában van tükröződés. Azt is gyakran észrevehetjük, hogy a szemek nem egyforma méretűek, néha eltérő színűek". 

Az Invid-WeVerify eszköz nagyító funkciójának a segítségével például észrevehetjük a két szem közötti színkülönbséget ezen a Macronról készült, mesterséges intelligencia által generált, Instagramon megosztott fényképen. A képen nem csak azt érdemes megfigyelni, hogy a két szem eltérő árnyalatú barna, de azt is fontos észben tartani, hogy Macronnak a valóságban kék szeme van. 

Image
Pillanatkép egy mesterséges intelligencia által generált kép Instagram-posztjáról
Image
Pillanatkép egy mesterséges intelligencia által generált kép Invid-WeVerify elemzéséről

Az AI által generált képeken gyakoriak az aszimmetrikus részletek is. Az arcok aránytalanok lehetnek, vagy a fülek különböző méretűek.

A fogak és a haj nehezen utánozhatóak, és körvonaluk vagy textúrájuk elárulhatja, hogy a kép nem valódi. 

Egyes elemek pedig rosszul integrálhatók a kép egészébe, például a napszemüvegek, amelyek gyakran beleolvadnak az arcba a mesterségesen generált képeken. 

A szakértők szerint, amikor több kép keveredik egy AI generálta fotón, az például a megvilágítás szempontjából is hibákhoz vezethet. 

  • A háttér is fontos lehet 

Az ilyen anomáliák kiszűrésének jó módja, ha megnézzük a fotó hátterét. Bár első pillantásra normálisnak tűnhet, egy mesterséges intelligencia által generált fotón gyakran hibákat lehet felfedezni a háttérben, mint például ezeken a fotókon, amelyeken állítólag Barack Obama és Angela Merkel láthatóak egy tengerparton.

Az egyik embernek a háttérben úgy tűnik, hogy levágták a lábát.

Image
Képernyőmentés egy mesterséges intelligencia által generált és @joannsfar által közzétett Instagram-posztról.

"Minél távolabb van egy elem, annál inkább elmosódott, torzított és helytelen perspektívájú lesz egy tárgy" – mondta Terrasi. 

A Hszi Csinping és Putyin találkozójáról készült hamis fotón például az egyik oszlopon lévő vonal nem egyenes. Az orosz vezető feje is aránytalannak tűnik a teste többi részéhez képest. Fischinger az AFP-nek elmondta, hogy a következetlenségek egy mesterséges intelligencia által generált képről árulkodnak. 

Image
A Hszi Csin-ping és Vlagyimir Putyin találkozójáról készült hamis fotón észlelt ellentmondások

Egy másik példa ez a kép egy tinédzser lányról a hálószobájában. Első pillantásra a kép teljesen normális, de ha közelebbről megnézzük a hátteret, számos furcsaságot és ellentmondást találunk: lehetetlen azonosítani egyes tárgyakat, és torz arcok szerepelnek minden poszteren:

Image
Twitter képernyőfotó, készült 2023. március 27-én.
Image
A Twitterről származó kép egy részlete.

 

  • A józan ész is fontos eszköz  

De egy elemnek nem kell torznak lennie, hogy logikai hibákra utaljon egy fotón. "Jó, ha a józan észre hagyatkozunk", ha kételkedünk egy képben, mondta az AFP-nel Fischinger. 

Az alábbi képet az AFP készítette a DALL-E segítségével. A képen hivatalosan Párizst látni, de a fotón egy kék, belépni tilos tábla látható, amely Franciaországban nem létezik. 

Image
Az AFP által 2023. március 22-én a DALL-E segítségével generált fotó a következő kifejezéssel: "Brad Pitt, Párizs utcája, kora és napos reggel, kezében croissant, egy pékség és egy régi francia autó közelében, fehér ingben, mosolyogva, realisztikus, 4K"

Ez a nyom, valamint a képen látható alak hiányzó ujjbegyei, a műanyagnak tűnő croissant és néhány ablak eltérő megvilágítása is mind azt mutatják, hogy a kép mesterséges intelligencia segítségével készült. 

A kép jobb alsó sarkában lévő vízjel minden kétséget eloszlat, és jelzi, hogy a felvétel a DALL-E-ből származik. 

Végül, de nem utolsó sorban: ha olyan képet talál, amiről azt állítják, hogy egy valós eseményt mutat, forduljon megbízható forrásokhoz és vesse össze a képet a valódi eseményekkel. 

A cikk a mesterséges intelligencia címkével lett ellátva.A 17. bekezdésben a dátum, "2023. március 7-én" javítva lett "2023. február 7-én"-re.
2024. május 2. A cikk a mesterséges intelligencia címkével lett ellátva.
2023. július 3. A 17. bekezdésben a dátum, "2023. március 7-én" javítva lett "2023. február 7-én"-re.

Van olyan tartalom, amelyet szeretne ellenőrizni az AFP tényellenőrzésén keresztül?

Lépjen kapcsolatba velünk