ChatGPT pot deduir la ubicació d'una fotografia amb les noves capacitats del model o3

Logotip de ChatGPT.
ChatGPT ha millorat la seva capacitat d'analitzar imatges amb els models de raonament OpenAI o3 i o4-mini fins al punt que pot identificar l'adreça exacta en què s'ha fet una fotografia concreta.
Els nous models d'OpenAI arriben amb dues novetats: un comportament autònom, d'agent, i la capacitat de "pensar amb imatges", és a dir, de comprendre el contingut d'una imatge i integrar la informació visual directament a la cadena de raonament.
Juntes impulsen una capacitat que fins ara no tenia ChatGPT: identificar on s'ha fet una fotografia. Ho fan en una recerca de 'geoendevinació', com ho ha anomenat l'expert en intel·ligència artificial Ethan Mollick al seu perfil a X (antic Twitter).
Mollick destaca la capacitat d'o3 per "ampliar imatges, fer cerques de web i llegir text", que li permeten al nou model trobar elements a la fotografia que li donin pistes per, en conjunt, establir una ubicació.
El mateix xatbot desglossa el seu procés de raonament amb la imatge fins a arribar a la ubicació que ofereix amb una adreça i un mapa, perquè es pugui comprovar.