ChatGPT pot deduir la ubicació d'una fotografia amb les noves capacitats del model o3

Publicat per

Creat: 20.04.2025 | 16:37

Actualitzat: 20.04.2025 | 16:37

Etiquetes:

tecnologia

ChatGPT ha millorat la seva capacitat d'analitzar imatges amb els models de raonament OpenAI o3 i o4-mini fins al punt que pot identificar l'adreça exacta en què s'ha fet una fotografia concreta.

Els nous models d'OpenAI arriben amb dues novetats: un comportament autònom, d'agent, i la capacitat de "pensar amb imatges", és a dir, de comprendre el contingut d'una imatge i integrar la informació visual directament a la cadena de raonament.

Juntes impulsen una capacitat que fins ara no tenia ChatGPT: identificar on s'ha fet una fotografia. Ho fan en una recerca de 'geoendevinació', com ho ha anomenat l'expert en intel·ligència artificial Ethan Mollick al seu perfil a X (antic Twitter).

Mollick destaca la capacitat d'o3 per "ampliar imatges, fer cerques de web i llegir text", que li permeten al nou model trobar elements a la fotografia que li donin pistes per, en conjunt, establir una ubicació.

El mateix xatbot desglossa el seu procés de raonament amb la imatge fins a arribar a la ubicació que ofereix amb una adreça i un mapa, perquè es pugui comprovar.