El nou model GPT-4.1 d'OpenAI arriba amb millores de codificació i comprensió de contextos extensos

El nou model GPT-4.1 d'OpenAI arriba amb millores de codificació i comprensió de contextos extensos

El nou model GPT-4.1 d'OpenAI arriba amb millores de codificació i comprensió de contextos extensosAgències

Publicat per

Creat:

Actualitzat:

Etiquetes:

OpenAI ha presentat el seu nou model d'intel·ligència artificial (IA) GPT-4.1, juntament amb les versions de menor grandària GPT-4.1 mini i GPT-4.1 nano, que arriben amb millores en aspectes de codificació i seguiment d'instruccions, així com amb finestres de context més àmplies de fins a un milió de tokens i una millor comprensió de contextos extensos.

La tecnològica liderada per Sam Altman ha donat a conèixer els seus nous models insígnia, que succeeixen als models presentats l'any passat, GPT-*4o i GPT-*4o mini, amb capacitats que els superen "en tots els aspectes", a més d'estar optimitzats per a oferir un alt rendiment a un menor cost.

En aquest sentit, OpenAI ha presentat GPT-4.1, un nou model que ha estat desenvolupat amb el focus posat en "la seva utilitat en el món real", per al que la companyia ha col·laborat amb la comunitat de desenvolupadors, de cara a optimitzar-lo a l'hora de fer les tasques més importants per a les seves aplicacions.

Segons ha matisat en un comunicat en el seu web, aquest model destaca en mesures estàndard de la indústria en àrees com la codificació, on obté una puntuació de 54,6% en SWE-*bench Verified, la qual cosa suposa una millora del 21,4 %en comparació amb els resultats de GPT-*4o i una millora del 26,6% si es compara amb les capacitats de GPT-4.5.

El mateix passa amb les seves capacitats per a seguir instruccions, que mostren "importants millores". Segons el punt de referència MultiChallenge, GPT-4.1 obté una puntuació de 38,3%, la qual cosa millora en un 10,5% els resultats de GPT-*4o.

OpenAI també ha incidit que es tracta d'un model que disposa d'una finestra de context més àmplia, ja que admet fins a un milió de tokens de context, la qual cosa permet una millor comprensió de contextos extensos. En aquest sentit, en el punt de referència per a la comprensió de contextos llargs multimodals Vídeo-MME, el nou model obté una puntuació de 72% en la categoria llarga sense subtítols, una millora del 6,7% respecte a GPT-*4o.

GPT-4.1 MINI Y GPT-4.1 NANO

Juntament amb GPT-4.1, la companyia ha presentat dos models de menor grandària, GPT-4.1 mini i GPT-4.1 nano. En el cas de la versió mini, es tracta d'una opció més assequible que manté altes prestacions, per part seva, la versió nano és un model més lleuger, al qual OpenAI es refereix com "el més ràpid i econòmic" que ha desenvolupat.

Concretament, GPT-4.1 mini presenta avanços significatius per al rendiment dels models petits, ja que supera a GPT-*4o en nombroses proves de rendiment, així com en avaluacions d'intel·ligència, al mateix temps que redueix la latència a gairebé la meitat i rebaixa el cost en un 83%.

En el cas de GPT-4.1 nano, la companyia assegura un "rendiment excepcional en una grandària compacta", sobretot per a tasques de classificació o autocompletat. Això es deu, en part, al fet que obté altes puntuacions en punts de referència com el MMLU, on aconsegueix el 80,1%, o en codificació poliglota de Aider, amb un 9,8%. En aquests punts de referència, també supera els resultats de GPT.4o mini.

OpenAI ha assenyalat que les millores que presenten els seus nous models quant a la fiabilitat del seguiment d'instruccions i la comprensió de contextos extensos, fa que siguin "considerablement més eficaços" a l'hora d'impulsar agents o sistemes que facin tasques de manera independent.

Això es tradueix en el fet que els desenvolupadors podran utilitzar aquests models per a crear agents que siguin més útils i de confiança en "l'enginyeria del 'programari' del món real", ja que han millorat en tasques com extreure informació de documents grans o resoldre sol·licituds de clients amb la mateixa assistència, entre altres tasques complexes.

Amb tot això, el nou model GPT-4.1 ja està disponible per als desenvolupadors a través de l'API, si bé encara no s'ha llançat en ChatGPT. Per part seva, els models GPT-4.1 mini i GPT-4.1 nano encara no estan disponibles.

GPT-4.5 CESSA LA SEVA DISPONIBILITAT EN L'API

Seguint aquesta línia, quant a la seva API, OpenAI ha detallat que la versió preliminar del model GPT-4.5 deixarà d'estar disponible per a l'ús dels desenvolupadors d'aquí a tres mesos, a partir del 14 de juliol d'enguany.

En el seu lloc, els desenvolupadors passaran a utilitzar el nou model acabat de presentar GPT-4.1 en l'API. El motiu és que GPT-4.5 es va presentar al febrer d'enguany com una versió preliminar de recerca per a explorar i experimentar amb "un model gran i d'alt consum de recursos", segons ha explicat la companyia.

No obstant això, OpenAI ha assenyalat que continuaran incorporant la creativitat, qualitat d'escriptura, l'humor i els matisos que oferia GPT-4.5 en els futurs models d'API. A més, la vista prèvia del model continuarà estant disponible a través de ChatGPT si es desitja continuar experimentant.

tracking