OpenAI anuncia la disponibilidad general del GPT-4, su modelo generador de texto más reciente, a través de su API.

A partir de esta tarde, todos los desarrolladores existentes de la API de OpenAI «con un historial de pagos exitosos» pueden acceder al GPT-4. La empresa planea abrir el acceso a nuevos desarrolladores antes de fin de mes y luego comenzar a aumentar los límites de disponibilidad después de eso, «dependiendo de la disponibilidad informática».

«Millones de desarrolladores han solicitado acceso a la API del GPT-4 desde marzo, y la variedad de productos innovadores que aprovechan el GPT-4 está creciendo cada día», escribió OpenAI en una publicación de blog. «Visualizamos un futuro en el que los modelos de chat basados en IA puedan respaldar cualquier caso de uso».

El GPT-4 puede generar texto (incluyendo código) y aceptar imágenes y entradas de texto, una mejora con respecto al GPT-3.5, su predecesor, que solo aceptaba texto, y tiene un rendimiento «a nivel humano» en varias referencias profesionales y académicas. Al igual que los modelos anteriores de GPT de OpenAI, el GPT-4 fue entrenado utilizando datos disponibles públicamente, incluyendo páginas web públicas, así como datos con licencia de OpenAI.

La capacidad de comprensión de imágenes aún no está disponible para todos los clientes de OpenAI. OpenAI la está probando con un único socio, Be My Eyes, para comenzar. Sin embargo, no ha indicado cuándo la abrirá para una base de clientes más amplia.

Es importante destacar que, al igual que los mejores modelos de IA generativa actuales, el GPT-4 no es perfecto. «Alucina» hechos y comete errores de razonamiento, a veces con confianza. Y no aprende de su experiencia, fallando en problemas difíciles como introducir vulnerabilidades de seguridad en el código que genera.

En el futuro, OpenAI dice que permitirá a los desarrolladores ajustar el GPT-4 y el GPT-3.5 Turbo, otro de sus modelos generadores de texto recientes pero menos capaz (y uno de los modelos originales que alimenta al ChatGPT), con sus propios datos, al igual que ya era posible con varios otros modelos generadores de texto de OpenAI. Esta capacidad debería estar disponible este año, según OpenAI.

Desde la revelación del GPT-4 en marzo, la competencia en el campo de la IA generativa se ha vuelto más intensa. Recientemente, Anthropic amplió la ventana de contexto para el Claude, su principal modelo generador de texto, aún en versión previa, de 9.000 tokens a 100.000 tokens. (La ventana de contexto se refiere al texto que el modelo considera antes de generar más texto, mientras que los tokens representan el texto en bruto; por ejemplo, la palabra «fantástico» se dividiría en los tokens «fan», «tas» y «tic».)

El GPT-4 tenía el récord anterior en términos de ventana de contexto, con un máximo de 32.000 tokens. En general, los modelos con ventanas de contexto pequeñas tienden a «olvidar» el contenido de las conversaciones recientes, lo que los lleva a desviarse del tema.

En un anuncio relacionado, OpenAI informó que está lanzando de manera general sus API de DALL-E 2 y Whisper: el DALL-E 2 es el modelo generador de imágenes de OpenAI y «Whisper» se refiere al modelo de habla a texto de la empresa. También declaró que planea discontinuar los modelos antiguos disponibles a través de su API para «optimizar su capacidad computacional». (En los últimos meses, debido en gran parte a la creciente popularidad del ChatGPT, OpenAI ha tenido dificultades para satisfacer la demanda de sus modelos generativos).

A partir del 4 de enero de 2024, ciertos modelos antiguos de OpenAI, específicamente el GPT-3 y sus derivados, ya no estarán disponibles y serán reemplazados por nuevos modelos «base GPT-3» que se supone serán más eficientes en términos de procesamiento. Los desarrolladores que utilizan los modelos antiguos deberán actualizar manualmente sus integraciones antes del 4 de enero, y aquellos que deseen seguir utilizando los modelos antiguos ajustados más allá de esa fecha deberán hacer ajustes basados en los nuevos modelos base GPT-3.

«Brindaremos apoyo a los usuarios que hayan ajustado modelos anteriormente para que esta transición sea lo más fluida posible», escribió OpenAI. «En las próximas semanas, nos pondremos en contacto con los desarrolladores que hayan utilizado recientemente estos modelos antiguos y proporcionaremos más información una vez que los nuevos modelos de completado estén listos para las pruebas iniciales».

Con contenido de TechCrunch.