La startup alemana de IA, Aleph Alpha, presenta nuevos modelos de lenguaje. Además de un rendimiento mejorado, ofrecen un punto de venta único que los distingue de la competencia.
Aleph Alpha ha lanzado una nueva generación de modelos de lenguaje llamados «modelos de Control» de la empresa. Las versiones Base, Extended y Supreme de la familia Luminous se han ajustado para especializarse en instrucciones de «zero-shot», similar al modelo text-davinci-002 de OpenAI.
El ajuste fino con conjuntos de datos de instrucciones y otros ejemplos mejora el rendimiento de los modelos, especialmente en casos de uso donde los usuarios proporcionan tareas simples a los modelos sin muchos ejemplos, como es el caso de ChatGPT.
A diferencia de OpenAI, Aleph Alpha no tiene planes de utilizar el aprendizaje por refuerzo con retroalimentación humana (RLHF), que se utiliza en los modelos GPT-3.5-turbo y GPT-4 disponibles allí.
Los modelos de control de Aleph Alpha brindan mayor transparencia
En febrero, la empresa lanzó una versión de control del Luminous-Supreme, que ahora está siendo reemplazada por una nueva versión mejorada. En abril, Aleph Alpha introdujo la función «Explicar» para el Luminous, que hace que los resultados de los modelos de lenguaje sean más comprensibles para los usuarios.
El enfoque de Inteligencia Artificial Explicable (XAI) se basa en AtMan, un método XAI introducido a principios de 2023 por investigadores de Aleph Alpha, TU Darmstadt, Hessian.AI Research Center y el Centro Alemán de Investigación en Inteligencia Artificial (DFKI).
Todos los modelos de control ahora incluyen esta función: «Todos los modelos de control son capaces de rastrear correlaciones en la información y corrección factual basada en hechos verificados, y muestran qué fragmentos de texto en una fuente causaron o contradicen la respuesta generada por el sistema», según un comunicado de Aleph Alpha.
La función «Explicar» muestra información sobre los resultados del modelo de lenguaje, como probabilidades y qué palabras en la instrucción fueron cruciales para el resultado. | Imagen: Aleph Alpha
El recurso «Explicar» ofrece una oportunidad única de transparencia y trazabilidad del contenido generado por IA, afirmó la empresa, lo que representa un paso importante hacia el esperado requisito reglamentario de explicabilidad y trazabilidad en la futura ley de IA de la UE. «Nuestra explicabilidad no solo proporciona el contexto necesario para cada declaración factual realizada por los modelos, sino que también hace que el soporte crítico y complejo de la IA sea verificable y trazable. Esto es necesario para que las personas en campos desafiantes, como el derecho, la salud y la banca, puedan seguir tomando decisiones responsables y comprensibles», afirmó el CEO Jonas Andrulis.
Aleph Alpha continúa trabajando en su modelo de IA más grande hasta la fecha
El lanzamiento de los modelos de control puede hacer que los modelos de lenguaje sean más atractivos para muchas empresas europeas, reduciendo las barreras para su uso productivo. «Nuestros modelos de control son capaces de proporcionar respuestas significativamente mejores: en evaluaciones con clientes piloto, estuvieron a la par con los mejores modelos del mercado», dijo Andrulis.
Mientras tanto, el trabajo continúa en el modelo de IA más grande de la startup hasta ahora. Luminous-World tiene como objetivo alcanzar los 300 mil millones de parámetros y ofrecer nuevas capacidades para aplicaciones altamente complejas y críticas. El modelo podrá competir con el GPT-4 y actualmente se encuentra en la fase de entrenamiento y evaluación, según la empresa.
Con los modelos de control, Luminous-World y el centro de datos de IA comercial más rápido de Europa, Aleph Alpha parece estar bien posicionada para consolidarse aún más en el mercado de IA en rápida evolución. La competencia puede surgir pronto desde dentro de Alemania: la startup de IA Nyonic, con sede en Berlín, tiene la intención de desarrollar modelos de IA generativos para Europa.