A startup de IA alemã, Aleph Alpha, apresenta novos modelos de linguagem. Além de um desempenho aprimorado, eles oferecem um ponto de venda único que os diferencia da concorrência.

A Aleph Alpha lançou uma nova geração de modelos de linguagem, chamados de modelos de Controle pela empresa. As versões Base, Extended e Supreme da família Luminous foram ajustadas para se especializarem em instruções de zero-shot, semelhante ao modelo text-davinci-002 da OpenAI.

O ajuste fino com conjuntos de dados de instruções e outros exemplos melhora o desempenho dos modelos, especialmente em casos de uso nos quais os usuários fornecem tarefas simples para os modelos sem muitos exemplos, como é o caso do ChatGPT.

Ao contrário da OpenAI, a Aleph Alpha não planeja utilizar aprendizado por reforço com feedback humano (RLHF), que é usado nos modelos GPT-3.5-turbo e GPT-4 disponíveis lá.

Os modelos de controle da Aleph Alpha trazem mais transparência

Em fevereiro, a empresa lançou uma versão de controle do Luminous-Supreme, que agora está sendo substituída por uma nova versão aprimorada. Em abril, a Aleph Alpha introduziu o recurso “Explicar” para o Luminous, que torna os resultados dos modelos de linguagem mais compreensíveis para os usuários.

A abordagem de Inteligência Artificial Explicável (XAI) é baseada no AtMan, um método XAI introduzido no início de 2023 por pesquisadores da Aleph Alpha, TU Darmstadt, Hessian.AI Research Center e do Centro Alemão de Pesquisa em Inteligência Artificial (DFKI).

Todos os modelos de controle agora incluem esse recurso: “Todos os modelos de controle são capazes de rastrear correlações nas informações e correção factual com base em fatos verificados, e mostram quais trechos de texto em uma fonte causaram ou contradizem a resposta gerada pelo sistema”, de acordo com um comunicado da Aleph Alpha.

O recurso "Explicar" exibe informações sobre os resultados do modelo de linguagem, como probabilidades e quais palavras na instrução foram cruciais para o resultado. | Imagem: Aleph Alpha
O recurso “Explicar” exibe informações sobre os resultados do modelo de linguagem, como probabilidades e quais palavras na instrução foram cruciais para o resultado. | Imagem: Aleph Alpha

O recurso “Explicar” oferece uma oportunidade única de transparência e rastreabilidade do conteúdo gerado por IA, afirmou a empresa, o que representa um passo importante em direção à esperada exigência regulatória de explicabilidade e rastreabilidade na futura lei de IA da UE. “Nossa explicabilidade não apenas fornece o contexto necessário para cada declaração factual feita pelos modelos, mas também torna o suporte crítico e complexo da IA verificável e rastreável. Isso é necessário para que pessoas em campos desafiadores, como direito, saúde e bancos, possam continuar tomando decisões responsáveis e compreensíveis”, afirmou o CEO Jonas Andrulis.

A Aleph Alpha continua trabalhando em seu maior modelo de IA até o momento

O lançamento dos modelos de controle pode tornar os modelos de linguagem mais atraentes para muitas empresas europeias, reduzindo as barreiras para o uso produtivo. “Nossos modelos de controle são capazes de fornecer respostas significativamente melhores – em avaliações com clientes-piloto, eles estavam em pé de igualdade com os melhores modelos do mercado”, disse Andrulis.

Enquanto isso, o trabalho continua no maior modelo de IA da startup até o momento. O Luminous-World espera atingir 300 bilhões de parâmetros e oferecer novas capacidades para aplicações altamente complexas e críticas. O modelo poderá competir com o GPT-4 e está atualmente na fase de treinamento e avaliação, de acordo com a empresa.

Com os modelos de controle, o Luminous-World e o centro de dados de IA comercial mais rápido da Europa, a Aleph Alpha parece estar bem posicionada para se estabelecer ainda mais no mercado de IA em rápida evolução. A concorrência pode surgir em breve dentro da Alemanha: a startup de IA Nyonic, sediada em Berlim, pretende desenvolver modelos de IA generativos para a Europa.