La start-up allemande en intelligence artificielle, Aleph Alpha, présente de nouveaux modèles de langage. En plus d’une performance améliorée, ils offrent un argument unique qui les différencie de la concurrence.
Aleph Alpha a lancé une nouvelle génération de modèles de langage, appelée « modèles de Contrôle » par l’entreprise. Les versions Base, Extended et Supreme de la famille Luminous ont été ajustées pour se spécialiser dans les instructions « zero-shot », similaire au modèle text-davinci-002 de OpenAI.
Le réglage fin avec des ensembles de données d’instructions et d’autres exemples améliore les performances des modèles, en particulier dans les cas d’utilisation où les utilisateurs fournissent des tâches simples aux modèles sans beaucoup d’exemples, comme c’est le cas avec ChatGPT.
Contrairement à OpenAI, Aleph Alpha n’a pas l’intention d’utiliser l’apprentissage par renforcement avec feedback humain (RLHF), qui est utilisé dans les modèles GPT-3.5-turbo et GPT-4 disponibles là-bas.
Les modèles de contrôle d’Aleph Alpha apportent plus de transparence
En février, l’entreprise a lancé une version de contrôle du Luminous-Supreme, qui est maintenant remplacée par une nouvelle version améliorée. En avril, Aleph Alpha a introduit la fonctionnalité « Explicar » pour Luminous, qui rend les résultats des modèles de langage plus compréhensibles pour les utilisateurs.
L’approche d’Intelligence Artificielle Explicable (XAI) est basée sur AtMan, une méthode XAI introduite au début de 2023 par des chercheurs d’Aleph Alpha, TU Darmstadt, Hessian.AI Research Center et du Centre allemand de recherche en intelligence artificielle (DFKI).
Tous les modèles de contrôle incluent désormais cette fonctionnalité : « Tous les modèles de contrôle sont capables de suivre les corrélations dans les informations et de corriger les faits vérifiés, et montrent quels extraits de texte dans une source ont causé ou contredisent la réponse générée par le système », selon un communiqué d’Aleph Alpha.
La fonctionnalité « Explicar » offre une opportunité unique de transparence et de traçabilité du contenu généré par l’IA, a déclaré l’entreprise, ce qui représente une étape importante vers l’exigence réglementaire attendue en matière d’explicabilité et de traçabilité dans la future loi sur l’IA de l’UE. « Notre explicabilité ne fournit pas seulement le contexte nécessaire pour chaque déclaration factuelle faite par les modèles, mais rend également le soutien critique et complexe de l’IA vérifiable et traçable. Cela est nécessaire pour que les personnes dans des domaines exigeants tels que le droit, la santé et les banques puissent continuer à prendre des décisions responsables et compréhensibles », a déclaré le PDG Jonas Andrulis.
Aleph Alpha continue de travailler sur son plus grand modèle d’IA à ce jour
Le lancement des modèles de contrôle peut rendre les modèles de langage plus attrayants pour de nombreuses entreprises européennes, en réduisant les barrières à l’utilisation productive. « Nos modèles de contrôle sont capables de fournir des réponses nettement meilleures – dans les évaluations avec des clients pilotes, ils étaient au même niveau que les meilleurs modèles du marché », a déclaré Andrulis.
Pendant ce temps, le travail se poursuit sur le plus grand modèle d’IA de la startup à ce jour. Luminous-World vise à atteindre 300 milliards de paramètres et à offrir de nouvelles capacités pour des applications hautement complexes et critiques. Le modèle pourra rivaliser avec GPT-4 et est actuellement en phase d’entraînement et d’évaluation, selon l’entreprise.
Avec les modèles de contrôle, Luminous-World et le centre de données d’IA commerciale le plus rapide en Europe, Aleph Alpha semble être bien positionnée pour se développer davantage sur le marché de l’IA en évolution rapide. La concurrence pourrait bientôt émerger en Allemagne : la startup d’IA Nyonic, basée à Berlin, prévoit de développer des modèles d’IA génératifs pour l’Europe.