AnythingLLM simplifie l’accès à une nouvelle tendance : parler à ses propres données en utilisant un modèle GPT.
« Parler à vos documents est le ‘hello world’ des cas d’utilisation LLM, pourquoi ne pas le rendre plus accessible ? » demande Tim Carambat, développeur de AnythingLLM. La même idée est poursuivie par des projets tels que PrivateGPT ou GPT4All, mais contrairement à eux, Carambat renonce aux modèles linguistiques et aux bases de données vectorielles hébergés localement en faveur d’une interface de discussion conviviale, d’une collecte de données simple et d’une intégration avec des services tels que GPT-3.5-turbo, GPT-4 ou Pinecone d’OpenAI. Toutefois, si vous le souhaitez, vous pouvez toujours les remplacer par des instances locales.
AnythingLLM est une suite complète d’applications et d’outils qui peuvent transformer n’importe quel document, ressource ou contenu en données pouvant être utilisées par les modèles de langage comme référence au cours d’une conversation. Par exemple, des transcriptions de chaînes YouTube entières, des ouvrages de référence ou des documents commerciaux peuvent être interrogés. En utilisant des modèles et des bases de données externes, AnythingLLM reste une application qui peut fonctionner en arrière-plan et ne nécessite pas une grande puissance de traitement.
AnythingLLM est livré avec des outils de collecte de données et une interface de chat
AnythingLLM vous permet de collecter des données à partir de sources prédéfinies ou d’ajouter les vôtres, offre un cache pour les documents traités afin d’économiser des coûts, et a la capacité de mettre en place plusieurs environnements de travail qui peuvent partager des documents prédéfinis. Cela permet aux équipes de collaborer tout en gardant certains contenus visibles uniquement par certains membres.
AnythingLLM propose actuellement des outils de collecte de données pour YouTube, Substack, Medium et Gitbooks. Les URL et les documents locaux peuvent également être vectorisés. Le système fournit également la source de la réponse, telle qu’une URL.
AnythingLLM est open source
Outre Pinecone, Carambat prévoit de prendre en charge d’autres bases de données vectorielles et modèles de langage en plus des produits d’OpenAI. Récemment, la prise en charge de Chroma a été ajoutée. D’autres intégrations avec Google Drive ou les dépôts Github sont également prévues.
Pour utiliser AnythingLLM, vous avez besoin de :
- Python 3.8 (pour la collecte des données)
- Node 16 (pour le serveur local)
- yarn/npm
- Clé API OpenAI (pour l’intégration et la conversation)
- Clé API Pinecone DB ou une instance ChromaDB fonctionnant localement (pour le stockage des vecteurs).
AnythingLLM est open source et disponible sur GitHub.