AnythingLLM simplifica el acceso a una nueva tendencia: conversar con tus propios datos utilizando un modelo GPT.

«Conversar con tus documentos es el ‘Hola Mundo' de los casos de uso de LLM, ¿por qué no hacerlo más accesible?», pregunta Tim Carambat, desarrollador de AnythingLLM. La misma idea está siendo perseguida por proyectos como PrivateGPT o GPT4All, pero a diferencia de ellos, Carambat evita modelos de lenguaje alojados localmente y bases de datos vectoriales a favor de una interfaz de chat fácil de usar, una recolección de datos sencilla y la integración con servicios como GPT-3.5-turbo, GPT-4 o Pinecone de OpenAI. Sin embargo, si lo deseas, aún puedes reemplazarlos con instancias locales.

AnythingLLM es un conjunto completo de aplicaciones y herramientas que pueden convertir cualquier documento, recurso o contenido en datos que pueden ser utilizados como referencia por modelos de lenguaje durante una conversación. Por ejemplo, se pueden consultar transcripciones de canales completos de YouTube, libros de referencia o documentos empresariales. Al utilizar modelos y bases de datos externos, AnythingLLM sigue siendo una aplicación que se puede ejecutar en segundo plano y no requiere una gran capacidad de procesamiento.

AnythingLLM viene con herramientas de recolección de datos y una interfaz de chat

AnythingLLM te permite recolectar datos de fuentes predefinidas o agregar las tuyas propias, ofrece un caché para los documentos procesados para ahorrar costos y tiene la capacidad de configurar varios entornos de trabajo que pueden compartir documentos predefinidos. Esto permite que los equipos colaboren y aún mantengan ciertos contenidos visibles solo para ciertos miembros.

Atualmente, AnythingLLM ofrece herramientas de recolección de datos para YouTube, Substack, Medium y Gitbooks. También es posible vectorizar URL y documentos locales. El sistema también proporciona la fuente de la respuesta, como una URL.

AnythingLLM es de código abierto Además de Pinecone, Carambat tiene planes de admitir otras bases de datos vectoriales y modelos de lenguaje, además de los productos de OpenAI. Recientemente, se agregó soporte para Chroma. También se están planeando integraciones adicionales con Google Drive o repositorios de GitHub.

Para utilizar AnythingLLM, necesitas:

  • Python 3.8+ (para la recolección de datos)
  • Node 16+ (para el servidor local)
  • yarn/npm
  • Clave de API de OpenAI (para incrustación y conversación)
  • Clave de API de Pinecone DB o una instancia de ChromaDB en ejecución localmente (para almacenamiento de vectores).

El AnythingLLM es de código abierto y está disponible en GitHub.