El FinGPT es un marco de trabajo de IA diseñado para facilitar el acceso a modelos de lenguaje optimizados para tareas financieras. Es de código abierto y puede ser utilizado comercialmente.
Con el FinGPT, el equipo de investigación de la Universidad de Columbia y la Universidad de Nueva York (Shanghai) tiene como objetivo democratizar el acceso a modelos de lenguaje optimizados para los mercados financieros.
Según los investigadores, los modelos propietarios como el BloombergGPT se benefician del acceso a datos financieros exclusivos. Además, afirman que el BloombergGPT es muy costoso, estimado en cinco millones de dólares estadounidenses para el entrenamiento, y muy inflexible.
En cambio, el FinGPT utiliza modelos de lenguaje pre-entrenados y afinamiento mediante el método de adaptación eficiente de baja clasificación (LoRA, por sus siglas en inglés). Según el equipo, el método LoRA puede reducir el número de parámetros entrenables de 6,17 mil millones a solo 3,67 millones. Esto hace que el proceso de afinamiento sea más rápido y menos intensivo en términos computacionales, al tiempo que permite que el modelo comprenda y genere texto financiero de manera eficiente.
Enfoque en flujos de datos de alta calidad
Los investigadores argumentan que el éxito de un modelo de lenguaje financiero depende tanto de las capacidades del modelo de lenguaje como de la calidad de los datos. Ven al FinGPT como una respuesta directa al BloombergGPT y, por lo tanto, enfatizan fuertemente la calidad y preparación de los datos.
El equipo primero desarrolló un pipeline automatizado de datos financieros seleccionados y de alta calidad. Utilizan fuentes establecidas como Yahoo Finance y Bloomberg, así como contenido de plataformas como Twitter, Reddit y archivos de la SEC (Comisión de Valores y Bolsa de Estados Unidos). También extraen información de indicadores de tendencias como Google Trends y conjuntos de datos consolidados como AShare y Stocknet.
Las fuentes de datos del FinGPT
Según el equipo, estos datos pasan por un exhaustivo proceso de limpieza y formateo para garantizar su calidad y usabilidad.
A continuación, los datos son procesados con modelos de lenguaje utilizando el framework FinGPT. Dependiendo de la aplicación, se pueden utilizar LLMs (modelos de lenguaje de aprendizaje) de empresas reconocidas o modelos entrenables o ajustables pueden ser enriquecidos con datos personalizados. Debido a que el ajuste fino es más rápido que entrenar completamente un modelo, se dice que el FinGPT está más actualizado y dinámico que el BloombergGPT.
Retroalimentación humana automatizada a través de un bucle de retroalimentación
La puesta a punto de un modelo generalmente requiere una gran cantidad de datos etiquetados de alta calidad. Los datos etiquetados significan que los datos contienen información adicional de la cual el modelo puede aprender, como si una noticia es considerada buena o mala. Obtener este tipo de datos puede ser difícil y costoso, especialmente en áreas especializadas como las finanzas.
Descripción general del framework FinGPT junto con posibles aplicaciones. | Imagen: FinGPT
Es por eso que el equipo de FinGPT encontró una solución elegante: en lugar de etiquetar manualmente los datos, utilizan las reacciones del mercado de valores a las noticias como etiquetas. Por ejemplo, si el precio de las acciones sube después de una noticia, se puede clasificar como «positiva».
Los investigadores establecieron umbrales para los tres sentimientos: positivo, negativo y neutro. Al ajustar el modelo, se instruye a seleccionar uno de los tres sentimientos -positivo, negativo o neutro- como etiqueta para la noticia.
Siguiendo el enfoque RLHF (Reinforcement Learning with Human Feedback) de OpenAI, los investigadores llaman a su principio RLSP (Reinforcement Learning on Stock Prices), que se puede ver como una forma indirecta de retroalimentación humana. El sistema debe aprender de la «sabiduría del mercado» para comprender y predecir mejor los mercados financieros.
Un framework de código abierto para IA en el sector financiero
El equipo menciona posibles aplicaciones del framework FinGPT, como asesoramiento robótico, trading cuantitativo, optimización de carteras basada en diversos factores, análisis de sentimiento en los mercados financieros, gestión de riesgos, detección de fraudes, puntuación crediticia, predicción de insolvencia o posibles adquisiciones, análisis de perfiles ESG basado en informes públicos y noticias, desarrollo de bajo código y educación financiera.
Los investigadores ponen a disposición FinGPT como código abierto bajo la licencia MIT en Github. Se permite su uso comercial. Los desarrolladores no garantizan ni asumen responsabilidad por decisiones financieras basadas en el modelo. Con contenido de the decoder.