O FinGPT é um framework de IA projetado para facilitar o acesso a modelos de linguagem otimizados para tarefas financeiras. É de código aberto e pode ser usado comercialmente.

Com o FinGPT, a equipe de pesquisa da Universidade de Columbia e da Universidade de Nova York (Xangai) tem como objetivo democratizar o acesso a modelos de linguagem otimizados para os mercados financeiros.

Modelos proprietários, como o BloombergGPT, se beneficiariam do acesso a dados financeiros exclusivos, afirmam os pesquisadores. Além disso, eles afirmam que o BloombergGPT é muito caro, estimado em cinco milhões de dólares americanos para treinamento, e muito inflexível.

Em vez disso, o FinGPT utiliza modelos de linguagem pré-treinados e ajuste fino usando o método de adaptação eficiente de baixa classificação (LoRA). De acordo com a equipe, o método LoRA pode reduzir o número de parâmetros treináveis de 6,17 bilhões para apenas 3,67 milhões. Isso torna o processo de ajuste fino muito mais rápido e menos intensivo em termos computacionais, ao mesmo tempo em que permite que o modelo entenda e produza texto financeiro de maneira eficiente.

Foco em fluxos de dados de alta qualidade

Os pesquisadores argumentam que o sucesso de um modelo de linguagem financeira depende tanto das capacidades do modelo de linguagem quanto da qualidade dos dados. Eles veem o FinGPT como uma resposta direta ao BloombergGPT e, portanto, enfatizam fortemente a qualidade e preparação dos dados.

A equipe primeiro desenvolveu um pipeline automatizado de dados financeiros selecionados e de alta qualidade. Eles utilizam fontes estabelecidas, como Yahoo Finance e Bloomberg, assim como conteúdo de plataformas como Twitter, Reddit e arquivos da SEC (Comissão de Valores Mobiliários dos Estados Unidos). Eles também extraem informações de indicadores de tendência, como Google Trends, e de conjuntos de dados consolidados, como AShare e Stocknet.

As fontes de dados do FinGPT
As fontes de dados do FinGPT

De acordo com a equipe, esses dados passam por um processo abrangente de limpeza e formatação para garantir sua qualidade e usabilidade.

Os dados são então processados com modelos de linguagem usando o framework FinGPT. Dependendo da aplicação, podem ser utilizados LLMs (modelos de linguagem de aprendizado) de empresas conhecidas ou modelos treináveis ou ajustáveis podem ser enriquecidos com dados personalizados. Como o ajuste fino é mais rápido do que treinar completamente um modelo, diz-se que o FinGPT está mais atualizado e dinâmico do que o BloombergGPT.

Feedback humano automatizado por meio de um desvio

O ajuste fino de um modelo geralmente requer uma grande quantidade de dados rotulados de alta qualidade. Dados rotulados significam que os dados contêm informações adicionais das quais o modelo pode aprender, como se uma notícia é considerada boa ou ruim. Obter tais dados pode ser difícil e caro, especialmente em áreas especializadas como finanças.

Visão geral do framework FinGPT juntamente com possíveis aplicações. | Imagem: FinGPT
Visão geral do framework FinGPT juntamente com possíveis aplicações. | Imagem: FinGPT

Foi por isso que a equipe do FinGPT encontrou uma solução elegante: em vez de rotular manualmente os dados, eles utilizam as reações do mercado de ações às notícias como rótulos. Por exemplo, se o preço das ações sobe após uma notícia, ela pode ser classificada como “positiva”.

Os pesquisadores estabeleceram limiares para os três sentimentos: positivo, negativo e neutro. Ao ajustar o modelo, ele é instruído a selecionar um dos três sentimentos – positivo, negativo ou neutro – como rótulo para a notícia.

Seguindo a abordagem RLHF (Reinforcement Learning with Human Feedback) da OpenAI, os pesquisadores chamam seu princípio de RLSP (Reinforcement Learning on Stock Prices), que pode ser visto como uma forma indireta de feedback humano. O sistema deve aprender com a “sabedoria do mercado” para compreender e prever melhor os mercados financeiros.

Um framework de código aberto para IA no setor financeiro

A equipe cita aplicações potenciais do framework FinGPT, tais como roboconselhos, negociação quantitativa, otimização de carteiras com base em diversos fatores, análise de sentimentos nos mercados financeiros, gestão de riscos, detecção de fraudes, pontuação de crédito, previsão de insolvência ou possíveis aquisições, análise de perfis ESG com base em relatórios públicos e notícias, desenvolvimento de baixo código e educação financeira.

Os pesquisadores disponibilizam o FinGPT como código aberto sob a licença MIT no Github. O uso comercial é permitido. Os desenvolvedores não garantem nem assumem responsabilidade por decisões financeiras baseadas no modelo. Com conteúdo do the decoder.