IA transforma passeios turísticos para pessoas com deficiência visual
Uma inovadora tecnologia de inteligência artificial está revolucionando a experiência de pessoas com deficiência visual, proporcionando-lhes ferramentas para descobrir, compreender e vivenciar a beleza de lugares desconhecidos como nunca antes.
Contexto
Explorar ambientes naturais, como parques, exerce um impacto positivo significativo na saúde física e mental. Contudo, indivíduos com baixa visão ou cegueira muitas vezes são privados desses benefícios, pois os recursos assistivos adequados para promover uma participação ativa nesses ambientes não estão disponíveis. As soluções já existentes geralmente se concentram em oferecer ajuda funcional – como navegação e detecção de obstáculos – permitindo uma relação predominantemente passiva com a natureza.
Sentindo-se desamparados ao explorar lugares desconhecidos, essas pessoas acabam dependendo de familiares, amigos ou voluntários para obter auxílio. Essa dependência limita sua capacidade de explorar, compreender e registrar ativamente suas experiências, além de dificultar a troca de informações com outros indivíduos que enfrentam a mesma realidade.
Em resposta a esses desafios, uma equipe de pesquisadores chineses desenvolveu um sistema movido por inteligência artificial, denominado VIPTour, que busca conferir maior independência a usuários com deficiência visual em ambientes desconhecidos.
Como o VIPTour funciona?
O sistema VIPTour é composto por dispositivos portáteis e de consumo – como uma câmera e um smartphone – aliados a um inovador algoritmo de deep learning chamado FocusFormer. Técnicas de interação multisensorial, que combinam elementos de áudio e de estímulos táteis hierarquizados, possibilitam a comunicação e o engajamento dos usuários com o sistema.
O FocusFormer prioriza aspectos como estética, novidade e necessidades básicas (incluindo navegação e segurança) para extrair informações relevantes de ambientes complexos, eliminando detalhes visuais redundantes e, assim, reduzindo a carga cognitiva dos usuários com deficiência visual. Essa abordagem transforma grandes volumes de dados em um gráfico personalizado, estruturado e hierárquico, que facilita a interação por meio de um aplicativo para smartphone. Além disso, o sistema aprende com as preferências do usuário e adapta a assistência oferecida por meio de um adaptador integrado.
Treinado com milhares de vídeos públicos de turismo produzidos por pessoas sem deficiência visual, o treinamento auto-supervisionado do FocusFormer contribui para a redução de vieses estéticos e aprimora a extração de informações contextuais relevantes.
Adicionalmente, o VIPTour possibilita o registro, armazenamento e compartilhamento de experiências, promovendo a comunicação emocional entre usuários e o intercâmbio de conhecimentos dentro de suas redes de apoio.
A inovação técnica central do VIPTour reside na rede multi-atencional FocusFormer, que integra diferentes sub-redes – uma para filtrar objetos comuns, outra para identificar pontos de destaque, uma terceira para detectar elementos inéditos e uma quarta que incorpora as necessidades identificadas em pesquisas com participantes com deficiência visual. Essa combinação permite selecionar, ranquear e apresentar as informações mais relevantes para cada usuário. O sistema também conta com um adaptador dinâmico (“BLV-in-the-Loop Adapter”) que atualiza suas recomendações em tempo real, com base em feedbacks individuais, como “gostos” e “desgostos”, possibilitando uma personalização eficaz.
Opinião dos usuários sobre o VIPTour
Testado com 33 indivíduos com deficiência visual ou baixa visão, o VIPTour demonstrou um desempenho significativo ao permitir uma exploração ativa e um entendimento aprofundado de ambientes desconhecidos. Os relatos dos participantes indicaram um aumento de 67,9% na resposta emocional positiva, 94,7% na excitação, 772,73% na precisão do mapeamento cognitivo e 200% na acurácia da memória de longo prazo.
Além disso, as avaliações dos usuários atribuíram ao sistema pontuações de usabilidade superiores a 80 em 100, níveis que competem ou superam os apresentados por outras ferramentas assistivas. Medidas fisiológicas – como atividade eletrodérmica e variabilidade da frequência cardíaca – também apontaram melhorias significativas na interação emocional dos usuários com o sistema.
Significado do estudo
O estudo destaca o potencial do sistema VIPTour para proporcionar experiências ricas e memoráveis a pessoas com deficiência visual, ampliando sua autonomia ao explorar ambientes desconhecidos. A apresentação organizada e envolvente das informações pode aumentar o prazer e favorecer a retenção de memórias, uma vez que a clareza e a estrutura dos dados reduzem o esforço cognitivo necessário para processá-los.
Esse fenômeno pode ser explicado pelo conceito de fluência cognitiva, que sugere que informações apresentadas de forma clara e estruturada não só tornam a experiência mais agradável, mas também permitem que os indivíduos direcionem seus recursos mentais para uma compreensão mais profunda do conteúdo. Assim, a combinação equilibrada entre novidade e familiaridade mantém o interesse e a atenção dos usuários.
O treinamento auto-supervisionado do FocusFormer com milhares de vídeos públicos de turismo demonstrou ser eficaz ao captar relações estatísticas entre diversos elementos de cenários turísticos, eliminando vieses e configurando um modelo capaz de extrair apenas informações contextuais relevantes. Essas características personalizadas melhoraram significativamente a experiência turística para pessoas com deficiência visual.
Vale ressaltar que o impacto do VIPTour depende da qualidade das técnicas de IA utilizadas, como detecção de objetos e geração de gráficos semânticos. Aperfeiçoamentos futuros nesses métodos podem ainda aprimorar o desempenho do sistema.