Após críticas pelo desempenho aquém do esperado de seus produtos de IA – especialmente em relação aos resumos de notificações (leia mais) –, a Apple detalhou na segunda-feira como pretende aprimorar seus modelos de inteligência artificial por meio da análise privada dos dados dos usuários, utilizando dados sintéticos.
Utilizando uma abordagem chamada privacidade diferencial, a empresa afirmou que primeiro gerará dados sintéticos e, em seguida, sondará os dispositivos dos usuários (desde que estes tenham optado por compartilhar análises do dispositivo com a Apple) com trechos desses dados. O objetivo é comparar a precisão dos modelos atuais e, a partir daí, aperfeiçoá-los.
“Dados sintéticos são criados para imitar o formato e as propriedades importantes dos dados dos usuários, mas não contêm nenhum conteúdo gerado por eles”, explicou a empresa em um post em seu blog. “Para compor um conjunto representativo de e-mails sintéticos, começamos criando um grande número de mensagens sobre uma variedade de tópicos. Em seguida, derivamos uma representação – chamada embedding – de cada mensagem, que capta dimensões-chave como idioma, tópico e comprimento.”
Esses embeddings são enviados para um pequeno número de dispositivos de usuários que optaram por compartilhar as análises do dispositivo. Cada dispositivo compara os embeddings com uma amostra local de e-mails para indicar à Apple quais deles apresentam maior precisão.
A estratégia está sendo aplicada inicialmente para aprimorar os modelos Genmoji da empresa. No futuro, dados sintéticos deverão ser empregados em outros projetos, como Image Playground, Image Wand, Memories Creation, Writing Tools e Visual Intelligence. A Apple também planeja utilizar dados sintéticos, coletados através das análises de dispositivos, para melhorar os resumos de e-mails.