Uma equipe de ex-Googlers está se posicionando como concorrente do Midjourney com um novo sistema de conversão de texto em imagem.
A Ideogram AI está fazendo o que o Google não está: transformando a pesquisa de IA generativa de alta qualidade da gigante das buscas em um produto. A Ideogram AI levantou US$ 16,5 milhões em financiamento semente, incluindo da a16z e da Indexventures.
A equipe do Ideogram inclui ex-alunos do Google Brain, UC Berkeley, Carnegie Mellon University e da Universidade de Toronto. Eles trabalharam em projetos como o AI Imagen e o Imagen Video do Google, além de muitas outras tecnologias de IA.
Ideograma v0.1 entra em fase beta
Com o “Ideogram v0.1”, o Ideogram AI agora apresenta a primeira versão beta de um software de texto para imagem que roda diretamente no navegador, em contraste com o Midjourney, que usa o software de bate-papo Discord como interface.
A comunidade do Ideograma já gerou muitas imagens que podem ser visualizadas na plataforma, incluindo prompts. Como Midjourney, IdeogramAI suporta muitos estilos, de fotorrealista a fantasticamente abstrato.
Motivos políticos (veja Putin abaixo à esquerda) são aparentemente (ainda) possíveis. | Imagem: Captura de tela Ideogram.ai
À primeira vista, a plataforma parece estar pelo menos no mesmo nível da Midjourney em termos de variedade, precisão e nível de detalhes. Sua força também está na geração de fontes, uma capacidade que o Google demonstrou em seus protótipos de texto para imagem e que os sistemas existentes de texto para imagem em grande parte não têm.
Elon Musk tem um problema com um pássaro azul. Ou o pássaro com Elon Musk?| Imagem: Ideograma, captura de tela “Firerock31”.
Também é interessante que o Ideogram AI trate a plataforma web diretamente como uma rede social com perfis e identificadores. Assim, é possível pegar a geração, imagem e aviso de outra pessoa e criar uma nova imagem a partir dela. Isso poderia simplificar ainda mais a criação de imagens.
Na comunidade Ideograma, você pode pegar imagens e prompts de outros usuários e remixá-los. | Imagem: Captura de tela Ideogram.ai
Detalhes sobre a tecnologia utilizada e o modelo de precificação ainda não são conhecidos. Os usuários interessados podem se inscrever em uma lista de espera, mas precisarão de um login do Google. Você também pode encontrar mais imagens no Twitter pesquisando pela hashtag #ideogram.
Google e sistemas de IA generativa comercial – é complicado
Em maio de 2022, o Google apresentou o Imagen, um sistema de conversão de texto em imagem capaz de superar significativamente o DALL-E 2 da OpenAI. Ele foi seguido por Parti, Re-Imagen e Muse, que poderiam gerar imagens ainda mais detalhadas, melhores e mais rápidas que combinavam muito com os prompts.
Uma característica especial: a capacidade de renderizar texto com precisão, onde todos os sistemas de IA de texto para imagem existentes falham. Os sistemas do Google podem pegar com precisão o texto dos prompts e colocá-lo como fonte na imagem. O modelo Ideograma também mostra essa capacidade.
No entanto, o Google ainda não conseguiu transformar um de seus projetos de pesquisa text-to-X em um produto comercial comparável ao Midjourney ou DALL-E. Há um teste beta provisório com o Imagen nos EUA, mas é isso até agora.
Presumivelmente, o negócio é muito pequeno para a gigante das buscas e é mais provável que a tecnologia seja integrada a softwares existentes, como o processamento de imagens do Android. Como Midjourney, o Ideograma poderia se posicionar com sucesso no nicho da criação de imagens.