O DALL-E 3, a versão mais recente da inovadora plataforma de arte visual de IA generativa da OpenAI, acaba de ser anunciado com recursos inovadores, incluindo a integração com o ChatGPT. Embora o anúncio seja bastante assertivo, decidimos colocá-lo em um ringue para ver como ele será o desempenho.
Prepare-se para embarcar em uma jornada emocionante pelos reinos ilimitados da criatividade alimentada por IA enquanto colocamos dois maestros digitais um contra o outro em um confronto eletrizante! Em um canto, temos o icônico Midjourney, nome que virou sinônimo de imaginação visual alucinante. No outro canto, um novo desafiante com potencial para redefinir o cenário artístico da IA – DALLE-3! Aperte o cinto, porque este choque de titãs da IA está prestes a levá-lo em uma montanha-russa pelo futuro da criatividade!
O DALL-E 3, a versão mais recente da inovadora plataforma de arte visual de IA generativa da OpenAI, acaba de ser anunciado com recursos inovadores, incluindo a integração com o ChatGPT. Embora o anúncio seja bastante assertivo, decidimos colocá-lo em um ringue para ver como ele será o desempenho.
Prepare-se para embarcar em uma jornada emocionante pelos reinos ilimitados da criatividade alimentada por IA enquanto colocamos dois maestros digitais um contra o outro em um confronto eletrizante! Em um canto, temos o icônico Midjourney, nome que virou sinônimo de imaginação visual alucinante. No outro canto, um novo desafiante com potencial para redefinir o cenário artístico da IA – DALLE-3! Aperte o cinto, porque este choque de titãs da IA está prestes a levá-lo em uma montanha-russa pelo futuro da criatividade!


Temos que mencionar primeiro, como você pode ver, escrever não é o lado forte de Midjourney. Por conta disso, ferramentas de IA como o Ideograma que são capazes de gerar imagens com a escrita são populares hoje em dia.
A imagem DALL-E 3 é muito pacífica e serena, e evoca uma sensação de conexão com o universo. Além disso, a imagem do meio da jornada é mais extravagante e brincalhona. No entanto, temos aí um erro de escrita. Apesar de suas diferenças, ambas as imagens são visualmente atraentes e instigantes. Ambos nos convidam a refletir sobre nosso lugar no mundo e nossa conexão com algo maior do que nós mesmos.
- A decisão: DALL-E 3 vence esta rodada com sua geração impecável.
Rodada 2: Qual é o melhor lugar para assistir ao pôr do sol?
- Prompt: “Um edifício arquitetônico moderno com grandes janelas de vidro, situado em um penhasco com vista para um oceano sereno ao pôr do sol.”


Apesar de suas diferenças, ambas as imagens são belas e evocativas. Ambos capturam a essência de viver em estreita proximidade com a natureza. Embora tenhamos uma visão clara do pôr do sol no DALLE-3, temos que admitir que a “vibração do pôr do sol” de Midjourney vale a pena mencionar.
- A decisão: Midjourney vence.
Rodada 3: Salve os reis da batata!
- Rápido: “Pequenos reis de batata vestindo coroas majestosas, sentados em tronos, supervisionando seu vasto reino de batata cheio de súditos de batata e castelos de batata.”


Ambas as gerações falharam no mesmo tema. De acordo com o prompt, precisamos ter vários tronos. Mas, na geração DALL-E 3, não há trono, enquanto na imagem de Midjourney temos pelo menos um.
- A decisão: Embora as batatas DALL-E 3 sejam muito mais parecidas com batatas, podemos ver pelo menos tudo o que é mencionado na imagem do Midjourney. Então, Midjourney vence.
Rodada 4: A dama da porcelana
- Uma mulher de meia-idade de ascendência asiática, com seus cabelos escuros riscados de prata, aparece fraturada e estilhaçada, intrinsecamente embutida em um mar de porcelana quebrada. A porcelana brilha com padrões de tinta splatter em uma mistura harmoniosa de azuis brilhantes e foscos, verdes, laranjas e vermelhos, capturando sua dança em uma justaposição surreal de movimento e quietude. Seu tom de pele, um tom claro como a porcelana, adiciona uma qualidade quase mística à sua forma.”


O realismo da geração Midjourney está no nível máximo em que amamos! No entanto, não podemos dizer que há “um mar de porcelana quebrada” nessa imagem. Enquanto na geração DALL-E 3, entendemos claramente o toque de porcelana.
- A decisão: DALL-E 3 vence.
Rodada 5: Vamos dançar!
- Prompt: “Uma animação 2D de uma banda de música folclórica composta por folhas antropomórficas de outono, cada uma tocando instrumentos tradicionais de bluegrass, em meio a um cenário de floresta rústica coberto pela luz suave de uma lua de colheita.”


Temos aí um vencedor claro. Embora a geração de Midjourney seja bem apresentada, não há folhas de outono para fazer música.
- A decisão: DALL-E 3 vence.
Rodada 6: A cadeira
- Prompt: “Foto de uma cadeira esférica inspirada em lichia, com um exterior branco esburacado e interior luxuoso, contra um papel de parede tropical.”


Sim, você provavelmente escolheria Midjourney se quiser defini-lo como papel de parede. No entanto, nessa comparação, a precisão imediata é importante.
- A decisão: DALL-E 3 vence.
Round 7: O desejo do dançarino
- Diante de um fundo negro profundo, uma figura da meia-idade, sua pele tonganesa rica e brilhante, é capturada no meio do giro, seus cabelos cacheados fluindo como uma tempestade atrás dela. Seu traje lembra um turbilhão de fragmentos de mármore e porcelana. Iluminada pelo brilho de cacos de porcelana espalhados, criando uma atmosfera onírica, a dançarina consegue parecer fragmentada, mas mantém uma forma harmoniosa e fluida.”


DALL-E 3 quase foi nocauteado apesar de seu esforço admirável! Na imagem do meio da jornada, podemos ver todos os detalhes, mas melhor.
- A decisão: Vence no meio da jornada.
Rodada 8: Vamos à praia e encontrar o eremita “certo”
- Aviso: “Fotografia em close-up de um caranguejo eremita aninhado na areia molhada, com espuma do mar por perto e os detalhes de sua concha e textura da areia acentuada.”


No final, temos que fazer uma ligação próxima. Ambas as imagens são bem representadas e paralelas ao prompt. Para decidir de forma justa, temos que admitir que pesquisamos no Google o caranguejo eremita, e parece que a biologia do DALL-E 3 é melhor do que a Midjourney. A imagem DALL-E 3 tem uma aparência mais semelhante ao eremita real.
- A decisão: DALL-E 3 vence.
DALL-E 3: 5, Jornada Média: 3
Então, temos um vencedor! Embora todas as gerações Midjourney fossem bem representadas e visualmente ricas, as gerações DALL-E 3 eram mais precisas para o prompt. Por isso, DALL-E 3 merece a vitória.
No entanto, temos que mencionar que essas gerações DALL-E 3 estão especialmente preparadas para o anúncio, e provavelmente são a melhor versão de si mesmas. Enquanto gerávamos imagens do Midjourney, pegamos as primeiras versões, para ser justo. Então, para uma decisão final, precisamos esperar o lançamento final do DALL-E 3 e testá-lo novamente!