Como a inteligência artificial pode ajudar os designers?

Olá pessoas, tudo bem? Espero sinceramente que sim!

O designer desempenha um papel fundamental para o entendimento de como os usuários percebem um produto, mas nem todas as empresas têm o orçamento para contratar um designer para cada projeto. Esses fator limitador pode estar com os dias contados graças à tecnologia texto-imagem, um novo tipo de machine learning que pode criar imagens originais através de simples solicitações de texto (prompts). Bons exemplos são o Dall-E, da OpenAI e o Midjourney.

A OpenAI é pioneira na tecnologia com seu programa Dall-E 2, lançado em abril de 2022 ainda em versão Beta (fechada). O programa recebe enormes quantidades de imagens com descrições diversas para que sejam identificados objetos (pense em “gato”, por exemplo) e as relações entre objetos. Quando você insere um prompt, ele usa os dados para criar uma imagem que melhor atenda o pedido. O modelo pode até identificar e replicar diferentes estilos (pense em um “gato vestido como o Elvis Presley”. Veja o resultado na foto abaixo gerada no Midjourney).

 

Gato vestido como o Elvis Presley gerado no Midjourney

 

O interesse pela criação de imagens através de texto tornou-se viral em junho, depois que a Craiyon, uma versão menos avançada do modelo OpenAI (anteriormente chamado Dall-E Mini), explodiu nas mídias sociais, com milhares de pessoas postando suas criações online. Imagens como um nugget de frango fumando um cigarro na chuva ou Darth Vader competindo em um programa de culinária, foram amplamente compartilhadas à medida que as pessoas criavam as mais absurdas imagens (a criatividade das pessoas pode ser surpreendente!).

 

Uma “diversão” com potencial

A princípio tudo pode parecer uma brincadeira, mas e quanto às potenciais aplicações comerciais? Um porta-voz da OpenAI disse a Inc. que os pesquisadores por trás da Dall-E ainda estão descobrindo como as pessoas querem usá-lo, mas que eles vêem o programa como sendo “uma ferramenta criativa útil para artistas, arquitetos, designers de produtos e designers gráficos”.

Outro uso potencial para a tecnologia oferecida pelo OpenAI seria para os jogos e experiências interativas, como o Metaverso. De acordo com o porta-voz da empresa, a tecnologia texto-imagem poderia ser usada por designers e desenvolvedores de jogos como uma ferramenta para “inspirar projetos para avatares ou experiências de AR“.

 

Prompt da imagem: Por do sol de outono

 

De que forma a tecnologia texto-imagem pode auxiliar os designers?

O objetivo da tecnologia texto-imagem não é substituir artistas e designers, mas sim ajudá-los em seus trabalhos, ao mesmo tempo em que lhes dá a capacidade de criar imagens originais para qualquer pessoa usando a criatividade. Em uma publicação de junho de 2022, o engenheiro de software do Google Yonghui Wu e o cientista pesquisador David Fleet escreveram que os modelos texto-imagem do Google, conhecidos como Imagen e Parti, “trarão experiências de usuário baseadas nestes modelos para o mundo, de uma forma segura e responsável, que inspirará criatividade”.

Para auxiliar os designers, o Dall-E 2 tem uma função chamada Inpainting, que permite aos usuários destacar parte de uma imagem que eles gostariam de mudar. Um designer poderia usar a ferramenta para remover algum item da imagem/protótipo de acordo com o pedido do cliente, por exemplo (Clique para ver um vídeo explicativo)

 

tela do dall-e 2 na função Inpainting
Dall-E 2 Inpainting: Clique e assista um vídeo explicativo para ver como funciona a feature

 

A Adobe também parece estar de olho nessa tecnologia, pois entre as opções beta no menu de Filtros no Photoshop (Filter > Neutral Filters > Wait List), há aqueles que podem ser votados pela comunidade e eis que surge a opção Latent Visions, que terá como função criar imagens através de texto.

Se eu estou interessada, Adobe? Imagina… 😛

 

 

A tecnologia texto-imagem e seus riscos

Um dos principais riscos das imagens geradas por inteligência artificial é que elas podem ser facilmente usadas para fomentar a desinformação ou para criar imagens falsas (deepfake). Criar soluções para verificar se uma imagem é legítima ou “falsa” será muito importante para o sucesso da tecnologia.

A empresa é rápida em apontar que a tecnologia texto-imagem ainda não é perfeita no que diz respeito ao design. O Dall-E 2 tem limitações para identificar certas imagens e rostos de pessoas, e a tecnologia ainda tem muito pouca capacidade para evitar criação de imagens violentas ou impróprias.

No entanto, para aqueles com muita imaginação, a tecnologia poderá servir tanto como fonte de inspiração quanto como solução prática para algumas tarefas diárias.

 

Quer saber mais e “brincar” um pouco?

Seguem alguns links para acessar, testar e conhecer. Use a criatividade explore o que a ferramenta pode oferecer e cuidado: isso é viciante! 😛

Dall-E 2: openai.com

Dall-E Mini: craiyon.com

Midjourney (Acesso pelo Discord): midjourney.com

Imagen (Google): imagen.research.google

Parti (Google): parti.research.google

Vídeo recomendado:
Como a AI está mudando o design, do Daniel Furtado (Canal UXNOW)

 

Mesmo ainda com muito a melhorar, creio que essa tecnologia logo fará parte do mundo criativo. Imagina um plugin para o Figma onde poderemos criar wireframes em poucos minutos ou então usar a tecnologia para ajudar a ter uma ideia de logotipo… Só nos resta aguardar e acompanhar a evolução da tecnologia.

Beijo grande e até o próximo artigo 🙂

 

:: Prompt da imagem de capa: papagaio usando óculos VR ::

Compartilhe