Já pensou realizar edições complexas em imagens apenas arrastando o mouse? Um novo projeto desenvolvido por pesquisadores da Alemanha e Estados Unidos permite alterar a dimensão das fotos, trocar a posição de corpos, mudar a expressão de rostos e mais! Tudo isso, com apenas alguns comandos simples.

Embora não seja o foco da ferramenta, o DragGAN também funciona como um gerador de imagens — como o Stable Diffusion e Dall-E.

O DragGAN processa imagens realistas e usa o modelo de aprendizado GAN (Generative Adversarial Networks, ou rede generativa contraditória, na tradução livre) para processar o conjunto de dados e realizar as alterações na imagem.

Nos vídeos divulgados pela equipe criadora, a ferramenta mostra seu potencial. Nos exemplos, vemos que o DragGAN consegue alterar a posição do rosto de um leão, abrir um sorriso no rosto de uma mulher, alterar o tamanho de roupas no corpo, mudar dimensões de um carro e mais.

Atualmente, já existem ferramentas de IA utilizando GANs, mas elas geralmente não são muito flexíveis. Então, não é possível pedir que essas tecnologias construam uma imagem na posição exata que o usuário deseja. Diferentemente das demais ferramentas, o DragGAN permite alterar a posição dos objetos e manipular detalhes.

Outra diferença é que o DragGAN edita as imagens sem precisar borrá-las ou misturar pixels: 

Através do DragGAN, qualquer pessoa pode deformar uma imagem com controle preciso sobre onde os pixels vão, manipulando, assim, a pose, forma, expressão e layout de diversas categorias.

Como essas manipulações são realizadas no coletor de imagens generativas aprendidas de uma GAN, elas tendem a produzir saídas realistas, mesmo para cenários desafiadores.

Pesquisadores que desenvolveram o DragGAN.

Com informações de The Verge e The Decoder.

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!