Já pensou realizar edições complexas em imagens apenas arrastando o mouse? Um novo projeto desenvolvido por pesquisadores da Alemanha e Estados Unidos permite alterar a dimensão das fotos, trocar a posição de corpos, mudar a expressão de rostos e mais! Tudo isso, com apenas alguns comandos simples.
Embora não seja o foco da ferramenta, o DragGAN também funciona como um gerador de imagens — como o Stable Diffusion e Dall-E.
O DragGAN processa imagens realistas e usa o modelo de aprendizado GAN (Generative Adversarial Networks, ou rede generativa contraditória, na tradução livre) para processar o conjunto de dados e realizar as alterações na imagem.
Nos vídeos divulgados pela equipe criadora, a ferramenta mostra seu potencial. Nos exemplos, vemos que o DragGAN consegue alterar a posição do rosto de um leão, abrir um sorriso no rosto de uma mulher, alterar o tamanho de roupas no corpo, mudar dimensões de um carro e mais.
Atualmente, já existem ferramentas de IA utilizando GANs, mas elas geralmente não são muito flexíveis. Então, não é possível pedir que essas tecnologias construam uma imagem na posição exata que o usuário deseja. Diferentemente das demais ferramentas, o DragGAN permite alterar a posição dos objetos e manipular detalhes.
Outra diferença é que o DragGAN edita as imagens sem precisar borrá-las ou misturar pixels:
Através do DragGAN, qualquer pessoa pode deformar uma imagem com controle preciso sobre onde os pixels vão, manipulando, assim, a pose, forma, expressão e layout de diversas categorias.
Como essas manipulações são realizadas no coletor de imagens generativas aprendidas de uma GAN, elas tendem a produzir saídas realistas, mesmo para cenários desafiadores.
Pesquisadores que desenvolveram o DragGAN.
Com informações de The Verge e The Decoder.
Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!
Fonte: Olhar Digital
Comentários