A Microsoft anunciou, nesta terça-feira (18), uma atualização importante para seu chatbot de IA (inteligência artificial): pesquisa visual. Agora, os usuários podem tirar ou enviar uma foto para o Bing Chat e solicitar mais informações sobre ela – tanto no computador quanto no celular (via aplicativo do Bing).

Para quem tem pressa:

O Bing pode entender o contexto de uma imagem, interpretá-la e responder a perguntas sobre ela. Esteja você viajando para uma nova cidade nas férias e perguntando sobre a arquitetura de um determinado edifício ou em casa tentando ter ideias para o almoço com base no conteúdo de sua geladeira, carregue a imagem no Bing Chat e use-a para aproveitar o conhecimento da web para obter respostas.

Microsoft, em comunicado

Veja abaixo uma rápida demonstração do novo recurso num computador:

Pesquisa visual no ChatGPT do Bing

Captura de tela da pesquisa com imagem do ChatGPT do Bing
(Imagem: Reprodução)

A atualização ocorre quando a corrida armamentista de IA esquenta entre líderes deste nicho – por exemplo: Microsoft, Google, OpenAI e Anthropic.

No esforço para desenvolver a IA generativa mais avançada, os gigantes da tecnologia lançam recursos a cada mês.

O objetivo é acompanhar não apenas seus concorrentes de chatbot baseados em texto, mas também ferramentas de IA avançadas que trabalham com imagens.

Por um lado, a pesquisa de imagens – e as respostas que incluem imagens – estão se tornando parte da experiência do usuário de chatbots.

Por outro, nenhum dos principais baseados em texto parece ser capaz de gerar suas próprias imagens, ao contrário de plataformas como Midjourney, Stable Diffusion e DALL- E 2.

No entanto, o Google diz que o recurso está a caminho de seu chatbot Bard.

Contexto

Dois perfis de inteligência artificial com logomarcas do Bing, da Microsoft e do Bard, do Google
(Imagem: Victor Habbick Visions/Science Photo Library/Getty Images/Google/Microsoft)

A decisão da Microsoft de permitir imagens no Bing Chat segue a estreia recente, no Google, de um recurso de pesquisa de imagens para o Bard, seu chatbot de IA.

Usando o Google Lens, os usuários podem solicitar informações ao Bard sobre uma imagem que eles enviaram e pedir para gerar uma legenda.

Também dá para acrescentar um pouco de entusiasmo às respostas do chatbot, pedindo, por exemplo, por recomendações – com fotos – de restaurantes.

Por ora, o ChatGPT da OpenAI não permite uploads de fotos, pois o chatbot ainda é totalmente baseado em texto. E o chatbot da Anthropic, Claude 2, opera de maneira semelhante.

Com informações de Microsoft