A Boston Dynamicsmostrou como está funcionando a junção entre IA generativa do ChatGPT com o robô autônomo Spot. A novidade não está mais apenas em um estudo interno da empresa, mas faz parte de um tour guiado pelo prédio onde ficam diversas criações da companhia.

O que você precisa saber:

Em abril deste ano falamos de um projeto unindo ChatGPT e robôs da Boston Dynamic, mas só agora a empresa resolveu colocar em prática este teste. Em um vídeo liberado nesta semana, temos um guia para quem quer visitar o prédio da companhia nos Estados Unidos.

A Boston Dynamics comenta que utilizou não somente o ChatGPT da Open IA, mas também outros modelos de IA generativa e criou uma solução própria. Ela é capaz de não somente conversar com pessoas e entender suas falas, mas até mesmo recriar culturas e estilos de respostas de acordo com o desejo da empresa.

No vídeo (em inglês) temos alguns exemplos, como um perfil de guia feito como se fosse um mordomo britânico, depois a Boston Dynamics alterou a personalidade para que ela se aproximasse de uma mulher que trabalha na área rural americana, focando seus esforços na fazenda e também em mineração. Por fim, a terceira imitou o esperado para uma pessoa animada e positiva e a quarta envolvia um arqueologista de 1920.

Cada perfil utilizado pela Boston Dynamics no robô é diferente

Cada um falou com tons diferentes, mas também tiveram a forma da resposta alterada. A mulher da área rural comentou exemplos de vida do que seria seu trabalho coletando pedras, já o mordomo utilizou termos comuns para uma fala completamente formal e a pessoa animada sempre respondia mais rápido. Outro, chamado Josh, é sarcástico e responde “eu vejo a tristeza do vazio da minha existência refletida neste QR Code, junto da janela aberta”, quando perguntado sobre o que o robô estava olhando.

Spot é guia robô com ChatGPT (Imagem: divulgação/Boston Dynamics)
Spot é guia robô com ChatGPT (Imagem: divulgação/Boston Dynamics)

O trabalho prévio da Boston Dynamics envolveu criar um mapa do local onde o robô precisa andar e qual é cada setor, como o local onde projetos antigos estão em exposição ou então o ambiente de testes para caminhada. Todo o restante das respostas utiliza a IA generativa, alimentada por tudo que as câmeras conseguem ver.