No ChatGPT, da OpenAI, você insere comandos de texto para gerar, por exemplo, resumos sobre determinados temas. Em contrapartida, no GPT-4, espécie de versão refinada do chatbot antecessor, a principal novidade (e diferença) é que dá para processar imagens junto aos comandos de texto para gerar conteúdo.

Além disso, o GPT-4 é mais preciso e seguro do que o ChatGPT. Pelo menos, é o que diz a OpenAI. É que, por ora, essa “evolução” do chatbot está disponível apenas para assinantes do ChatGPT Plus. Ou seja, ainda não foi amplamente testado. A seguir, o Olhar Digital te explica as diferenças entre os dois.

Métodos de treinamento

Trecho de conversa com ChatGPT em celular com tela de login no chatbot aberta em tela ao fundo
ChatGPT tem como modelo base o GPT-3.5, antecessor ao GPT-4 (Imagem: Shutterstock)

Antes de mais nada, o ChatGPT tem como modelo base o GPT-3.5. Ele é treinado em conjuntos de dados de diálogo e demonstração humana, com ajustes via RLHF (Reinforcement Learning from Human Feedback). Assim, incorpora-se feedback humano para melhorar um modelo de linguagem durante seu treinamento. Desta forma, se alinha a resposta do chatbot à tarefa solicitada pelo usuário, em vez de apenas prever a próxima palavra numa frase com base num corpus de dados de treinamento genéricos.

Por outro lado, a OpenAI ainda não divulgou detalhes sobre como o treinou o GPT-4. Aliás, seu relatório técnico não inclui detalhes sobre arquitetura (incluindo tamanho do modelo), hardware, computação de treinamento nem construção de conjunto de dados. Então, que se sabe é que o GPT-4 foi treinado com dados disponíveis publicamente e dados licenciados de terceiros. Depois, também passou por ajustes, via RLHF.

Capacidades e desempenho

Logomarca da OpenAI abaixo de um letreiro escrito GPT-4
GPT-4 é mais semelhante do que diferente do ChatGPT no quesito recursos (Imagem: NurPhoto/Getty Images)

A princípio, ChatGPT e GPT-4 são mais semelhantes do que diferentes. Tanto que, para a própria OpenAI, a distinção entre os modelos pode ser sutil. Segundo a empresa, “a diferença surge quando a complexidade da tarefa atinge o limite”.

Por isso, o que dá para dizer é: ao contrário do ChatGPT, que aceita apenas texto, o GPT-4 aceita prompts compostos por imagens e texto, retornando respostas textuais.

Já em relação ao desempenho, a OpenAI afirma que entre o GPT-4 e o ChatGPT houve um salto na segurança. Isso porque, segundo a empresa, houve redução nas respostas a solicitações de conteúdo não permitido e na geração de conteúdo tóxico. Do mesmo modo, a empresa aprimorou respostas a tópicos delicados.

Além disso, o GPT-4 superou seu antecessor na maioria dos exames acadêmicos e profissionais realizados por humanos. Aliás, o GPT-4 também superou significativamente o ChatGPT em benchmarks de modelos de linguagem tradicionais. Por outro lado, em alguns testes em outros modelos, superou-o por pouco.

Limitações

Tanto o ChatGPT quanto o GPT-4 têm limitações e riscos relacionados ao seu uso. Entre eles, estão:

Ou seja…

ChatGPT aberto num iPhone
Lançamento do ChatGPT e do GPT-4 teve apenas alguns meses de diferença (Imagem: Airam Dato-on/Pexels)

Embora ainda se saiba menos sobre a arquitetura do modelo e os métodos de treinamento por trás do GPT-4, ele parece ser uma versão refinada do ChatGPT. Por exemplo, o chatbot aceita entradas de imagem e texto, além de afirmar ser mais seguro, preciso e criativo.

Em suma, a corrida para criar modelos grandes de linguagem mais precisos e dinâmicos atingiu uma velocidade vertiginosa, com o lançamento do ChatGPT e do GPT-4 com apenas alguns meses de diferença. Manter-se informado sobre avanços, riscos e limitações desses modelos é essencial, à medida que navegamos nesse cenário empolgante, mas em rápida evolução.

Principais características do ChatGPT e GPT-4

Características ChatGPT GPT-4
Tipo de modelo Modelo de texto generativo especializado em diálogo Modelo multimodal que aceita imagem e entrada de texto e gera saída de texto
Métodos de treinamento – Arquitetura do transformador;
– Treinado em conjuntos de dados de diálogo e demonstração humana;
– Treinado usando ajuste fino supervisionado + RLHF.
– Arquitetura do transformador;
– Treinado em “dados públicos” + “dados de terceiros”;
– Treinado usando algo não-especificado + RLHF.
Modelo base GPT-3.5 Não-especificado
Principais aplicações – Gerar conteúdo de texto;
– Resumo de texto;
– Chatbots;
– Escrever e depurar código;
– Sistemas de diálogo.
Gerar conteúdo de texto;
Resumo de texto;
Chatbots;
Escrever e depurar código;
Sistemas de diálogo;
Analisar e explicar imagens.
Disponibilidade – Aplicativo on-line gratuito e limitado;
– Assinatura paga do ChatGPT Plus;
– API paga.
– Aplicação online disponível apenas por meio da assinatura paga do ChatGPT Plus;
– API ainda não disponível.
Recursos adicionais Nenhum – Mais preciso (menos propenso a alucinações);
– Mais seguro (menos propenso a respostas prejudiciais);
– Aceita texto e imagens como entrada.
(Fonte: Towards Data Science)

Com informações do Towards Data Science

Imagem de destaque: Alana Jordan / Pixabay – montagem: Pedro Spadoni / Olhar Digital

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!