No ChatGPT, da OpenAI, você insere comandos de texto para gerar, por exemplo, resumos sobre determinados temas. Em contrapartida, no GPT-4, espécie de versão refinada do chatbot antecessor, a principal novidade (e diferença) é que dá para processar imagens junto aos comandos de texto para gerar conteúdo.
Além disso, o GPT-4 é mais preciso e seguro do que o ChatGPT. Pelo menos, é o que diz a OpenAI. É que, por ora, essa “evolução” do chatbot está disponível apenas para assinantes do ChatGPT Plus. Ou seja, ainda não foi amplamente testado. A seguir, o Olhar Digital te explica as diferenças entre os dois.
Métodos de treinamento
Antes de mais nada, o ChatGPT tem como modelo base o GPT-3.5. Ele é treinado em conjuntos de dados de diálogo e demonstração humana, com ajustes via RLHF (Reinforcement Learning from Human Feedback). Assim, incorpora-se feedback humano para melhorar um modelo de linguagem durante seu treinamento. Desta forma, se alinha a resposta do chatbot à tarefa solicitada pelo usuário, em vez de apenas prever a próxima palavra numa frase com base num corpus de dados de treinamento genéricos.
Por outro lado, a OpenAI ainda não divulgou detalhes sobre como o treinou o GPT-4. Aliás, seu relatório técnico não inclui detalhes sobre arquitetura (incluindo tamanho do modelo), hardware, computação de treinamento nem construção de conjunto de dados. Então, que se sabe é que o GPT-4 foi treinado com dados disponíveis publicamente e dados licenciados de terceiros. Depois, também passou por ajustes, via RLHF.
Capacidades e desempenho
A princípio, ChatGPT e GPT-4 são mais semelhantes do que diferentes. Tanto que, para a própria OpenAI, a distinção entre os modelos pode ser sutil. Segundo a empresa, “a diferença surge quando a complexidade da tarefa atinge o limite”.
Por isso, o que dá para dizer é: ao contrário do ChatGPT, que aceita apenas texto, o GPT-4 aceita prompts compostos por imagens e texto, retornando respostas textuais.
Já em relação ao desempenho, a OpenAI afirma que entre o GPT-4 e o ChatGPT houve um salto na segurança. Isso porque, segundo a empresa, houve redução nas respostas a solicitações de conteúdo não permitido e na geração de conteúdo tóxico. Do mesmo modo, a empresa aprimorou respostas a tópicos delicados.
Além disso, o GPT-4 superou seu antecessor na maioria dos exames acadêmicos e profissionais realizados por humanos. Aliás, o GPT-4 também superou significativamente o ChatGPT em benchmarks de modelos de linguagem tradicionais. Por outro lado, em alguns testes em outros modelos, superou-o por pouco.
Limitações
Tanto o ChatGPT quanto o GPT-4 têm limitações e riscos relacionados ao seu uso. Entre eles, estão:
Ou seja…
Embora ainda se saiba menos sobre a arquitetura do modelo e os métodos de treinamento por trás do GPT-4, ele parece ser uma versão refinada do ChatGPT. Por exemplo, o chatbot aceita entradas de imagem e texto, além de afirmar ser mais seguro, preciso e criativo.
Em suma, a corrida para criar modelos grandes de linguagem mais precisos e dinâmicos atingiu uma velocidade vertiginosa, com o lançamento do ChatGPT e do GPT-4 com apenas alguns meses de diferença. Manter-se informado sobre avanços, riscos e limitações desses modelos é essencial, à medida que navegamos nesse cenário empolgante, mas em rápida evolução.
Principais características do ChatGPT e GPT-4
Características | ChatGPT | GPT-4 |
Tipo de modelo | Modelo de texto generativo especializado em diálogo | Modelo multimodal que aceita imagem e entrada de texto e gera saída de texto |
Métodos de treinamento | – Arquitetura do transformador; – Treinado em conjuntos de dados de diálogo e demonstração humana; – Treinado usando ajuste fino supervisionado + RLHF. |
– Arquitetura do transformador; – Treinado em “dados públicos” + “dados de terceiros”; – Treinado usando algo não-especificado + RLHF. |
Modelo base | GPT-3.5 | Não-especificado |
Principais aplicações | – Gerar conteúdo de texto; – Resumo de texto; – Chatbots; – Escrever e depurar código; – Sistemas de diálogo. |
Gerar conteúdo de texto; Resumo de texto; Chatbots; Escrever e depurar código; Sistemas de diálogo; Analisar e explicar imagens. |
Disponibilidade | – Aplicativo on-line gratuito e limitado; – Assinatura paga do ChatGPT Plus; – API paga. |
– Aplicação online disponível apenas por meio da assinatura paga do ChatGPT Plus; – API ainda não disponível. |
Recursos adicionais | Nenhum | – Mais preciso (menos propenso a alucinações); – Mais seguro (menos propenso a respostas prejudiciais); – Aceita texto e imagens como entrada. |
Com informações do Towards Data Science
Imagem de destaque: Alana Jordan / Pixabay – montagem: Pedro Spadoni / Olhar Digital
Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!
Fonte: Olhar Digital
Comentários