A OpenAI, desenvolvedora do ChatGPT, concordou em pagar pelos direitos de uso de histórias da Associated Press (AP) para treinar seus algoritmos de inteligência artificial.
Esse é o primeiro acordo importante do tipo, em meio a um crescente debate sobre se as empresas de tecnologia devem remunerar os criadores de conteúdo cujas informações são coletadas da web para construir ferramentas de IA.
Empresas como OpenAI, Google e outras do ramo de IA têm utilizado bilhões de frases retiradas da internet para alimentar seus “modelos de linguagem ampla” que impulsionam seus chatbots.
Notícias, artigos da Wikipédia, comentários em redes sociais e posts de blogs são todos incorporados nesses modelos sem a devida permissão de seus proprietários. As empresas de tecnologia geralmente argumentam que estão livres para utilizar dados públicos.
Uma análise do Washington Post de um banco de dados de sites usado para treinar um dos modelos antigos de IA da OpenAI revelou que o site de notícias principal da AP foi o 68º mais citado no banco de dados.
Revolta contra a prática
Um grupo crescente de autores, músicos, organizações de notícias e empresas de mídia social tem se manifestado contra essa prática. O argumento usado por eles é que o uso de seu conteúdo para treinar IA representa uma mudança massiva na forma como a internet funciona, especialmente considerando que algumas das ferramentas de IA treinadas com conteúdo humano já estão substituindo trabalhadores humanos.
Nas últimas duas semanas, uma série de processos judiciais foram movidos contra a indústria, alegando uso indevido de dados, incluindo ações coletivas contra a OpenAI e o Google, além de processos contra a OpenAI movidos pela comediante Sarah Silverman e dois autores de ficção proeminentes.
Na última quinta-feira, o Washington Post informou que a Federal Trade Commission abriu uma investigação sobre como a OpenAI utilizou os dados dos consumidores para treinar seus modelos.
Chatbots como o ChatGPT são treinados com base em um conjunto de informações e não podem ser atualizados continuamente sem serem reconfigurados do zero. Isso significa que eles são menos úteis para fornecer notícias recentes e informações atualizadas.
As empresas de tecnologia têm tentado resolver esse problema permitindo que os chatbots pesquisem a web ou façam perguntas a um banco de dados separado e em constante atualização. O acordo com a AP dá à OpenAI acesso apenas ao seu arquivo de notícias, mas esse arquivo é atualizado regularmente com histórias recentes.
Empresas de tecnologia já pagaram diretamente por conteúdo noticioso no passado, para outros fins. O Google e o Facebook pagam às empresas de notícias pelo acesso direto a seu conteúdo, exibindo-o em suas plataformas em alguns países. Na Austrália, o governo aprovou uma lei que exige essa prática, e uma lei semelhante está prestes a entrar em vigor no Canadá.
Fonte: Olhar Digital
Comentários