A Encyclopedia Britannica, grupo editorial responsável pela enciclopédia de mesmo nome e dono da marca Merriam-Webster, está processando a OpenAI. A empresa de inteligência artificial (IA) é acusada de infração de direitos autorais.
A ação judicial indica que a companhia dona do ChatGPT teria usado sem autorização ou compensação financeira artigos online e os verbetes da enciclopédia e do dicionário para treinar os modelos de linguagem que rodam em plataformas populares de IA.
smart_display
Nossos vídeos em destaque
Esse processo parte da acusação de que conteúdos gerados pelo ChatGPT são “substancialmente similares” aos materias de propriedade da Encyclopedia Britannica. O GPT-4 teria “memorizado” boa parte do conteúdo da enciclopédia e “respondido com cópias quase idênticas de porções significativas” de texto.
No texto do processo, a editora ainda coloca lado a lado textos da companhia e as respostas da IA sobre determinados conteúdos para indicar que há a cópia desses conteúdos.
Além do caso principal, há ainda uma segunda questão lidada nos documentos do tribunal: a OpenAI ter “canibalizado” o tráfego na web dos próprios sites da enciclopédia ao “substituir ou competir diretamente” com esse serviço, em vez de direcionar os usuários à fonte dos conteúdos.
IA e direitos autorais
Em nota enviada à Reuters, a OpenAI alega que os modelos “empoderam inovação e são treinados em dados publicamente disponíveis e baseados no princípio do uso justo (o chamado fair use)”.
Porém, esse não é o primeiro processo que empresas de IA encaram por questões de direitos autorais e o que foi usado no treinamento dessas plataformas. Ao menos dois se destacam nesse meio:
- a disputa do jornal The New York Times contra a OpenAI, que foi aberta ainda em 2023 e envolve acusações de treinamento ilegal do ChatGPT;
- o processo finalizado em acordo entre a Anthropic e autores de livros, com a dona do Claude compensando financeiramente escritores em um total de US$ 1,5 bilhão (R$ 7,8 bilhões).
Em uma fala no ano passado, um ex-executivo da Meta sugeriu que pedir permissão para usar conteúdos nessa etapa de treinamento “mataria” a indústria, reforçando a importância do uso dessas obras na programação de uma IA.
Qual é o lado perigoso de agentes de IA com muita autonomia para trabalhar? Entenda neste artigo!
