Reddit processa antropia por raspar os dados do usuário para treinar IA

O Reddit está levando antropia ao tribunal, acusando a empresa de inteligência artificial de extrair o conteúdo do usuário da plataforma sem permissão e usá -lo para treinar seus modelos de IA Claude. O processo.

O caso é construído em torno da alegação do Reddit de que o antropic ignorou as restrições técnicas e seus termos de serviço. De acordo com a denúncia, proteções antrópicas ignoradas como o arquivo robots.txt do site, que deve impedir a raspagem automatizada. O Reddit também acusa antropia de violar a privacidade do usuário, coletando e usando postagens pessoais – incluindo conteúdo excluído – para fins comerciais.

O Reddit diz que oferece acesso estruturado aos seus dados por meio de acordos de licenciamento com empresas como OpenAI e Google. Essas ofertas incluem condições em torno do uso de conteúdo, salvaguardas de privacidade e exclusão de dados. Segundo a plataforma, o Antrópico se recusou a buscar um contrato formal e, em vez disso, raspou o site diretamente, evitando taxas de licenciamento e pulando as proteções de usuários no processo.

O processo destaca um artigo de pesquisa de 2021, co-autor do CEO antrópico Dario Amodei, que apontou para o Reddit como uma rica fonte de dados de treinamento para modelos de idiomas. O Reddit também incluiu exemplos em que Claude parecia reproduzir as postagens do Reddit quase palavra por palavra, até ecoando postagens que foram excluídas pelos usuários. Isso, diz a empresa, mostra que a Anthropic não conseguiu colocar a GuardaRails para respeitar a privacidade do usuário ou quedas de conteúdo.

O Reddit está buscando danos financeiros e uma ordem judicial que impediria a Anthrópica de usar o conteúdo do Reddit em versões futuras de seus modelos.

Anthrópica respondeu, alegando que discorda das reivindicações e planeja se defender. No entanto, esta não é a primeira vez que a corporação está sob pressão legal sobre como coleta dados de treinamento.

Em agosto de 2024, um grupo de autores arquivou um processo de ação coletiva Acusando antropia de usar seu trabalho protegido por direitos autorais sem permissão. Eles alegaram que a empresa treinou seus modelos em livros e outros materiais escritos sem o seu consentimento e, em seguida, solicitaram compensação pelo uso de seu conteúdo.

UM caso semelhante A partir de outubro de 2023, envolveu o Universal Music Group e outros editores. Eles processaram as alegações de que seu chatbot de Claude estava reproduzindo letras de músicas protegidas por direitos autorais. As empresas musicais argumentaram que esse uso violava seus direitos de propriedade intelectual e pediu ao tribunal que bloqueie o uso adicional de suas letras.

Ao contrário desses processos, o caso do Reddit não se concentra nos direitos autorais. Em vez disso, centra -se em quebra de contrato e concorrência desleal. O argumento do Reddit é que os dados retirados de seu site não são apenas públicos – é governado por termos que antropia ignoraram conscientemente. Essa distinção pode tornar o caso importante para outras plataformas que hospedam o conteúdo do usuário, mas querem controlar como é usado nos sistemas comerciais de IA.

O Reddit também acusa antropia de enganar o público. O processo aponta para declarações públicas de Antrópica que afirma que respeita as regras de eliminação e valoriza a privacidade do usuário, que o Reddit diz ser contradito pelas ações da empresa.

“Por sua parte, apesar do que seu material de marketing diz, o Antrópico não se importa com as regras ou usuários do Reddit”, diz o processo. “Ele acredita que tem o direito de pegar o conteúdo que desejar e usar esse conteúdo, como desejar, com impunidade”.

Depois que o processo foi movido, as ações da Reddit subiram quase 67%, um sinal de que os investidores apoiaram a mudança. O resultado do caso pode definir um precedente de como as empresas alcançam um equilíbrio entre o conteúdo aberto da Internet e os direitos dos usuários e proprietários de conteúdo.

À medida que mais empresas de IA dependem de grandes volumes de dados on -line, as questões legais e éticas em torno da raspagem estão ficando mais difíceis de ignorar. O caso do Reddit aumenta a lista crescente de ações judiciais que moldam como essa próxima onda de desenvolvimento de IA se desenrola.

(Foto por Brett Jordan)

Veja também: Ética em automação: abordando o viés e a conformidade na IA

Deseja aprender mais sobre IA e Big Data dos líderes do setor? Confira Ai & Big Data Expo Ocorrendo em Amsterdã, Califórnia e Londres. O evento abrangente é co-localizado com outros eventos principais, incluindo Conferência de Automação InteligenteAssim, BlockxAssim, Semana de Transformação Digitale Cyber Security & Cloud Expo.

Explore outros próximos eventos de tecnologia corporativa e webinars alimentados pela TechForge aqui.

Créditos Autor