Novas Ferramentas de Alívio para Usuários de Bots de IA: Ferramenta da Cloudflare Permite Que Sites Cobrem por Coleta de Dados
Introdução
A empresa de serviços de nuvem com sede em San Francisco, Cloudflare, lançou um novo conjunto de ferramentas de IA que visa oferecer aos sites a capacidade de impedir a coleta de dados não autorizada por crawlers de IA, ou de cobrar por acesso aos seus dados.
Controle e Monetização do Conteúdo
Na visão de Sam Rhea, vice-presidente da Cloudflare, os proprietários de sites agora possuem a capacidade de definir um valor esperado para o uso de seu conteúdo por modelos de linguagem de larga escala (LLMs). Rhea afirmou:
“O que apresentamos hoje é a capacidade para proprietários de sites e publicações na internet dizerem: ‘este é o valor que espero receber do meu site’.”
Ao permitir que os sites não apenas bloqueiem bots de IA, mas também cobrem uma taxa dos bots que aprovarem, a plataforma gratuita de gerenciamento de bots da Cloudflare proporciona uma nova fontes de receita para os criadores de conteúdo.
Ferramentas de Auditoria e Acesso
Além da monetização, a ferramenta de auditoria de IA permite que os usuários visualizem a forma como seu conteúdo está sendo acessado. Rhea distingue os bots de IA de bots maliciosos, enfatizando que os crawlers de IA têm como objetivo escanear conteúdo público sem intenção de prejudicar:
“…os crawlers de IA não visam prejudicar ou roubar, mas escaneiam conteúdo público para treinar modelos de linguagem.”
A Indústria de Coleta de Dados e Suas Implicações
Ainda segundo Rhea, não existe uma única plataforma que domine a atividade de coleta de dados de sites, que varia conforme o tipo de conteúdo. Modelos de IA generativa requerem grandes quantidades de dados para funcionar, proporcionando respostas rápidas e precisas, além de gerar imagens, vídeos e músicas. O setor de coleta de dados por IA está crescendo rapidamente, com empresas como LAION, Defined.AI, Aleph Alpha e Replicate fornecendo conjuntos de dados pré-coletados para desenvolvedores de IA. Estima-se que a indústria de software de coleta de dados na web alcance US$ 2,45 bilhões até 2036, conforme pesquisa do Research Nester.
Debate sobre Uso Justo e Direitos Autorais
No ano passado, Ed Newton-Rex, ex-chefe de áudio da Stability AI, renunciou devido à forma como plataformas de IA afirmavam que coletar dados de sites era de “uso justo”. Ele argumentou:
“‘Uso justo’ não foi concebido com a IA generativa em mente – treinar modelos de IA generativa dessa forma é, para mim, errado.”
Newton-Rex sustentou que as empresas, valendo-se de conteúdos criativos sem permissão, estão gerando novas obras que competem com as originais, desafiando a economia das artes criativas que se baseia em direitos autorais.
Disposição dos Desenvolvedores de IA para Pagar
Rhea mencionou que desenvolvedores menores de IA parecem dispostos a pagar por conteúdo selecionado de sites, especialmente em áreas onde a alta qualidade dos dados é cada vez mais difícil de ser encontrada, como conteúdo científico e matemático.
Conclusão
As novas ferramentas da Cloudflare trazem uma nova dinâmica para o relacionamento entre conteúdos digitais e seus criadores, promovendo um ambiente onde é possível regular o acesso e a monetização das informações disponíveis na web.
1. #CloudflareIA
2. #MonetizaçãoConteúdo
3. #IAeColetaDados
4. #UsoJustoIA
5. #AcessoInformações
autor original: Jason Nelson
ref:https://decrypt.co/250830/cloudflares-new-tool-lets-sites-charge-for-data-scraping