Anthropic paga 1,5 miliardi per libri distrutti: quando l'AI impara rubando

C'è un momento preciso in cui il futuro dell'intelligenza artificiale ha smesso di essere solo una questione tecnologica e si è trasformato in un caso legale da un miliardo e mezzo di dollari. Quel momento riguarda i libri: quelli comprati, tagliati, scannerizzati e poi mandati al riciclo da Anthropic, l'azienda che ha creato Claude, uno dei modelli linguistici più sofisticati al mondo.

Per capire cosa è successo davvero, bisogna partire dall'inizio. I sistemi di intelligenza artificiale come Claude, ChatGPT o i modelli di Meta sanno scrivere, ragionare, rispondere a domande complesse. Ma per imparare a farlo hanno avuto bisogno di qualcosa su cui esercitarsi: milioni di testi. Internet offre materiale in abbondanza, ma i libri sono un'altra categoria. Il linguaggio è più ricco, strutturato, preciso. Già nel 2023 un co-fondatore di Anthropic aveva dichiarato apertamente che i libri insegnano all'intelligenza artificiale a scrivere bene, invece di imitare il linguaggio scadente che circola in rete.

Il problema è che quei libri hanno autori, e quindi anche un copyright. Chiedere il permesso a milioni di scrittori è un processo lento, costoso, spesso impossibile. E così le grandi aziende tecnologiche hanno cercato delle scorciatoie.

La prima è stata la più rozza: scaricare libri piratati. Anthropic, Meta e OpenAI hanno attinto a biblioteche digitali illegali, raccolte di milioni di volumi condivisi online senza alcuna autorizzazione. Meta lo ha fatto usando connessioni torrent, stando attenta a non farsi tracciare. Secondo i documenti emersi durante il processo, questa pratica sarebbe stata approvata direttamente da Mark Zuckerberg, nonostante le perplessità interne. Un ingegnere dell'azienda aveva scritto in una comunicazione interna: "Fare torrenting dal laptop aziendale non mi sembra giusto." Eppure andarono avanti.

La seconda scorciatoia, quella adottata da Anthropic nel cosiddetto Project Panama, era più sofisticata ma non meno controversa. Invece di scaricare copie piratate, l'azienda acquistava fisicamente i libri in lotti da decine di migliaia, li tagliava con macchinari industriali, li scannerizzava ad alta velocità e poi li mandava al riciclo. Comprati regolarmente, quindi, senza violare il copyright sull'acquisizione. Ma distrutti nel processo.

Nel giugno del 2025, un tribunale americano aveva stabilito che usare i libri per addestrare l'intelligenza artificiale è legale, in quanto processo trasformativo: l'AI non riproduce i testi, li usa per apprendere, come uno studente che legge per crescere. Ma scaricare copie piratate è un'altra storia, e su questo punto la sentenza è stata netta. Anthropic ha dovuto versare un miliardo e mezzo di dollari a editori e autori. Ogni scrittore coinvolto può ricevere fino a tremila dollari per titolo.

La vicenda non riguarda solo Anthropic. Google, Microsoft e OpenAI sono tutti coinvolti in cause simili, ancora aperte o in fase di definizione. Un professore di diritto della Cornell University ha sintetizzato la questione con una frase destinata a restare: "Le aziende AI si sono convinte che le regole della ricerca accademica valessero anche per il business miliardario. Un errore colossale."

Quello che emerge da questa storia è che il modo in cui l'intelligenza artificiale ha imparato a parlare con noi ha un costo che qualcuno, fino ad oggi, ha preferito non pagare.