Argomenti trattati
L’evoluzione dell’intelligenza artificiale (AI) ha sollevato nuove questioni riguardanti la memorizzazione e l’utilizzo di opere protette. L’idea comune di un’AI che apprende come un studente è stata messa in discussione. I modelli di AI non apprendono nel senso tradizionale, ma piuttosto memorizzano e riproducono informazioni.
Studi recenti hanno dimostrato che i modelli di AI generativa possono estrarre porzioni significative di testi coperti da copyright, sollevando interrogativi fondamentali sul diritto d’autore e sull’uso legittimo. Questo articolo esplora le evidenze emerse e le implicazioni legali che ne derivano.
La natura della memorizzazione nei modelli di AI
Contrariamente all’immagine rassicurante di un’AI che apprende come un umano, le ricerche suggeriscono che la memorizzazione delle informazioni da parte dei modelli di AI è simile a un archivio digitale che raccoglie dati. I modelli comprimono e memorizzano sequenze testuali nei loro parametri, piuttosto che interiorizzare concetti come farebbe una mente umana.
Un caso di studio significativo
Un recente studio condotto dalla Stanford University ha esaminato la possibilità di estrarre testi protetti da modelli di linguaggio commerciali. Utilizzando tecniche di jailbreaking, i ricercatori sono riusciti a ottenere porzioni di testi. Nei modelli come Claude 3.7 Sonnet, GPT-4.1 e Gemini 2.5 Pro, è stato possibile estrarre fino al 95% di contenuti di opere protette. Questi risultati evidenziano come la memorizzazione possa avvenire anche in sistemi dotati di misure di sicurezza.
Implicazioni legali e il concetto di fair use
Le scoperte riguardanti la memorizzazione sollevano interrogativi sul concetto di fair use. Negli Stati Uniti, la dottrina fair use consente l’uso di opere protette a determinate condizioni, come l’aggiunta di un nuovo significato o funzione. Tuttavia, se un modello è in grado di riprodurre porzioni di testi originali, la natura trasformativa di tale uso diventa problematica, compromettendo l’accesso alle opere originali e riducendo il loro valore economico.
Il caso del New York Times
Un esempio recente è la causa legale intentata dal New York Times contro OpenAI. La testata sostiene che ChatGPT abbia utilizzato milioni di articoli senza autorizzazione, producendo output simili agli originali e aggirando i paywall. OpenAI difende il suo operato, sostenendo che l’addestramento del modello sia un uso trasformativo. Tuttavia, il New York Times contesta questa affermazione, evidenziando il danno economico e strutturale che potrebbe causare al mercato dell’informazione.
Il contesto europeo e le sfide future
Nel contesto europeo, il diritto d’autore presenta una struttura diversa rispetto agli Stati Uniti. Non esiste una dottrina di fair use generale, ma solo eccezioni specifiche, come quelle per il text and data mining. La crescente evidenza della memorizzazione nei modelli di AI generativa mette a rischio la stabilità di queste eccezioni e richiede un’analisi approfondita della governance della proprietà intellettuale in Europa.
L’emergere di modelli di AI generativa che possono memorizzare e riprodurre opere protette rappresenta una sfida significativa per il diritto d’autore. È fondamentale che legislatori e aziende considerino le implicazioni legali e le opportunità di creare un quadro normativo che tuteli sia i diritti degli autori sia l’innovazione tecnologica.

