Il 12 maggio sono stati depositati gli atti iniziali di diverse azioni di classe promosse in Illinois da sei professionisti della voce che hanno citato in giudizio numerose grandi aziende tecnologiche. I firmatari accusano società come Amazon, Adobe, Alphabet/Google, Apple, ElevenLabs, Meta, Microsoft, NVIDIA e Samsung di aver raccolto e trattato le loro registrazioni vocali per creare modelli di sintesi senza ottenere un consenso informato.
Il nucleo della controversia riguarda l’estrazione e l’uso di ciò che i ricorrenti definiscono impronte vocali: rappresentazioni matematiche delle caratteristiche acustiche e degli schemi di parlato di un individuo. Secondo gli atti, queste rappresentazioni sono state incorporate nei parametri dei modelli e utilizzate per generare voci sintetiche che imitano i parlanti originali, il tutto senza che a questi fosse chiesto o concesso il permesso.
Cosa sostengono i ricorrenti
Gli avvocati che rappresentano i firmatari affermano che le aziende hanno acquisito «centinaia di migliaia di ore di parlato umano» e ne hanno estratto le impronte biometriche vocali, includendo tra le registrazioni voci note del giornalismo, dei podcast investigativi, della narrazione di audiolibri e del doppiaggio. I ricorrenti nominati comprendono professionisti riconosciuti: Philip Rogers (Emmy, Edward R. Murrow), Carol Marin (tre volte vincitrice del Peabody, Ordine di Lincoln 2026), Robin Amer (The City di USA Today, premi duPont-Columbia), Lindsey Dorcus (narratrice SOVAS), Yohance Lacour (podcast vincitore del Pulitzer 2026) e Victoria Nassif (narratrice pubblicata da Penguin Random House, Hachette e Simon & Schuster).
La descrizione tecnica dell’impronta vocale
I ricorrenti spiegano che un’impronta vocale è una sorta di «impronta digitale sonora», una codifica matematica del timbro, del tono e delle abitudini di parola che identifica in modo univoco una persona e non può essere semplicemente reissuita o cambiata. Nel documento si sostiene che le caratteristiche estratte non vengono memorizzate separatamente ma sono codificate nei parametri dei modelli, così che quando il prodotto genera parlato sintetico esso riproduce le medesime caratteristiche biometriche.
Quadro normativo e richieste legali
La contestazione principale si fonda sul BIPA (Biometric Information Privacy Act) dell’Illinois, che proibisce la raccolta e l’uso di dati biometrici senza un’adeguata informativa e il consenso scritto informato. Oltre al BIPA, i ricorsi invocano l’Illinois Right of Publicity Act (IRPA), l’Illinois Consumer Fraud and Deceptive Business Practices Act (ICFA), l’Illinois Uniform Deceptive Trade Practices Act (IUDTPA) e il diritto comune relativo all’arricchimento senza causa.
Risarcimenti e misure richieste
Tra le pretese avanzate compaiono il risarcimento dei danni previsti dalla legge, l’ordine di restituzione dei profitti derivanti dallo sfruttamento delle impronte vocali, un provvedimento inibitorio per impedire ulteriori acquisizioni non autorizzate e l’obbligo di identificare le fonti dei dati di addestramento. I ricorrenti chiedono anche la distruzione delle impronte ottenute illegalmente e il riaddestramento o la distruzione dei Modelli Vocali Fondamentali in cui tali impronte sarebbero codificate, oltre al rimborso delle spese legali.
Impatto commerciale e possibili ricadute in Europa
I legali sottolineano che, nel caso di Amazon, la situazione assume una dimensione commerciale aggravata perché Audible e gli altri servizi del gruppo possono distribuire narrazioni umane, acquisire quelle registrazioni come dati di addestramento e poi rimettere sul mercato narrazioni generate da IA che imitano gli stessi narratori. Per i professionisti che vivono della propria voce, questa dinamica costituisce una concorrenza fondata sulle stesse registrazioni che li avevano resi noti.
Dal punto di vista europeo, il ragionamento degli atti statunitensi richiama direttamente il GDPR: se registrazioni di cittadini europei sono state usate per estrarre dati biometrici senza trasparenza e consenso, potrebbero esserci analoghe responsabilità civili e amministrative. In Italia, dove la lingua e le voci nazionali sono un patrimonio specifico, è plausibile che servizi che parlano in italiano siano stati addestrati su registrazioni locali, aprendo la strada a iniziative simili anche davanti ai giudici europei.
Al momento è presentata una sola versione della vicenda, quella dei ricorrenti; le società citate dovranno rispondere alle accuse. Anche se non è possibile prevedere l’esito, la combinazione di profili tecnici, norme biometriche e potenziali danni di mercato rende questa controversia un caso di grande interesse per chi si occupa di IA, diritti digitali e regolamentazione dei dati.


