Salta al contenuto
6 Giugno 2026

Perché Anthropic chiede una sospensione coordinata dello sviluppo dei modelli AI

Anthropic ha chiesto ieri una sospensione coordinata dello sviluppo dei modelli di frontiera, citando il rischio di recursive self-improvement e dati che mostrano come Claude abbia assunto un ruolo dominante nella produzione di codice e nella ricerca interna

Perché Anthropic chiede una sospensione coordinata dello sviluppo dei modelli AI

Ieri Anthropic ha lanciato un appello ai laboratori che sviluppano i modelli di frontiera chiedendo una pausa coordinata e verificabile nello sviluppo delle intelligenze artificiali più avanzate. La richiesta, articolata nel documento dell’Anthropic Institute intitolato “When AI builds itself“, è firmata da Marina Favaro e Jack Clark e si fonda su osservazioni interne sull’uso crescente di Claude nei processi di sviluppo.

La motivazione centrale è il timore dell’auto-miglioramento ricorsivosistemi capaci, nel tempo, di progettare e addestrare versioni sempre più potenti di se stessi con un intervento umano progressivamente marginale. Il tema richiama discussioni classiche della letteratura sull’AI, compreso il paradosso delle graffette evocato dal filosofo Nick Bostrom.

Dati interni di Anthropic sul ruolo crescente di Claude

Nella documentazione inviata dall’istituto, Anthropic afferma che il contributo di Claude al codice in produzione è salito a oltre 80% a maggio 2026. Prima del lancio in research preview di Claude Code, nel febbraio 2026, quella quota era stimata in “low single digits“. Queste cifre riguardano le linee integrate nel codebase produttivo e non soltanto script sperimentali.

Accelerazione della produttività e durata dei task

L’azienda segnala che gli ingegneri oggi producono in media otto volte più codice per trimestre rispetto al periodo 2026-2026, grazie anche all’uso interno di Claude. Parallelamente, la capacità dei modelli di completare compiti in autonomia sembra essere aumentata: Anthropic riporta che il tempo medio dei task raddoppia ora circa ogni quattro mesicontro un ritmo precedente indicato attorno ai sette mesi.

Per rendere la traiettoria più concreta, il documento cita versioni specifiche di Claude: Claude Opus 3 avrebbe gestito task equivalenti a circa quattro minuti di lavoro umano nel marzo 2026; Claude Sonnet 3.7un anno dopo, arriverebbe a gestire attività pari a circa un’ora e mezzaClaude Opus 4.6nel 2026, a compiti da circa dodici ore. Un esperimento di ottimizzazione del codice mostrerebbe inoltre un miglioramento dalla scala di circa 3x nel 2026 a circa 52x nel 2026 su task sperimentali ben definiti.

Perché Anthropic chiede una pausa e quali rischi evidenzia

L’appello non sostiene che la soglia dell’auto-miglioramento sia già stata superata: Anthropic precisa che quella condizione «non è inevitabile». Tuttavia, sottolinea che la soglia potrebbe essere raggiunta prima che istituzioni e normative siano pronte a gestirla. Il rischio temuto è che, se i modelli partecipano sempre più attivamente alla progettazione dei loro successori, si attivi un circuito di accelerazione in cui la variabile limitante non è più l’ingegno umano ma risorse come calcolo, energia e infrastrutture.

Governance, verificabilità e incentivi

La società richiama il problema della verificabilità di una sospensione: mentre sistemi fisici come impianti possono essere sorvegliati, i training run possono essere distribuiti, mascherati o spostati in cloud e in giurisdizioni diverse. Anthropic paragona la complessità del controllo a regimi di controllo degli armamenti, evidenziando però che l’AI è più difficile da monitorare perché le risorse impiegate sono spesso di uso generale.

Per questo la proposta è esplicitamente per una pausa coordinata e verificabile tra laboratori di frontiera in più Paesi, non una sospensione unilaterale. Senza meccanismi di verifica condivisi, un rallentamento isolato potrebbe trasformarsi in svantaggio competitivo per chi rispetta l’accordo.

Divisioni nella comunità scientifica e contesto politico

Il documento arriva in un contesto di forte dibattito: Anthropic e figure come i suoi firmatari ritengono plausibile una traiettoria verso capacità vicine all’AGI e sono quindi cauti; altri ricercatori ritengono invece che gli attuali grandi modelli linguistici siano strutturalmente insufficienti per raggiungere l’intelligenza generale. Sul piano politico, la richiesta assume rilevanza perché, se le autorità pubbliche privilegiano l’autoregolazione, l’unica alternativa per limitare i rischi diventa un accordo volontario tra aziende.

Anthropic indica la necessità di definire chiaramente quali soglie attivano la pausa, quali attività devono fermarsi, chi verifica e con quali criteri si torna a sviluppare. L’istituto si propone di lavorare con policy maker, ricercatori e società civile per studiare sistemi di coordinamento e deliberazione, ma rimarca che il salto dall’indirizzo alla pratica resta ampio.

In sintesi, l’appello di Anthropic riassume una doppia constatazione: i modelli stanno già trasformando il lavoro di programmazione e ricerca, e questa trasformazione rende urgente discutere meccanismi di governance credibili per evitare scenari di accelerazione fuori controllo.

Autore

Susanna Riva

Susanna Riva osserva Bologna dalla finestra dell’Archivio di Stato dove una volta ha passato una settimana a consultare faldoni sulle cooperative cittadine: quel documento segnò la scelta editoriale di approfondire responsabilità istituzionali. Tiene linea critica nella redazione, amante del caffè lungo e del taccuino sempre pieno.