Come misurare il vero costo degli agenti AI in azienda

Un'analisi pratica dei costi operativi degli agenti AI, del concetto di vFTE e delle azioni che CFO, CIO e CHR devono intraprendere

Susanna Riva · 24 Maggio 2026 · 5 min

Come misurare il vero costo degli agenti AI in azienda

Il numero del The Economist del 14 maggio 2026 ha richiamato l’attenzione sul rischio occupazionale collegato all’AI, citando la crescita degli investimenti e obiettivi ambiziosi come quello di Anthropic, che punta a $50 miliardi di ricavi ricorrenti annuali entro giugno. Tuttavia, l’evidenza empirica non mostra ancora un collasso massiccio dei posti di lavoro: una discrepanza che invita a guardare oltre i titoli e ad analizzare il funzionamento economico degli agenti AI in produzione.

Molte imprese scoprono che questi sistemi non si comportano come un semplice prodotto software in licenza. Gli agenti in produzione generano costi variabili legati a consumo token, infrastruttura, integrazione e controllo umano: elementi che trasformano ogni istanza in una voce di spesa operativa piuttosto che in una licenza SaaS a marginalità decrescente. Per comprendere le implicazioni è utile introdurre il concetto di vFTE, o Virtual FTE, che converte il consumo agentico in un equivalente di costo del lavoro digitale.

Perché gli agenti si comportano come forza lavoro

Un software tradizionale ha costi marginali contenuti all’aumentare degli utenti; un workflow agentico no. Un agente non si limita a produrre una risposta: pianifica, esegue task, verifica risultati, richiama altri modelli e consulta memorie persistenti. Ogni passaggio comporta chiamate API e consumo di token, che in implementazioni multi-step possono moltiplicare il costo fino a 20-30 volte rispetto a una singola generazione testuale. Questa dinamica trasforma la misurazione del ritorno in una sfida: la produttività generata non si traduce automaticamente in risparmi immediati sui costi.

Token, iterazioni e code di costo

La scelta del modello ha oggi un impatto economico forte: modelli di punta possono costare decine di volte in più rispetto a versioni economiche della stessa famiglia. In un flusso con più iterazioni, quel differenziale si applica ripetutamente. Inoltre, le distribuzioni di costo non sono simmetriche: analisi su oltre 1.100 esecuzioni mostrano mediane contenute ma percentili estremi molto più alti, con scostamenti che rompono budget costruiti sulla sola media. A questo si somma la previsione di crescita del consumo token su scala globale, che rende la pianificazione finanziaria un tema strategico.

Infrastruttura, integrazione e AgentOps

Oltre al prezzo dei token, esistono componenti ricorrenti: vector database, storage per la memoria persistente, orchestrazione, e layer di AgentOps per osservabilità, monitoraggio anomalie e versionamento dei prompt. Questi elementi aggiungono costi mensili variabili e richiedono competenze per garantire che l’agente resti nei parametri attesi. Sommando API, infrastruttura, integrazione e supervisione umana, il costo di un agente in produzione può oscillare significativamente, rendendo urgente ripensare il modo in cui le aziende contabilizzano queste spese.

Impatto su bilanci e ruoli aziendali

La diffusione degli agenti impone nuove sinergie tra funzioni tradizionalmente separate. Il CFO teme l’imprevedibilità: una voce che può variare da poche migliaia a decine di migliaia di dollari al mese mette in crisi la classificazione contabile tradizionale. Il CIO vede l’architettura come leva di controllo dei costi: la scelta di modelli, il routing tra tier di costo e i limiti di iterazione diventano decisioni finanziarie. Il CHR invece affronta una trasformazione delle attività: il lavoro non sparisce automaticamente, ma si sposta verso revisione, escalation e controllo qualità, soprattutto nei settori regolamentati dove la supervisione umana è obbligatoria.

Coordinamento e fragilità dei business case

Molti business case iniziali trascurano costi di governance e supervisione: l’adozione degli agenti richiede stime sul costo orario della verifica umana, limiti operativi e attribuzione per singolo workflow. Senza questi elementi, il ROI diventa difficile da misurare e i risparmi promessi vengono in parte riassorbiti dalla necessità di creare nuovi layer di controllo. Il risultato sono business case fragili che non reggono all’arrivo delle prime fatture token significative.

Misure pratiche per governare la spesa agentica

Per contenere i rischi è necessario applicare la stessa disciplina con cui si gestiscono i costi cloud. Ogni workflow deve avere una attribuzione di costo chiara e limiti di consumo predefiniti; va definito un routing intelligente verso modelli meno costosi per compiti semplici; e occorre implementare alert e soglie di iterazione prima del go-live. Trattare il budget token come infrastruttura critica e integrare CFO, CIO e CHR nella governance con almeno un mese di anticipo sulla produzione sono passi essenziali.

Adottare il framework vFTE e pratiche operative

Il modello del vFTE facilita il dialogo traducendo costi tecnici in termini comprensibili alle direzioni finanziarie e delle risorse umane. Best practice includono il monitoraggio per workflow, il routing per tipologia di task (classificazione, estrazione, orchestrazione) verso modelli adeguati, e l’implementazione di AgentOps per visibilità continua. Progetti come AITO dimostrano che mettere attorno a un tavolo le funzioni coinvolte anticipa le sorprese contabili e consente di trasformare la produttività degli agenti in valore misurabile.

In sintesi, il dibattito pubblico su AI e lavoro deve essere affiancato da una ricostruzione dei modelli aziendali: finché il costo reale degli agenti resta nascosto nelle fatture, le decisioni saranno prese più sulle aspettative che sui dati operativi. Anticipare la governance e trattare gli agenti come risorse operative è la condizione per governare la spesa invece di subirla.

Autore

Susanna Riva

Susanna Riva osserva Bologna dalla finestra dell’Archivio di Stato dove una volta ha passato una settimana a consultare faldoni sulle cooperative cittadine: quel documento segnò la scelta editoriale di approfondire responsabilità istituzionali. Tiene linea critica nella redazione, amante del caffè lungo e del taccuino sempre pieno.