Scopri i nuovi modelli open weight di OpenAI: cosa significano per il futuro dell’IA

OpenAI ha rilasciato nuovi modelli open weight che promettono di rivoluzionare il mondo degli LLM. Scopri cosa c'è dietro questo importante annuncio e come sta cambiando il panorama dell'IA.

Ad agosto, OpenAI ha annunciato il rilascio dei primi modelli open weight della sua storia recente. Questo passo ha attirato l’attenzione della comunità tech, ma il clamore è stato rapidamente oscurato dall’arrivo di GPT-5. Tuttavia, questo sviluppo è fondamentale per il futuro dei modelli linguistici di apprendimento profondo (LLM).

Importanza dei modelli open weight

Il rilascio di questi nuovi modelli rappresenta un momento cruciale nel mondo dell’intelligenza artificiale. Finora, OpenAI ha dominato il panorama con il suo ChatGPT, ma i modelli open weight meritano attenzione. L’ultimo modello open risaliva a GPT-2, rendendo necessaria questa evoluzione.

OpenAI ha già rilasciato modelli come Whisper e CLIP, ma nulla di paragonabile a quelli orientati alla conversazione. I nuovi modelli sono disponibili su piattaforme come Hugging Face e Ollama, facilitando l’accesso per chi desidera sperimentarli. Questi modelli non sono di serie B: i benchmark dimostrano che possono competere con i modelli più avanzati di OpenAI, come gli o3 e o4-mini.

È sorprendente notare come anche il modello più piccolo di questi open weight superi modelli precedentemente considerati tra i migliori. Ciò solleva interrogativi sull’idea che solo i modelli più grandi siano i più efficaci.

Architettura innovativa per prestazioni superiori

Un aspetto interessante di questi modelli è l’architettura denominata Mixture of Experts. Solo una parte dei pesi viene attivata durante l’esecuzione, riducendo il carico computazionale. Questo approccio è stato reso popolare dalla compagnia Mistral con il suo modello da 56B, ma OpenAI ha elevato questo concetto con un numero maggiore di esperti.

Le dichiarazioni di Altman suggerivano che molte persone sarebbero rimaste deluse dall’architettura dei modelli rilasciati, ma i modelli open weight stanno dimostrando un potenziale significativo.

Per provare questi modelli, si possono utilizzare ambienti come Ollama o LM Studio. Testando il modello 20B su un laptop ARM con uno Snapdragon X, si sono ottenute prestazioni sorprendenti, con risposte più accurate rispetto ad altri modelli open testati in precedenza.

Qualità delle risposte e applicazioni pratiche

Un anno fa, si testava il modello o1-mini e ora è possibile ottenere risposte simili su un laptop senza connessione internet. Per esempio, si è ricevuta una risposta corretta e rapida riguardo all’organizzazione di viaggi per trasportare casse di pesci, simile a quanto avviene con i modelli più potenti.

Questi modelli stanno guadagnando popolarità tra coloro che lavorano con dati provenienti da vector database, grazie alla loro capacità di interpretare le informazioni secondo l’architettura RAG. Questo rappresenta un significativo progresso nel campo dell’IA.

In conclusione, i modelli open weight di OpenAI non solo si sono rivelati più rilevanti del previsto, ma offrono anche uno sguardo sui futuri sviluppi dei modelli interni di OpenAI. Questi modelli potrebbero rappresentare solo la punta dell’iceberg di ciò che si prevede nel mondo dell’intelligenza artificiale.

Scritto da AiAdhubMedia

Il potere emergente della Cina nel settore tecnologico