DeepSeek R1 "ragiona" quasi come o1 di OpenAI, ma a una frazione del costo

La startup cinese DeepSeek ha lanciato un nuovo LLM open-source chiamato DeepSeek-R1, che si basa sul modello avanzato DeepSeek V3. L’R1 raggiunge prestazioni simili al modello di punta di OpenAI (o1) in compiti di matematica, programmazione e ragionamento, offrendo però un costo significativamente inferiore (addirittura, il 90-95% in meno).

DeepSeek-R1 rappresenta un’importante evoluzione nell’ambito open-source, dimostrando che i modelli aperti stanno riducendo il divario con quelli commerciali chiusi nella corsa verso l’intelligenza generale artificiale (AGI). La startup cinese ha anche utilizzato R1 per migliorare le prestazioni di sei modelli Llama e Qwen, portandoli a superare modelli di maggiori dimensioni come GPT-4o e Claude 3.5 Sonnet in benchmark matematici selezionati.

DeepSeek-R1 è il risultato di una combinazione tra apprendimento per rinforzo (RL) e apprendimento supervisionato. Inizialmente, DeepSeek aveva sviluppato un prototipo chiamato R1-Zero, addestrato esclusivamente con RL per evolversi autonomamente e risolvere problemi complessi attraverso processi di prova ed errore. Tuttavia, il modello iniziale presentava problemi di leggibilità e mescolanza linguistica.

Per risolvere queste criticità, DeepSeek ha implementato un processo multistadio che include un fine-tuning iniziale con dati supervisionati, un lteriore addestramento con RL per migliorare le capacità di ragionamento e, infine, la creazione di nuovi dati supervisionati tramite il rejection sampling e successiva ottimizzazione del modello.

Come già accennato, DeepSeek-R1, utilizzabile come DeepThink sulla piattaforma chat di DeepSeek e tramite API, non solo offre prestazioni elevate, ma lo fa a un costo accessibile. I costi per token sono infatti significativamente inferiori rispetto a quelli di OpenAI o1:

0,55 dollari per milione di token in input rispetto ai 15 dollari di o1
2,19 dollari per milione di token in output contro i 60 dollari di o1

Anche grazie a questo fattore, DeepSeek-R1, disponibile per sviluppatori e ricercatori su Hugging Face con licenza MIT, rappresenta sia un’importante vittoria per l’open-source, sia una sfida diretta della Cina ai leader tech statunitensi nel settore dell’intelligenza artificiale.

DeepSeek R1 “ragiona” quasi come o1 di OpenAI, ma a una frazione del costo

Francesco Destri