Guerra tra Intelligenze Artificiali, arriva DeepSeek
Liang Wenfeng, snobbato dai colleghi in un primo tempo, ha creato un successo artificiale
Dalla Cina con furore anche se stavolta ad arrivare non è Bruce Lee ma DeepSeek ovvero l'intelligenza artificiale made in China che sta minancciando ChatGpt e le altre AI.
OpenAi sostiene di aver trovato le prove che la start-up cinese di intelligenza artificiale DeepSeek ha utilizzato i modelli proprietari dell'azienda statunitense per addestrare la sua app mentre crescono le preoccupazioni per una potenziale violazione della proprietà intellettuale. Il produttore di ChatGpt con sede a San Francisco ha dichiarato al 'Financial Times' di aver riscontrato alcune prove di "distillazione".
Questa tecnica, scrive ancora il quotidiano britannico, "viene utilizzata dagli sviluppatori per ottenere prestazioni migliori su modelli più piccoli utilizzando i risultati di modelli più grandi e più capaci, consentendo loro di ottenere risultati simili su compiti specifici a un costo molto inferiore. La distillazione è una pratica comune nel settore, ma il timore era che DeepSeek potesse farlo per costruire un proprio modello concorrente, violando così i termini di servizio di OpenAi.
"Il problema è quando lo si toglie dalla piattaforma e lo si fa per creare un proprio modello per i propri scopi", ha detto una persona vicina a OpenAi. OpenAI ha rifiutato di commentare ulteriormente o di fornire dettagli sulle sue prove. I suoi termini di servizio stabiliscono che gli utenti non possono "copiare" nessuno dei suoi servizi o "utilizzare l'output per sviluppare modelli in concorrenza con OpenAi".
Il modello R1 di DeepSeek ha sorpreso i mercati, gli investitori e le aziende tecnologiche della Silicon Valley. Lunedì le azioni di Nvidia sono scese del 17%, facendo crollare il suo valore di mercato di 589 miliardi di dollari, per il timore che i grandi investimenti nel suo costoso hardware per l'intelligenza artificiale potessero non essere necessari. Martedì il titolo ha recuperato il 9%, insieme ad altri titoli tecnologici.
L'anno scorso OpenAi e il suo partner Microsoft hanno indagato su account ritenuti di DeepSeek che utilizzavano l'interfaccia di programmazione delle applicazioni (Api) di OpenAi e ne hanno bloccato l'accesso per sospetta distillazione che violava i termini di servizio, ha dichiarato un'altra persona a conoscenza diretta.
In precedenza, lo zar dell'Ia e delle criptovalute del presidente Donald Trump, David Sacks, ha affermato che "è possibile" che si sia verificato un furto di proprietà intellettuale. "C'è una tecnica nell'Ia chiamata distillazione... quando un modello impara da un altro modello e in un certo senso succhia la conoscenza dal modello madre", ha detto Sacks a Fox News martedì. "E ci sono prove sostanziali che ciò che DeepSeek ha fatto in questo caso è stato distillare la conoscenza dai modelli di OpenAi, e non credo che OpenAi sia molto felice di questo", ha aggiunto Sacks, anche se non ha fornito prove.
DeepSeek ha dichiarato di aver utilizzato solo 2.048 schede grafiche Nvidia H800 e di aver speso 5,6 milioni di dollari per addestrare il suo modello V3 con 671 miliardi di parametri, una frazione di quanto OpenAi e Google hanno speso per addestrare modelli di dimensioni comparabili. Alcuni esperti hanno affermato che il modello ha generato risposte che indicano che è stato addestrato sui risultati del Gpt-4 di OpenAi, il che violerebbe i suoi termini di servizio.
Gli addetti ai lavori, scrive ancora il 'Ft', affermano che è prassi comune per i laboratori di Ia in Cina e negli Stati Uniti utilizzare i risultati di aziende come OpenAi, che hanno investito nell'assunzione di persone per insegnare ai loro modelli a produrre risposte che sembrino più umane. Si tratta di un'attività costosa e ad alta intensità di manodopera, che spesso viene sfruttata dai piccoli operatori.
“Quando lo abbiamo incontrato per la prima volta, era un tipo molto nerd con un’acconciatura terribile”, parla così un socio in affari di Liang Wenfeng, Ceo e fondatore di DeepSeek, l’intelligenza artificiale cinese che ha sconvolto il settore tech e i mercati finanziari occidentali.
Un successo inaspettato anche, o soprattutto, per via del suo modo di apparire e della sua “pettinatura orribile”: “Parlava di costruire un sistema di calcolo con 10.000 chip per addestrare i suoi modelli. Non lo abbiamo preso sul serio”, aggiunge il socio citato dal Financial Times.
Eppure, Liang Wenfeng aveva già una visione molto chiara del progetto: “Voglio costruirlo e sarà rivoluzionario”.
Liang Wenfeng, il nerd che sconvolto i mercati
Nel 2021 Wenfeng iniziò ad acquistare migliaia di unità di elaborazione grafica Nvidia per il suo progetto di intelligenza artificiale, che era in una fase molto sperimentale. Allora Wenfeng, classe 1985, era un imprenditore di 36 anni poco conosciuto in Cina, praticamente sconosciuto al resto del mondo. Oggi, che di anni ne ha 40, è diventato un orgoglio per la Cina tanto da meritarsi la convocazione del presidente Xi Jinping , che ha riunito i più importanti imprenditori del Dragone. Il Ceo di DeepSeek è stato l’unico invitato del settore Ai.
Il sogno sarebbe potuto finire nel 2022, quando Washington vietò alle aziende cinesi l’accesso a chip di avanguardia come quelli di Nvidia. Wenfeng non si arrese e sviluppò il nuovo modello di Ai spendendo solo 5,6 milioni di dollari. A distanza di tre anni proprio l’abbattimento dei costi avrebbe fatto crollare le certezze occidentali e statunitensi sul settore, anche se l’analisi delle spese sostenute per sviluppare i modelli di DeepSeek è più complessa di quanto venga narrato. E forse la preoccupazione occidentale è eccessiva.
Di certo, i risultati raggiunti da quel progetto nato in Cina con tanta speranza e “poche” risorse ha sorpreso gli stessi soci: “Pensavamo che fosse qualcosa di realizzabile solo da giganti come ByteDance e Alibaba”, ha detto la fonte citata dal Ft.
Liang Wenfeng è nato nel 1985 a Zhanjiang, una città della provincia del Guangdong, in Cina. Le informazioni su di lui sono poche, ma è nota la sua insaziabile curiosità per il mondo tecnologico. L’imprenditore cinese ha conseguito la laurea in ingegneria dell’informazione elettronica presso l’Università di Zhejiang nel 2007, prima di sviluppare esperienza nella computer vision e nei big data iniziare il suo percorso nel mondo della finanza. Prima di DeepSeek, il “tipo molto nerd” aveva già raggiunto interessanti traguardi.
Non solo DeepSeek
Nel 2015, assieme a due soci, Wenfeng ha fondato High-Flyer (Huanfang Quantitative), un hedge fund che ha integrato presto l’intelligenza artificiale per sviluppare l’apprendimento automatico nelle strategie di trading. Dopo soli due anni, nel 2017, l’Ai era diventata fondamentale nelle decisioni di investimento dell’imprenditore anche se il fondo ha vissuto periodi di forte ribasso. Anche in quel caso, come sarebbe successo qualche anno dopo per i chip, il fondatore di DeepSeek non si è demoralizzato: insieme al suo team ha sfruttato la volatilità dei mercati finanziari per perfezionare costantemente i modelli di Ai integrati in High-Flyer. In meno di dieci anni la piattaforma è diventata un gigante del settore informatico e hi-tech in Cina. È proprio da quel fondo, che oggi gestisce circa 8 miliardi di dollari di asset, che nel 2023 Wenfeng ha creato DeepSeek usando le risorse finanziarie per costruire i propri modelli Ai.
La visione era già chiara nella sua mente: “Il nostro obiettivo non è semplicemente costruire un modello, vogliamo ridefinire le regole dell’innovazione”. Una direzione confermata dalla scelta di rendere DeepSeek-V2 open-source: “L’innovazione non si protegge con il segreto, ma con la velocità e la capacità di adattamento”, ha detto in una recente intervista aggiungendo che “OpenAI non può impedire agli altri di recuperare terreno”.
La rivincita dei nerd?
Per decenni, il termine “nerd” è stato usato in modo dispregiativo per descrivere persone ossessionate da interessi ritenuti di nicchia, spesso con scarse abilità sociali. I nerd erano i secchioni, gli smanettoni del computer, gli outsider emarginati dalla cultura dominante. Ma con l’evoluzione della società e l’avvento della rivoluzione digitale, la narrazione è cambiata.
Oggi i nerd non solo dominano l’innovazione tecnologica, ma ridefiniscono anche il concetto stesso di potere economico e culturale.
L’ascesa dell’intelligenza artificiale segna un ulteriore punto di svolta. Se nel XX secolo il successo era associato alla capacità di comandare e gestire risorse fisiche, nel XXI secolo il valore si concentra sulla gestione della conoscenza e sulla capacità di creare sistemi intelligenti. E chi meglio dei nerd può farlo? La loro abilità nel programmare, nell’analizzare dati e nel pensare in modo creativo li mette in una posizione unica per guidare le prossime trasformazioni globali. La Silicon Valley è già piena di ex “sfigati” diventati miliardari, e con l’avanzare dell’Ai questo trend potrebbe intensificarsi. Forse, senza che ce ne rendiamo conto, stiamo entrando in un’era in cui il mondo sarà progettato, gestito e posseduto da chi un tempo veniva deriso per la propria passione. Intanto, Liang Wenfeng si è già preso la sua rivincita.
Commenti