Ant di Jack Ma fa la guerra a Nvidia e all’intelligenza artificiale americana
Ant, la società cinese di servizi finanziari fondata da Jack Ma, ha detto di aver sviluppato dei modelli di intelligenza artificiale a basso costo utilizzando microchip cinesi. Tutti i dettagli.

Ant, la società cinese di servizi finanziari fondata da Jack Ma, ha detto di aver sviluppato dei modelli di intelligenza artificiale a basso costo utilizzando microchip cinesi. Tutti i dettagli
Ant Group, la società cinese di servizi finanziari fondata da Jack Ma e legata alla compagnia tecnologica Alibaba, ha detto di aver utilizzato dei microchip prodotti in Cina per sviluppare dei metodi per l’addestramento dei modelli di intelligenza artificiale a basso costo.
COS’È IL MIXTURE OF EXPERTS
Stando alle informazioni riportate da Bloomberg, Ant ha utilizzato chip di Alibaba, Huawei e di altre aziende cinesi per l’addestramento di modelli utilizzando un metodo di machine learning chiamato “Mixture of Experts”. Spiegato semplicemente, questo tipo di architettura divide un modello di intelligenza artificiale in più sottoreti separate e specializzate (chiamate “esperti”) per eseguire insieme un compito.
Il vantaggio dell’approccio “Mixture of Experts” è che permette ai grandi modelli di ridurre i costi di elaborazione dei dati. Lo svantaggio è che richiede dei microchip ad alte prestazioni.
ARM PUNTA SU AMD E SUI MICROCHIP CINESI
Pare che i microchip cinesi abbiano permesso ad Ant di ottenere risultati paragonabili a quelli dei processori H800 di Nvidia, l’azienda (statunitense) dominante nel settore. L’H800 è la versione “depotenziata” dell’H100, uno dei prodotti di punta di Nvidia, che è stata sviluppata appositamente per il mercato cinese, vista l’impossibilità di vendervi i chip più performanti a causa dei controlli commercial imposti dal governo degli Stati Uniti.
Ant continua comunque a usare i chip di Nvidia, ma si sta affidando sempre di più a quelli domestici e a quelli della statunitense Advanced Micro Devices (Amd). A detta dell’azienda – mancano, però, delle verifiche indipendenti di questa affermazione -, i suoi modelli hanno prestazioni migliori di Llama di Meta, in alcuni ambiti.
COSA FA LA CINA SULL’INTELLIGENZA ARTIFICIALE
La notizia racconta due cose: che, specialmente dopo DeepSeek, le aziende cinesi di intelligenza artificiale stanno puntando sull’efficienza operativa, in modo da ridurre i costi (miliardari) di addestramento dei modelli ed emanciparsi (in parte) dalla tecnologia straniera; e che la Cina sta continuando a lavorare alla sostituzione dei microchip importati con alternative nazionali.
Se questo approccio orientato all’efficienza dovesse imporsi a livello internazionale, riducendo quindi la domanda di processori sempre più potenti, il business modell di Nvidia potrebbe venire danneggiato. Ecco perché l’amministratore delegato Jensen Huang ha voluto sottolineare che anche l’avvento di modelli di intelligenza artificiale più efficienti farà crescere la domanda di potenza di calcolo: di conseguenza, le aziende avranno bisogno di microchip migliori in modo da generare profitti maggiori, anziché di microchip economici per contenere i costi.
COSA FARÀ ANT CON I SUOI MODELLI?
Ant afferma che sono necessari circa 6,3 milioni di yuan (880.000 dollari) per addestrare mille miliardi di token utilizzando dei processori avanzati; seguendo il suo metodo e impiegando hardware meno performanti, però, si riesce a far scendere i costi a 5,1 milioni di yuan. Con token si intendono le unità di informazione che vengono fornite al modello di intelligenza artificiale affinché “impari” e possa rispondere alle domande degli utenti.
La società ha intenzione di utilizzare i suoi modelli linguistici, chiamati Ling-Plus e Ling-Lite, nelle applicazioni di servizi finanziari e sanitari. Ad esempio, di recente Arm ha acquisto la piattaforma cinese Haodf e creato un assistente virtuale per affiancare i medici nella gestione delle cartelle cliniche dei pazienti; possiede inoltre un’app di life assistant basata sull’intelligenza artificiale, chiamata Zhixiaobao, e un servizio di consulenza finanziaria chiamato Maxiaocai.
I due modelli Ling sono open source. Ling-Lite contiene 16,8 miliardi di parametri e Ling-Plus 290 miliardi: per fare un confronto, R1 di DeepSeek ha 671 miliardi di parametri e Gpt-4.5 di OpenAi ha 1800 miliardi di parametri. Al di là dei “volumi” differenti, pare che i modelli di Ant abbiano dei problemi di stabilità e che anche piccole modifiche nell’hardware o nella struttura possano portare a errori.