DeepSeek R2 imminente, pronto a stupire di nuovo il settore AI | Rumor

Potrebbe essere potente il doppio di R1 e avere costi praticamente irrisori rispetto a ChatGPT.

Apr 27, 2025 - 12:00
 0
DeepSeek R2 imminente, pronto a stupire di nuovo il settore AI | Rumor

Pare che DeepSeek sia al lavoro sul sequel del modello AI che ha dato un significativo scossone al settore, con la sua incredibile efficienza e (relativamente) scarsa richiesta di risorse hardware. Il modello dovrebbe chiamarsi semplicemente R2, e potrebbe arrivare piuttosto presto - quando, con precisione, non è dato saperlo, almeno per ora. Le indiscrezioni provenienti dalla Cina sono comunque tali da prevedere un altro grosso scossone:

  • Architettura MoE (Mixture of Experts) ibrida, un’evoluzione della MoE di DeepSeek R1
  • Doppio numero di parametri rispetto a R1: 1.200 miliardi
  • Costi token: -97,2% rispetto a GPT-4 (0,07 dollari per milione di token di input e 0,27 dollari per milione di token di output)
  • Il modello occuperà l’82% del cluster di chip di Huawei Ascend 910B, con potenza di elaborazione pari a 512 PetaFLOPs con precisione FP16