Huawei AI CloudMatrix 384, el sistema de China que destroza a EE.UU. y NVIDIA: 70% más rápido, 3,6 veces más memoria y 2,1 veces más ancho de banda

NVIDIA sigue su curso dominando el sector de la IA y el hardware a nivel mundial, no sin problemas, retrasos e inconvenientes en sus sistemas e infraestructuras, lo cual, está provocando retrasos. Sus NVL72 basados en las GPU GB200 se agotan casi anualmente, las reservas de producción están completas, hay que esperar a 2026 o La entrada Huawei AI CloudMatrix 384, el sistema de China que destroza a EE.UU. y NVIDIA: 70% más rápido, 3,6 veces más memoria y 2,1 veces más ancho de banda aparece primero en El Chapuzas Informático.

Abr 16, 2025 - 21:34
 0
Huawei AI CloudMatrix 384, el sistema de China que destroza a EE.UU. y NVIDIA: 70% más rápido, 3,6 veces más memoria y 2,1 veces más ancho de banda

NVIDIA sigue su curso dominando el sector de la IA y el hardware a nivel mundial, no sin problemas, retrasos e inconvenientes en sus sistemas e infraestructuras, lo cual, está provocando retrasos. Sus NVL72 basados en las GPU GB200 se agotan casi anualmente, las reservas de producción están completas, hay que esperar a 2026 o a Vera Rubin con las GB300 para hacerse con uno de estos sistemas para IA. Entre tanto, China tiene cortado el suministro de hardware y solo tiene a Huawei para competir y no quedarse demasiado atrás frente a EE.UU., pero entonces, ¿qué pueden hacer realmente? Pues destrozar a sus grandes rivales con lo que acaban de presentar: AI CloudMatrix 384.

¿Cómo que destrozar? Pero ¡si van por detrás y por mucho! Es cierto... A medias. La parte que es totalmente verdad es que la Ascend 910C como GPU no puede rivalizar con la GB200, no digamos con la nueva GB300 presentada hace no tanto. Entonces, ¿qué película estamos viendo exactamente? Pues que la arquitectura y microarquitectura están muy bien, pero al final, la ventaja la da la unión de estos sistemas de GPU, y ahí China acaba de romper todas las tablas.

Huawei AI CloudMatrix 384, la respuesta de China a los NVL72 de NVIDIA resulta ser mucho más rápido

Huawei-AI-CloudMatrix-384-sistema-de-IA-de-China-para-competir-con-NVIDIA

La palabra clave aquí es, como ya viene siendo habitual, exascala. China pierde individualmente, pero cuando se habla de escala de rack ha conseguido superar a NVIDIA y EE.UU., con su propio hardware y tecnología, pese a que en parte usaba chips de TSMC (ya no, les pillaron). Todo este entramado es sencillo de comprender cuando sabemos que este AI CloudMatrix 384 se compone de nada menos que 384 GPU Ascend 910C conectadas con topología interna all-to-all.

Según los datos de Semianalysis, lo presentado por China refleja una matemática básica de sumatoria: tener por cada sistema 5 veces más GPU que ofrezcan sobre un tercio del rendimiento individual de las de NVIDIA con arquitectura Blackwell compensa en rendimiento y les posiciona por delante.

La comparativa no miente. chip por chip China está muy por detrás de NVIDIA, solo igualándoles en Scale Out Bandwidth con 400 GB/s, mientras que en TFLOPS solo consiguen un tercio del rendimiento. Cuando se compara el sistema al completo todo cambia.

El rendimiento es de otro planeta, NVIDIA tendría que duplicar sus GPU por rack para superarles

Comparativa-Ascend-910C-vs-GB200-y-AI-CloudMatrix-384-vs-NVL72

La tabla no engaña: 180 PFLOPS vs 300, y sí, son 5 veces más GPU, el consumo se dispara a más del doble, pero eso poco importa en China ahora mismo cuando el objetivo es competir por la carrera de la IA. El Huawei AI CloudMatrix 384 es un 70% más rápido a nivel de sistema completo que el NVIDIA NVL72, tiene 3,6 veces más memoria HBM disponible y consigue 2,1 veces el ancho de banda en memoria.

Hay un dato clave que, siendo China, no es tan preocupante: la potencia en BF16 dense por FLOP, medida lógicamente en vatios por TFLOP. Ahí los verdes machacan a Huawei con 2,3 veces la potencia por FLOP, 1,8 veces peor ratio de W por TB/s en ancho de banda de memoria y 1,1 veces peor potencia por TB en HBM.

Huawei-AI-CloudMatrix-384-arquitectura

Viendo los datos, decimos que no es tan preocupante, porque, aunque consume mucho más para posicionarse por delante, China no aplica un límite de energía a la IA en ningún aspecto, mientras que en EE.UU. y Europa sí que lo hay. Por último, sabemos que este AI CloudMatrix 384 se distribuirá en 16 racks, cada uno con 32 GPU, albergando en su seno 4 rack de switches escalables conectados con cables ópticos a modo de transceptores LPO 400G, concretamente con 6.912 de ellos.

Por tanto, China sigue en la pelea por la IA con Huawei y sus AI CloudMatrix 384, todo pese a estar por detrás en nodos litográficos, arquitectura, consumo y rendimiento individual, donde la mentalidad del país se ve reflejada en este sistema del "todos a una".

La entrada Huawei AI CloudMatrix 384, el sistema de China que destroza a EE.UU. y NVIDIA: 70% más rápido, 3,6 veces más memoria y 2,1 veces más ancho de banda aparece primero en El Chapuzas Informático.