Las grandes empresas de computación han formado un consorcio para definir un nuevo estándar abierto para interconectar los aceleradores de IA. NVIDIA no fue invitada a formar parte del grupo a pesar de ser, con diferencia, el mayor proveedor de GPU de IA.
Los centros de datos de IA necesitan mover cantidades ingentes de datos con una latencia muy baja. El procesamiento de datos de gran ancho de banda en las GPU es extremadamente rápido, pero el reto consiste en transferir datos dentro de los clústeres de estos aceleradores de IA y entre ellos dentro de los centros de datos.
NVIDIA ha creado NVLinkNVLink, su propia interconexión de alta velocidad diseñada específicamente para la comunicación entre sus GPU. El problema es que NVLink es propietario, por lo que sólo funciona con GPUs NVIDIA.
AMD, Broadcom, Cisco, Google, Hewlett Packard Enterprise (HPE), Intel, Meta y Microsoft han anunciado la creación del Grupo Promotor de Ultra Accelerator Link. El objetivo del grupo es definir y promover un estándar abierto denominado Ultra Accelerator Link, o UALink.
La idea es que el sector adopte UALink como solución estándar para la transferencia de datos de gran ancho de banda y baja latencia entre aceleradores de IA en centros de datos.
Esfuerzos similares para estandarizar protocolos han sido esenciales para la industria tecnológica en el pasado. Gracias a estándares abiertos como el bus PCI, Ethernet o TCP/IP, el hardware y el software de distintos fabricantes pueden conectarse entre sí.
Este puede ser en parte el motivo por el que NVIDIA no fue invitada a la fiesta. Si el consorcio de empresas tecnológicas consigue acordar un estándar de red abierto que no esté influenciado por la tecnología de NVIDIA, podría romper el cuasi monopolio que NVIDIA parece tener.
AMD y Intel son competidores directos de NVIDIA en el mercado de las GPU, y Microsoft y Google están desarrollando su propio hardware de IA.
"Una especificación de la industria se vuelve crítica para estandarizar la interfaz para aplicaciones de IA y Machine Learning, HPC (computación de alto rendimiento) y Cloud para la próxima generación de centros de datos e implementaciones de IA", dijo el consorcio en un comunicado.
Se espera que la versión 1.0 de UALink esté lista para el tercer trimestre de 2024 y se pondrá a disposición de las empresas que se unan al consorcio Ultra Accelerator Link (UALink).
La ausencia de NVIDIA no significa necesariamente que quede excluida de forma permanente. El consorcio podría decidir darles la bienvenida en el futuro, y NVIDIA podría optar por adoptar UALink si hay una aceptación generalizada en el sector.