Генеральный директор NVIDIA Дженсен Хуанг (Jensen Huang) выступил на открытии тайваньской выставки Computex 2024, чтобы представить технологии следующего поколения и дорожную карту, по которой компания будет двигаться, чтобы стать ведущей аппаратной платформой ИИ.
Темой его выступления стало "Ускорение всего", и Хуанг представил новые чипы, более быстрые сети ИИ и амбициозную дорожную карту развития. От ПК с искусственным интеллектом до огромных фабрик с искусственным интеллектом - NVIDIA хочет стать проводником того, что будет дальше с искусственным интеллектом.
"Будущее вычислений ускоряется", - сказал Хуанг. "Благодаря нашим инновациям в области искусственного интеллекта и ускоренных вычислений мы расширяем границы возможного и стимулируем следующую волну технологического прогресса".
Вот краткий обзор некоторых анонсов:
Новые чипы
Графические процессоры Blackwell еще не сошли с конвейера, но Хуанг говорит, что мы уже можем ожидать обновленный графический процессор Blackwell Ultra в конце этого года. Он сказал, что в соответствии с дорожной картой развития NVIDIA каждый год будет выпускаться новое семейство чипов.
"Наша компания придерживается годичного ритма. Наша основная философия очень проста: построить весь масштаб центра обработки данных, разделить его на части и продавать их с периодичностью раз в год, а также довести все до технологических пределов", - объясняет Хуанг.
Хуанг объявил, что в 2026 году его платформа Rubin придет на смену семейству GPU Blackwell.
Фабрики искусственного интеллекта
Хуанг назвал несколько вычислительных компаний, которые создадут "фабрики ИИ", обеспечивающие облачные, локальные, встраиваемые и пограничные системы ИИ с помощью графических процессоров и сетей NVIDIA.
Хуанг сказал: "Следующая промышленная революция началась. Компании и страны сотрудничают с NVIDIA, чтобы перевести традиционные центры обработки данных стоимостью в триллион долларов на ускоренные вычисления и построить новый тип центров обработки данных - фабрики ИИ - для производства нового товара: искусственного интеллекта".
NVIDIA MGX (Modular Server Reference Architecture) - это проект для создания серверов центров обработки данных, ориентированный на ускоренные вычисления. Она использует стандартизированный подход для создания серверов с помощью продуктов NVIDIA, что значительно упрощает создание таких фабрик ИИ.
NVIDIA Spectrum-X
NVIDIA использует NVLink для перемещения данных между GPU, но перемещение данных между GPU-подами внутри или между центрами обработки данных представляет собой дополнительную проблему.
NVIDIA Spectrum-X - это первая в мире сетевая платформа Ethernet, специально созданная для повышения производительности рабочих нагрузок ИИ. Естественно, NVIDIA Spectrum-X оптимизирована для аппаратного обеспечения NVIDIA.
NVIDIA утверждает, что Spectrum-X ускоряет производительность сети генеративного ИИ в 1,6 раза по сравнению с традиционными сетями Ethernet.
На прошлой неделе мы сообщали, что вычислительные компании Большого технологического института работают над созданием Открытый ускоренный сетевой стандарт ИИ без участия NVIDIA.
Тем не менее, по словам Хуанга, Spectrum-X уже используется такими компаниями, как Dell Technologies, Hewlett Packard Enterprise и Lenovo.
NIM
NVIDIA NIM, что расшифровывается как NVIDIA Inference Microservices, - это набор инструментов, предназначенных для упрощения и ускорения развертывания генеративных моделей ИИ.
Прежде чем использовать модель ИИ, разработчикам нужно ее развернуть. Вместо того, чтобы возиться с деталями этого процесса, NVIDIA NIM упрощает развертывание, автоматически контейнируя модели ИИ и оптимизируя их для аппаратного обеспечения NVIDIA.
Это как разница между покупкой и сборкой всех ингредиентов для блюда и запеканием готового блюда в духовке.
Хуанг объявил, что NIM Llama 3 теперь доступна для бесплатной загрузки разработчикам. Хуанг также представил NIMs Nvidia Ace, включающий модель Digital Human, способную генерировать модели людей AI с реалистичной кожей.
Вы можете посмотреть полный текст выступления, чтобы узнать больше подробностей о ПК и ноутбуках на базе AI RTX, робототехнической платформе Isaac ROS 3.0 от Nividia и о том, как фабрики используют технологии NVIDIA для создания цифровых двойников на своих предприятиях для обучения роботов.