Nvidia строит «самый мощный в мире» ИИ-суперкомпьютер
Компания Nvidia объявила о создании новых GPU и CPU для особо высокопроизводительных вычислений и пообещала построить самый производительный суперкомпьютер для решений, связанных с искусственным интеллектом.
Архитектура имени Грейс Хоппер
Компания NVidia анонсировала целый ряд новых технологий, ориентированных на использование в сфере искусственного интеллекта. В первую очередь, это новая кремниевая архитектура Hopper, созданный на её основе GPU H100 и «суперпроцессор» Grace CPU. Анонсированы также планы по созданию «самого производительного ИИ-суперкомпьютера» Eos.
Новая архитектура и суперпроцессор названы в честь контр-адмирала ВМФ США Грейс Хоппер (Grace Hopper), создательницы первого в истории компилятора компьютерного языка программирования и одного из первых высокоуровневых языков программирования COBOL.
Архитектура Hopper и GPU H100 призваны радикально ускорить процесс обучения машинных моделей.
Слишком медленно
На сегодняшний день в ИИ-отрасли высокой популярностью пользуется система обучения Transformer, на основе которой созданы, в частности, языковая модель OpenAI GPT-3 и медицинская модель DeepMind AlphaFold. При этом количество параметров в таких моделях растёт по экспоненте: если в 2019 г. языковая модель GPT-2 насчитывал 1,5 млрд параметров, то через два года сходная модель насчитывала уже 1,6 трлн параметров.
Nvidia объявила о создании новых GPU и CPU для особо высокопроизводительных вычислений и пообещала построить самый производительный суперкомпьютер для работы с искусственным интеллектом
Обучение таких систем может занимать от нескольких недель до нескольких месяцев.
Более того, как отметил старший директор по продукции Nvidia Пареш Кхарья (Paresh Kharya), можно пытаться увеличивать количество GPU в центре обработки данных, но с определённого момента прирост производительности останавливается.
Благодаря использованию H100, однако, время обучения может сократиться в шесть раз, по сравнению с процессорами предыдущих поколений.
Высокопроизводительная шина NVLink четвёртого поколения позволяет соединять до 256 GPU H100, обеспечивая девятикратный прирост пропускной способности, по сравнению с предыдущими поколениями.
Сам по себе процессор H100 содержит 80 млрд транзисторов. Это первый графический процессор, поддерживающий PCIe Gen5 и HBM3; благодаря этому пропускная способность памяти достигает 3 терабайт в секунду. В Nvidia утверждают, что H100 в три-шесть раз превосходит процессор предыдущего поколения A100 в вычислениях с плавающей запятой в зависимости от разрядности.
Без вредоносных рассылок: «Азбука вкуса» импортозаместила ИБ-решение
Импортонезависимость
Что касается Grace CPU, то это фактически два процессора, соединённых шиной NVLink-C2C. Grace предназначен для использования в «гипермасштабных высокопроизводительных вычислениях и сфере ИИ» в комплекте с H100 или самостоятельно. Процессор насчитывает 144 ядер Arm, а его пропускная способность составляет 1 терабайт в секунду.
Nvidia также анонсировала обновления к своим программным сервисам, связанным с ИИ, в том числе Maxine, SDK для виртуальных аватаров, и Riva — для обработки текста и речи.
Самый производительный суперкомпьютер
Помимо этого Nvidia планирует создать самый высокопроизводительный ИИ-суперкомпьютер Eos, который будет построен на основе архитектуры Hopper. Для его строительства задействуют 4600 GPU H100, что обеспечит «ИИ-производительность» около 18,4 экзафлопсов.
Система, впрочем, будет использоваться только для собственных исследований внутри Nvidia, но станет образчиком для последующего создания ИИ-систем для сторонних заказчиков.
«Новые модели машинного обучения с триллионами параметров требуют принципиально новых мощностей, чтобы оставаться практичными, а следовательно необходимы новые вычислительные архитектуры и оборудование, — указывает Дмитрий Гвоздев, генеральный директор компании «Информационные технологии будущего». — Nvidia разрабатывает новые процессоры с прицелом на одну из самых популярных и востребованных систем машинного обучения — Transformer; это для неё, возможно, наименее рисковый путь развития, обеспечивающий ей сохранение лидерства в сфере технологий, связанных с высокопроизводительными вычислениями и ИИ».
NVIDIA анонсировала платформу для суперкомпьютеров, десктопный процессор на базе ARM и фреймворк для кибербезопасности
Привет, Хабр! На конференции NVIDIA GTC состоялась презентация новинок компании. Главный её итог заключается в том, что производитель видеокарт не только настроен укреплять позиции по части искусственного интеллекта, но и захватывать рынок процессоров. Под катом — самое интересное и горячее из показанного сегодня.
ARM-процессор для ИИ и высокопроизводительных вычислений
Как сообщает компания, в этих задачах новый чип NVIDIA Grace обеспечит 10-кратный прирост к производительности большинства самых быстрых серверов. ЦП рассчитан на NLP, рекомендательные системы и построение суперкомпьютерных центров для ИИ. Все эти задачи связаны с анализом огромных массивов данных. Для этого нужны сверхбыстрые вычисления и большой объем памяти.
В компании говорят, что в NVIDIA Grace есть не только энергоэффективные ядра ARM, но и новая подсистема памяти с низким энергопотреблением. Благодаря этому удалось добиться высокой производительности и малого энергопотребления.
Первыми владельцами процессора станут Швейцарский национальный суперкомпьютерный центр (CSCS) и Лос-Аламосская национальная лаборатория. Они запустят мейнфреймы на Grace, построенные Hewlett Packard Enterprise, в 2023 году.
«Самый мощный в мире суперкомпьютер с поддержкой искусственного интеллекта»
Швейцарский компьютер ALPS будет использоваться для исследований климата и погоды, физики и естественных наук. Ещё среди его потенциальных задач материаловедение, астрофизика, вычислительная гидродинамика, молекулярная динамика, квантовая химия, физика элементарных частиц, экономика и социальные науки.
Создатели обещают, что в сравнении с нынешним лидером в области ИИ — системой MLPerf — этот мейнфрейм обеспечит 7-кратное расширение возможностей. ALPS заработает к 2023 году и заменит суперкомпьютер Piz Daint. Доступ к мощностям системы откроют для исследователей со всего мира.
DPU Bluefield-3 для работы с инфраструктурой ЦОД
NVIDIA анонсировала свой новый DPU (Data Processing Unit, используется для ускорения операций в сети, хранении и безопасности). Компания сделала акцент на том, что это первый чип в своём классе, спроектированный специально для искусственного интеллекта и ускоренных вычислений.
В NVIDIA говорят, что применение чипа поможет разворачивать приложения в любом масштабе и улучшать безопасность ЦОД. Bluefield-3 оптимизировали для многопользовательских облачных сред. Один такой DPU по производительности эквивалентен 300 ядрам CPU и поможет освободить ресурсы процессора для других задач.
ARM-платформа для ПК, облачных, высокопроизводительных и edge-вычислений
Эту платформу разрабатывают, чтобы поддержать разработку научных приложений и искусственного интеллекта. По плану, её использование должно улучшить функции видеоаналитики и безопасности в edge-системах и создать новый класс ПК на базе ARM с видеокартами NVIDIA RTX.
Вдобавок к анонсу платформы NVIDIA представила комплект разработчика ARM HPC. В него входит:
- процессор Ampere Altra с 80 ядрами ARM Neoverse на частоте до 3,3 ГГц;
- два GPU NVIDIA A100 с производительностью в глубоком обучении FP16 в 312 терафлопс у каждого;
- два DPU NVIDIA BlueField-2, для ускорения операций в сети, хранении и безопасности.
Разработчики уже могут подать заявку на ранний доступ к новому железу. Его начнут рассылать в третьем квартале 2021 года.
NVIDIA Morpheus — решение для внедрения ИИ в индустрию кибербезопасности
Morpheus — фреймворк на базе GPU NVIDIA и DPU BlueField. Компания обещает, что внедрение этого решения позволит специалистам по кибербезопасности разрабатывать системы, способные «мгновенно» обнаруживать уязвимости.
В основе фреймворка — машинное обучение. Оно позволяет находить и предотвращать угрозы и аномалии. Среди них — утечки конфиденциальных данных, фишинговые атаки и вредоносное ПО.
NVIDIA обещает, что Morpheus в паре с чипами BlueField превращает каждый вычислительный узел в сети в датчик киберзащиты. Это позволяет анализировать все пакеты со скоростью линии без репликации данных. Оставить заявку на ранний доступ к платформе можно уже сейчас.
- Производство и разработка электроники
- Компьютерное железо
- Искусственный интеллект
- Суперкомпьютеры
- IT-компании
Источник https://www.cnews.ru/news/top/2022-03-25_nvidia_stroit_samyj_moshchnyj
Источник https://habr.com/ru/news/552066/