NVIDIA于ISC大会公布多样超算布局，强化与Arm的合作、仅在3周架设DGX SuperPOD伺服器

2019-06-17 18:04:16

近年在全球超级运算领域大放异彩的NVIDIA 在稍早于德国举办的ISC /国际超级运算峰会宣布多项超算领域的布局，包括强化与Arm 在超算的合作，以及针对自动驾驶训练、仅在3 周建设完成并迈入超算TOP 500 榜单中的22 名新AI 伺服器DGX SuperPOD ，以及当前美国性能最高的超级电脑Summit 在全新的超级运算评估软体HPL-AI 下，达到较仅以FP64为主的HPL 攀升3 倍的性能表现。

清欢网

此外，日本新世代超级电脑ABCI 也搭载NVIDIA 的Tesla V Tensor Core GPU ，一举成为日本最快的超级电脑。同时利用兼具HPC 与AI 双方面的性能，使得ABCI 能同时为研究人员与工业用户提供从核物理到制造的科学模拟与演算，但同时亦能藉由分散式运算提供其它领域的使用者加快AI 训练。

NVIDIA 携手Arm 共创节能超级运算架构

随着Arm CPU 架构性能越来越提升，去年底亦有基于Arm CPU 的超级电脑跨入Super 500 榜单，虽然只是一个起步，但却也证实Arm 架构不再只有低功耗的优点，同时欧洲也欲降低对美国处理器的依赖，打算在超级运算领域透过Arm 与RISC 建构自己的CPU 平台，更使Arm 在超级运算领域的后续发展倍受注目。

NVIDIA 在ISC 的第一项宣布就是携手Arm ，针对低功耗的超级运算共造良好的环境，使Arm 平台共容易使用到NVIDIA 的GPU 加速运算， NVIDIA 将针对Arm 平台提供最佳化调整的CUDA -X HPC & AI 软体平台，针对达600 项HPC 应用程式、人工智慧框架进行加速，并提供包括CUDA 等完整的开发工具，而这项合作计画预期在2019 年末启动，包括Atos 、 CRAY 以及最近买了CRAY 的HPC / HewlettPackard Enterprise 都是参与计画的合作伙伴。

在三周内建构完成的AI 训练、超算兼用超级电脑DGX SuperPOD

在先前为了AI 训练， NVIDIA 即自行架设、基于DGX-1 的DGX-SATURNV 超级电脑，在当时甫建设完成就已经名列TOP500 的28 名，而此次再度宣布针对包括自动驾驶、语音AI 、医护、影像与HPC 等综合应用，再度架设全新的DGX SuperPOD ，这款从架设到完成仅3 周的超级电脑已经一举跨入Top500 的22 名。

DGX-SuperPOD 搭载96 具DGX-2H (内部的Tesla V100 为32GB 的升级版)，并透过Mellanox 网路彼此连接，共有高达1,536 个Tesla V100 ，在约1 megawatt 功耗达到9.4 PF 的HPL 测试性能，而在AI PF 则达到200 以上，并具备6 MLPerf 的训练纪录，与低于两分钟训练RN-50 的纪录，在RN-50 问世的2015 年当时最顶尖的系统需要25 天才能完成。

另一个值得注意的是，相较类似效能的超级电脑主机需要使用上千台伺服器， DGX-SuperPOD 仅使用与其相近排名约1/400 的空间即可架设，显现NVIDIA 的GPU 平台在效能与能耗表现有着凛先优势，同时在Green 500 能耗性能榜单上，基于NVIDIA 平台的超级电脑也占领前25 位中的22 位。

清欢网

DGX SuperPOD 能在三周建设完成，也是拜DGX-2 以高度模组化的弹性架构， NVIDIA 称此为DGX-SuperPOD 架构，能够在3 周时间完成过往至少费时6 个月到9 个月的系统部属。同时NVIDIA 也借此提供DGX-Ready Data Center 计画，使有志导入新一代HPC 与AI 混合超级电脑的组织，能藉由NVIDIA SuperPOD 架构快速部属。

全新超级电脑性能评估完整发挥 Summit 实力

随着新一代超级电脑不再仅是针对HPC 的模拟，同时也兼具针对机器学习的AI 演算， TOP500 也知道该为新一代的超级电脑提供更具指标性的测试方式，而HPL-AI 即是同时针对HPC 与AI 双方面所需、综合HPC 所需的FP64 ，以及AI 常用的FP16 、FP32 的测试指标。

藉由HPL-AI 的出现，当前地表最快的HPC 、美国Summit 再度刷新测试成绩，原本在HPL 测试已经达到149 PF ，在加入AI 性能评估之后， Summit 于HPL-AI 也达到惊人的500PF ，足足比起仅计算FP64 性能的HPL 提升3 倍。

NGC 提供达50 个GPU 优化容器、系统管理者可预先下载容器并存放于丛集

NVIDIA 的NGC 当前已经提供超过50 个GPU 的优化容器，并能在Docker 与Singularity 执行包括深度学习框架、机器学习演算法与HPC 应用程式，同时此次也宣布使超级电脑计算中心、学术单位的HPC系统管理员，现时能下载NGC 容器并存放在丛集上，使用户能直接自丛集取得NGC 容器，降低网路流量并节省储存空间，同时NVIDIA 也藉由提供NGC Container Replicator ，可协助管理者自动检查与下载最新的NGC 容器。

当前NVIDIA 提供的NGC 已不光只有深度学习容器，并针对包括物体侦测、自然语言处理、文字与语音等热门应用案例，提供达60 种预先训练的模型与17 种模型脚本。

NVIDIA专区

专题介绍：

NVIDIA产品专注于显卡，我们游戏的显卡跟他是都有关联的，可见NVIDIA产品到底有多厉害，那么他的产品又有哪些过人之处呢？就让我们一起来看看吧！

进入专题

NVIDIA于ISC大会公布多样超算布局，强化与Arm的合作、仅在3周架设DGX SuperPOD伺服器

NVIDIA专区

相关文章

最新文章

热门文章

热门专题