近年在全球超级运算领域大放异彩的NVIDIA 在稍早于德国举办的ISC /国际超级运算峰会宣布多项超算领域的布局,包括强化与Arm 在超算的合作,以及针对自动驾驶训练、仅在3 周建设完成并迈入超算TOP 500 榜单中的22 名新AI 伺服器DGX SuperPOD ,以及当前美国性能最高的超级电脑Summit 在全新的超级运算评估软体HPL-AI 下,达到较仅以FP64为主的HPL 攀升3 倍的性能表现。
此外,日本新世代超级电脑ABCI 也搭载NVIDIA 的Tesla V Tensor Core GPU ,一举成为日本最快的超级电脑。同时利用兼具HPC 与AI 双方面的性能,使得ABCI 能同时为研究人员与工业用户提供从核物理到制造的科学模拟与演算,但同时亦能藉由分散式运算提供其它领域的使用者加快AI 训练。
NVIDIA 携手Arm 共创节能超级运算架构
随着Arm CPU 架构性能越来越提升,去年底亦有基于Arm CPU 的超级电脑跨入Super 500 榜单,虽然只是一个起步,但却也证实Arm 架构不再只有低功耗的优点,同时欧洲也欲降低对美国处理器的依赖,打算在超级运算领域透过Arm 与RISC 建构自己的CPU 平台,更使Arm 在超级运算领域的后续发展倍受注目。
NVIDIA 在ISC 的第一项宣布就是携手Arm ,针对低功耗的超级运算共造良好的环境,使Arm 平台共容易使用到NVIDIA 的GPU 加速运算, NVIDIA 将针对Arm 平台提供最佳化调整的CUDA -X HPC & AI 软体平台,针对达600 项HPC 应用程式、人工智慧框架进行加速,并提供包括CUDA 等完整的开发工具,而这项合作计画预期在2019 年末启动,包括Atos 、 CRAY 以及最近买了CRAY 的HPC / HewlettPackard Enterprise 都是参与计画的合作伙伴。
在三周内建构完成的AI 训练、超算兼用超级电脑DGX SuperPOD
在先前为了AI 训练, NVIDIA 即自行架设、基于DGX-1 的DGX-SATURNV 超级电脑,在当时甫建设完成就已经名列TOP500 的28 名,而此次再度宣布针对包括自动驾驶、语音AI 、医护、影像与HPC 等综合应用,再度架设全新的DGX SuperPOD ,这款从架设到完成仅3 周的超级电脑已经一举跨入Top500 的22 名。
DGX-SuperPOD 搭载96 具DGX-2H (内部的Tesla V100 为32GB 的升级版),并透过Mellanox 网路彼此连接,共有高达1,536 个Tesla V100 ,在约1 megawatt 功耗达到9.4 PF 的HPL 测试性能,而在AI PF 则达到200 以上,并具备6 MLPerf 的训练纪录,与低于两分钟训练RN-50 的纪录,在RN-50 问世的2015 年当时最顶尖的系统需要25 天才能完成。
另一个值得注意的是,相较类似效能的超级电脑主机需要使用上千台伺服器, DGX-SuperPOD 仅使用与其相近排名约1/400 的空间即可架设,显现NVIDIA 的GPU 平台在效能与能耗表现有着凛先优势,同时在Green 500 能耗性能榜单上,基于NVIDIA 平台的超级电脑也占领前25 位中的22 位。
DGX SuperPOD 能在三周建设完成,也是拜DGX-2 以高度模组化的弹性架构, NVIDIA 称此为DGX-SuperPOD 架构,能够在3 周时间完成过往至少费时6 个月到9 个月的系统部属。同时NVIDIA 也借此提供DGX-Ready Data Center 计画,使有志导入新一代HPC 与AI 混合超级电脑的组织,能藉由NVIDIA SuperPOD 架构快速部属。
全新超级电脑性能评估完整发挥 Summit 实力
随着新一代超级电脑不再仅是针对HPC 的模拟,同时也兼具针对机器学习的AI 演算, TOP500 也知道该为新一代的超级电脑提供更具指标性的测试方式,而HPL-AI 即是同时针对HPC 与AI 双方面所需、综合HPC 所需的FP64 ,以及AI 常用的FP16 、FP32 的测试指标。
藉由HPL-AI 的出现,当前地表最快的HPC 、美国Summit 再度刷新测试成绩,原本在HPL 测试已经达到149 PF ,在加入AI 性能评估之后, Summit 于HPL-AI 也达到惊人的500PF ,足足比起仅计算FP64 性能的HPL 提升3 倍。
NGC 提供达50 个GPU 优化容器、系统管理者可预先下载容器并存放于丛集
NVIDIA 的NGC 当前已经提供超过50 个GPU 的优化容器,并能在Docker 与Singularity 执行包括深度学习框架、机器学习演算法与HPC 应用程式,同时此次也宣布使超级电脑计算中心、学术单位的HPC系统管理员,现时能下载NGC 容器并存放在丛集上,使用户能直接自丛集取得NGC 容器,降低网路流量并节省储存空间,同时NVIDIA 也藉由提供NGC Container Replicator ,可协助管理者自动检查与下载最新的NGC 容器。
当前NVIDIA 提供的NGC 已不光只有深度学习容器,并针对包括物体侦测、自然语言处理、文字与语音等热门应用案例,提供达60 种预先训练的模型与17 种模型脚本。
相关文章
- 超越Nvidia RTX 3080!AMD新旗舰显卡跑分有望领先20%10-28
- NVIDIA GeForce RTX 30系列显示卡怎么样?专业评测一览09-14
- 传Nvidia将砸400亿美元收购ARM,最快下周有结果09-14
- NVIDIA旗舰显卡RTX 3070 Ti规格及性能曝光09-06
- NVIDIA新品亮相,GeFocre RTX 3090多项全新黑科技公开09-03
- NVIDIA执行长黄仁勋公开表示没有计划收购Arm08-21
- NVIDIA为入门级的GTX 1650更新GDDR6版本04-06
- NVIDIA加入全新光线追踪效果的《我的世界》游戏画面03-31
- NVIDIA推出DLSS 2.0单一模型通用所有游戏 让游戏显示4K画质03-26
- NVIDIA游戏与日本KDDI合作目前已上架百款游戏03-25
最新文章
热门文章
NVIDIA GeForce RTX 2080 Super实测:最强次旗舰,价格还是不变
NVIDIA用三周架好超级电脑系统DGX SuperPOD,全世界运算第22快将用于无人驾驶系统发展
纪念阿波罗11号登月50 年, NVIDIA借RTX即时光线追踪技术纪念人类历史首度登月
- NVIDIA推出创作者行动工作站平台NVIDIA Studio,多家品牌推出对应产品
- NVIDIA打造支援即时光影追迹表现的第一人称视角AR眼镜,重现阿波罗11号登月场景
- NVIDIA不会推出RTX 2080 Ti SUPER,AMD RX 5700 XT让其感到威胁
- NVIDIA全新Gamescom Game Ready提升最多20%游戏性能
- NVIDIA愚人节推出RON人工智慧全像助理,帮你解决游戏大小事
- NVIDIA要推出《赛博朋克2077》限定版的显卡 性能超强大
- NVIDIA总部出面澄清下一代晶片并非三星独家生产,而是三星、台积电都有份