CTIMES/SmartAuto - NVIDIA深度学习运算平台於半年内增加十倍效能:深度學習,NVIDIA

│新东西市集│东西讲座│影音频道│出版中心│智动化专区│

元件次系统自动控制

最新动态

解析2025产业趋势：MIC所长 x CTIMES编辑

【文章精选】诌：绿色回收与半导体科技的新未来

【东西讲座】11/29 智慧制造与资讯安全

产业快讯

整合创新X智造未来TIMTOS 2025 聚焦AI新商机

汽配及移动科技产业，叁展热烈报名中!

CTIMES/SmartAuto / 新闻 /

NVIDIA深度学习运算平台於半年内增加十倍效能

【CTIMES / SMARTAUTO ABC_1 报导】 2018年03月29日星期四

浏览人次：【3370】

NVIDIA (辉达)针对其深度学习运算平台，揭露一系列重大的进展，让深度学习的工作负载与六个月前的前一世代产品相比，提升10倍效能。

首创2 Petaflop深度学习系统的DGX-2，透过全新搭载2倍记忆体、革命性NVSwitch光纤互连技术与综合软体堆叠的Tesla V100 32GB GPU所驱动。

已被所有大型云端服务供应商与伺服器制造商所采用的 NVIDIA平台关键进展，包括针对效能最强大的资料中心 GPU NVIDIA Tesla V100的记忆体进行2倍升级，并导入全新革命性 GPU 光纤互连技术 NVIDIA NVSwitch，最多可以让高达16颗Tesla V100 GPU能以每秒2.4TB的纪录速度同时进行通讯。同时，NVIDIA也推出优化过後的更新版软体堆叠。

此外，NVIDIA也发表深度学习运算的重大突破NVIDIA DGX-2，其为第一个运算效能可达 2 petaflop的单一伺服器。DGX-2拥有等同於300台占据 15个机架空间的资料中心伺服器所能提供的处理效能，其占据空间少了60倍且功耗效率提升了18倍。

NVIDIA创办人兼执行长黄仁勋在GTC 2018宣布消息时表示：「深度学习非凡的进展揭露更多未来值得期待的部分。这些精进很多是建立在NVIDIA的深度学习平台上，而此平台很快也将成为全球的标准。我们正以远远超越摩尔定律的速度提升效能，并达成各种突破性的进展，可以为医疗照护、交通运输、科学探索与其他无数领域带来革命性的发展。」

广为全球领先研究人员所采用的Tesla V100 GPU具有2倍记忆体的提升，以应对记忆体需求最为密集的深度学习与高效运算作业负载。

目前已搭载32GB记忆体的Tesla V100 GPU，将可协助资料科学家针对更深、更大型的深度学习模型，进行准确度更高的训练。与之前 16GB 版本比较，其也可针对受限於记忆体限制的高效能运算应用，提升高达 50% 效能。

全系列 NVIDIA DGX 系统产品系列皆可马上取用Tesla V100 32GB GPU。此外，顶尖电脑制造商如Cray、Hewlett Packard Enterprise、IBM、Lenovo、Supermicro与Tyan，都已经宣布将在第二季开始推出全新的Tesla V100 32GB 系统。Oracle云端设备服务也宣布计划於今年下半年透过云端系统提供Tesla V100 32GB。

NVSwitch 与最隹的PCIe交换系统相比频宽高出5倍，让开发人员得以透过更多高速连结的 GPU 来打造系统。其也可协助开发人员突破以往系统的限制，处理更大的资料集，并允许处理如神经网路的模型平行训练等更大、更复杂的作业。

NVSwitch 更进一步透过 NVIDIA 所开发的第一个高速互连技术 NVIDIA NVLink达成创新，让系统设计师得以打造更先进的系统，能以极具弹性的方式连结任何以 NVLink 为基础的GPU网路拓??。

NVIDIA的开发社群可以免费取得针对深度学习与高效能运算软体堆叠所进行的更新，其目前的注册使用者总人数已经超过 82 万，与去年 48万人相比大幅增加。

更新部份包含 NVIDIA CUDA、TensorRT、NCCL 与cuDNN，以及全新 Isaac 机器人开发人员软体套件。此外，透过与大型云端服务供应商的密切合作，每个主要的深度学习框架都将持续进行优化，以便完全发挥 NVIDIA GPU 运算平台的效能。

NVIDIA全新DGX-2系统受惠於其针对各种运算堆叠所开发出领先业界的技术，达成2 petaflop运算的里程碑。

DGX-2是第一套采纳 NVSwitch 的系统，可让系统中 16个 GPU共享相同的记忆空间，开发人员因此具有因应最大型资料集与更复杂深度学习模型所需的训练效能。

DGX-2整合完整优化的更新版NVIDIA深度学习软体，是专为一心想要突破深度学习研究与运算极限的资料科学家所打造。其可在两天内针对最顶尖的神经机器翻译模型 FAIRSeq进行训练，而效能则比去年九月发表的Volta DGX-1，足足提升十倍。

Microsoft 语音与文字部门主管暨技术研究员黄学东表示：「Microsoft与NVIDIA过去几年针人工智慧技术的合作已经取得极大的进展，包括最近中英文翻译的突破。Tesla V100 32GB GPU将让我们未来得以更快速地训练更大、更复杂的 AI 模型，协助我们提升语音辨识与机器翻译模型，达到媲美人类翻译能力的准确性，并增强如Cortana、Bing与MicrosoftTranslator等产品。」

SAP以色列创新中心??总裁Michael Kemelmakher表示：「我们对即时且具备自动分析影片品牌露出的SAP Brand Impactb软体应用，导入全新Tesla V100 32GB DGX-1的评估。扩充的记忆体提升了在更大的ResNet-152模型上，应对更高解析度影像处理的效能，并同时降低40%的平均错误率。在我们的服务规模下产出精准、即时与有效的服务成果。」

DGX-2是NVIDIA DGX产品系列中最新的成员，其包含三套针对协助资料科学家迅速开发、测试、部署与扩充，所设计的全新深度学习模型与创新的系统。

搭载16个GPU的DGX-2是此产品系列中的旗舰产品。其它成员包括内建 8 个Tesla V100 GPU 的 NVIDIA DGX-1系统，以及搭载 4 颗Tesla V100 GPU、全世界第一台深度学习专用的个人超级电脑 DGX Station工作站。这些系统让资料科学家得以将复杂的实验作业拓展至工作站上处理，进而解决更庞大的深度学习问题，协助完成毕生志向的研究。

關鍵字：深度學習 NVIDIA