於美国达拉斯举行的Supercomputing 2022(SC22)前夕,英特尔推出Intel Max系列产品,包含两款用於高效能运算(HPC)和人工智慧(AI)的尖端产品:Intel Xeon CPU Max系列(代号Sapphire Rapids HBM)以及Intel Data Center GPU Max系列(代号Ponte Vecchio)。新产品为阿贡国家实验室(Argonne National Laboratory)即将推出的Aurora超级电脑注入动力,并公开其部署的最新情况。
|
英特尔推出Max系列产品。 |
Xeon Max CPU是首款也是唯一一款具备高频宽记忆体的x86处理器,不需要修改程式码,即可加速许多的HPC工作负载。Max系列GPU是英特尔密度最高的处理器,将超过千亿个电晶体以47个晶片块的方式整合至单一封装,具备高达128GB高频宽记忆体。oneAPI开放式软体生态系为这两款处理器系列提供一个单一的程式设计环境。英特尔於2023年推出的oneAPI和AI工具,将能够释放Intel Max系列产品的功能。
英特尔企业??总裁暨超级运算事业部总经理Jeff McVeigh说,为确保每个HPC工作负载都能够被完美执行,我们需要能够最大幅度提升频宽、运算能力、开发者生产力,并发挥最大影响力的解决方案。Intel Max系列产品为更广泛的市场带来高频宽记忆体以及oneAPI,让CPU和GPU之间共享程式码变得容易,并更快速地解决全球最为重大的挑战。
高效能运算(HPC)代表着科技先锋,大量采用最为先进的创新技术,从降低气候变化的冲击再到治疗全球最为致命的疾病,解决科学和社会的最重大挑战。
Max系列产品透过可扩展、相互平衡的CPU和GPU满足此一社群的需求,其融合了突破性的记忆体频宽,并由开放、基於标准、跨架构程式设计框架的oneAPI联合在一起。研究人员和企业将利用Max系列产品更快、更永续地解决问题。
Max系列产品预计将於2023年1月推出。为履行对客户的承诺,英特尔正在出货配备Max系列GPU的刀锋式伺服器给阿贡国家实验室,为Aurora超级电脑注入动力,并向洛色拉莫士国家实验室(Los Alamos National Laboratory)、京都大学(Kyoto University)和其它超级运算站点提供Xeon Max CPU。
Xeon Max CPU在350瓦的范围之中,提供多达56个由4片晶片块所构成的效能核心,并使用英特尔的嵌入式多晶片互连桥接(EMIB)相互连接。Xeon Max CPU包含64GB高频宽封装内记忆体,以及PCI Express 5.0和CXL 1.1 I/O。Xeon Max CPU将为每个核心提供超过1GB的高频宽记忆体(HBM)容量,足以应付绝大多数常见的HPC工作负载。与竞争对手相比,Max系列CPU在实际HPC工作负载可提升高达4.8倍的效能。
·在相同的HPCG效能下,比AMD Milan-X丛集降低68%功耗。
·AMX延伸指令集提升AI效能,在使用INT32累积(accumulation)运算的INT8工作中,相较AVX-512提供8倍的峰值吞吐量。
·提供不同HBM和DDR记忆体组态运作的弹性。
·工作负载测试:
o气候建模:仅使用HBM执行MPAS-A时,比AMD Milan-X快2.4倍。
o分子动力学:在DeePMD方面,相较使用DDR记忆体的竞品,效能提升2.8倍。
Max系列GPU提供多达128个Xe-HPC核心,这是目标针对最严苛运算工作负载的新基础架构。此外,Max系列GPU还具备以下特色:
·业界最多的408MB L2快取以及64MB L1快取,提升吞吐量和效能。
·唯一具备原生光线追踪加速功能的HPC/AI GPU,专为加速科学视觉化和动画制作而设计。
·工作负载测试:
o金融:Riskfuel选择权定价方面,相较NVIDIA A100的效能提升2.4倍。
o物理:NekRS虚拟反应炉模拟方面,相较A100提升1.5倍。
Max系列GPU将提供多种外型尺寸,满足不同客户的需求。
·Max系列1100 GPU:一款300瓦的双槽PCIe卡,具备56个Xe核心和48GB HBM2e记忆体,亦可透过Intel Xe Link桥接器连接多张卡。
·Max系列1350 GPU:一款450瓦的OAM模组,具备112个Xe核心和96GB HBM。
·Max系列1550 GPU:英特尔最高效能的600瓦OAM模组,具备128个Xe核心和128GB HBM。
除了单卡和模组之外,英特尔将提供具备4个GPU OAM载板和Intel Xe Link的Intel Data Center GPU Max系列子系统,实现子系统内高效能多GPU通讯。
目前正在阿贡国家实验室建造的Aurora超级电脑,预计将於2023年成为第一台双精度峰值运算效能超过2 exaFLOPS的超级电脑。Aurora也将是首款展示Max系列GPU和CPU於单一系统当中相互搭配,以打造强大的超级电脑,其具备超过10,000台刀锋式伺服器,每台刀锋式伺服器包含6个Max系列GPU和2个Xeon Max CPU。
SC22前夕,阿贡和英特尔揭晓Sunspot,为具备128台量产型刀锋式伺服器的Aurora测试开发系统。来自Aurora先期科学计画的研究人员,将於2022年底开始使用该系统。
Max系列产品将为其它数个对国家安全和基础研究十分重要的HPC系统注入动力,包含洛色拉莫士国家实验室的Crossroads,劳伦斯利物浦国家实验室(Lawrence Livermore National Laboratory)和桑迪亚国家实验室(Sandia National Laboratory)的CTS-2系?,以及京都大学的Camphor3。
代号为Rialto Bridge的Intel Data Center Max系列GPU,是下一代Max系列GPU,预计将於2024年推出,不仅效能更提升,亦提供无缝升级。英特尔正紧接计画推出下个主要架构更新,开启HPC的未来。即将推出代号为Falcon Shores的XPU,将结合Xe和x86核心至单一封装。这项突破性的新架构还将灵活地整合来自英特尔与客户的新IP,并采用英特尔IDM 2.0模式进行制造。