今日的资料中心已经把焦点从单一执行绪效能转移到机架级系统效能,效能功耗比、效能成本比与整体TCO成为了部署的关键因素。这些资料中心正在利用专门为特定工作负载订制的伺服器。在这些伺服器上执行的应用程式通常基於开放式来源软体,或是由部署的客户自行控制开发。
|
与ThunderX2相比,ThunderX3的微架构改良在整体IPC效能改良上提升了25%。 |
Marvell的ThunderX2伺服器处理器是伺服器市场发展的顶尖范例,其部署横越云端与HPC伺服器市场,主要客户例如Microsoft Azure及桑迪亚国家实验室的Astra Top 500超级电脑安装系统。
以第三世代Arm为基础的伺服器处理器ThunderX3带领Marvell继续开创新蓝图。ThunderX3是专门为目前云端与HPC市场上最高要求的工作负载所打造。ThunderX3使用小型晶片,为云端与HPC工作负载提供高效能、低功耗、高记忆体频宽与低记忆体延迟。
使用TSMC 7P工艺制造的ThunderX3处理器有着高达96核,4执行绪/核,提供384执行绪/??槽的总运算能力。记忆体接囗支援8通道DDR4-3200,每条通道支援2个DIMM。IO扩充则提供64条PCIe Gen 4.0线路,搭载16个控制器 该处理器支援单、双??槽设定。
针对浮点运算,ThunderX3每个核心搭载四个128-位元SIMD (Neon)单元。该装置完全符合SBSA/SBBR,并提供企业级RAS与虚拟化能力。
以ThunderX3为基础处理器的平台将会在2020年中期向客户提供样本。
技术特点
与ThunderX2相比,ThunderX3的微架构改良在整体IPC效能改良上提升了25%。 随着核心与DDR频率的增加,与前一代相比,在单执行绪效能上整体提升了超过60%。至於CPU??槽等级,与ThunderX2相比,ThunderX3的整数运算效能提升超过3倍,浮点效能提升超过5倍。
ThunderX3以云端运算与高效能运算市场中的特定工作负载为目标持续迈进;Marvell拥有的差异化在为终端客户节省成本与功耗的同时,提供强大效能优势。此外,Marvell也支援原生Arm工作负载,例如 云端中的Android游戏。 Marvell关注的市场大约占整个伺服器处理市场的3成。
Marvell的目标云端工作负载,例如大数据、资料库、媒体串流、Web层、弹性搜寻与云端储存等服务,在本质上是高度平行的。ThunderX3搭载4同步执行绪(SMT),为这些工作负载的输送量带来显着改善HPC工作负载例如EDA与CAE也同样受惠於多执行绪。
ThunderX3高效节能,且能在进行浮点运算密集型工作负载时维持高频率。此能力与多个单指令多资料(SIMD)单位与业界最隹的记忆频宽相结合,为量子物理、量子化学、计算流体动力学、基因学与油汽工作负载领域的目标 HPC 工作负载提供绝隹的效能优势。
ThunderX3装置也非常适合执行当前以云端或边缘容器与虚拟机形式部署於行动电话与Arm端点中的原生Arm应用程式。这能支援各式新兴使用案例,例如云端中的Android游戏、云端中的Android与Arm软体/应用程式开发。Marvell与NVIDIA共同合作,整合了在HPC与游戏业界性能优异的GPU。
Marvell在以Arm为基础架构的伺服器领域已经建立起领导者地位在最严苛的环境下,其效能、大规模生产部署久经考验,并打造了一个充满活力且能持续成长的夥伴生态系统。ThunderX3是这趟旅程里令人惊叹的新篇章,Marvell期??能在未来数个月和您们分享更多细节。
(本文作者为Gopal Hegde, Marvell??总裁兼伺服器处理器业务单位总经理)