平行算法随着计算机运算广度的需求日增而越来越重要,特别是在高阶科学计算、高画质图像处理、医学显影与基因分析、地质探测、以及工业用图形设计领域,高速运算处理的需求越来越高。数据平行运算(data-parallel computing)模式该如何创新整合,顺应未来多核心图形运算以及大量数据计算处理的繁杂架构,符合节能简碳并有效运用空间,已成为重要课题。
图为NVIDIA Telsa与GPU运算部门总经理Andy Keane。(Source:HDC) |
NVIDIA Telsa与GPU运算部门总经理Andy Keane表示,对于高速数据运算,一般x86丛集平行运算架构采用多核心CPU模式,IBM也有多核处理器运作并行计算。超过90%的用户或许熟悉传统x86丛集系统在高性能运算(High Performance Computing;HPC)领域的使用模式,不过多核心运算模式已经衍生繁复的数据处理丛集服务器架构,高耗能负担也成为高效能数据处理中心亟待解决的课题。现今美国高速运算中心所耗费电力已经占整体美国使用电力的7%,其中3.5%是运用在散热方面,提升百倍运算意味着CPU预算的暴增,更不符经济效益。
Andy Keane指出,以工作站或数据中心高速运算应用为主的绘图处理器GPU平台,在平行运算效能专精度和丛集计算机网络多重应用上,往往比x86架构更具优势。NVIDIA的GPU平行运算架构,晶体管密度高、多核扩充性强、具备高效能平行运算处理能力,且可带动影像解析软件开发,更为广泛的经济效益正在浮现。
Andy Keane深入分享表示,可扩充的GPU平行运算架构,能够运作异质(heterogeneous)串行化平行运算,同时可使用C语言编程,进一步提升运算效能。此外NVIDIA针对GPU所设计的平行编程环境CUDA,可用于Windows及Linux,能让应用程序在GPU上顺畅运行。Andy Keane强调,CPU有60%的效能处理暂存内存,同时处理许多作业让CPU运算效能降低,GPU架构可迅速处理单一深度问题,可专门满足高速运算处理中心对于百倍以上的处理效能需求。GPU运算架构整合并行核心GPU和多核CPU,速度亦可大幅超越多核心系统,也能符合节能运作模式,4核心朝向240颗核心的高速运算架构也不是梦想,落实个人超级计算机(super-computing)以及高速运算工作站的条件也越来越成熟。
Andy Keane进一步表示, NVIDIA结合CUDA平行编程的GPU芯片,目前已出货超过一亿颗,其中运用在高速运算的Tesla芯片系列,在医学显影、分子动力学、视讯转码、天体物理、金融财务、3D超音波、量子化学、基因排序、地质能源探勘等应用领域,分别达到17~149倍不等的运算性能。针对HPC的平行运算Telsa 10芯片,晶体管数达14亿颗,具有240个处理核心,浮点运算次数可达每秒10亿次,加上4GB的内存容量,处理效能为Tesla 8的一倍以上,可满足工作站、数据处理中心以及服务器中心在百倍高速运算处理的需求。
Andy Keane谈及GPU应用时表示,NVIDIA正积极深化GPU平行运算架构在台湾绘图分析和数据处理的市场影响力,将协助开拓台湾高阶物理分子动力学、建筑地质侦测以及气候仿真等高速运算应用领域,并与台湾国家高速网络与计算中心(NCHC),强化固网中心高速计算机运算能力。NVIDIA同时密切与台大交大等校学术院校合作,进一步全面扩大台湾使用GPU平台架构的生态体系。