广东主流新闻媒体

英伟达联手Arm迎战高性能计算!GPU加速卡将支持Arm架构CPU

2019-06-18 18:46 作者: 来源: 本站 浏览: 45次 字号:

摘要: 文| 心缘 智东西6月17日消息,在今日于德国举行的ISC 2019国际超算大会上,美国芯片巨头英伟达(NVIDIA)今天宣布其用于超级计算机的加速平台将对Arm架构CPU支持,即计划利用其芯片与使用Arm架构的CPU协作打造超级计算机。 这为...

文| 心缘

智东西6月17日消息,在今日于德国举行的ISC 2019国际超算大会上,美国芯片巨头英伟达(NVIDIA)今天宣布其用于超级计算机的加速平台将对Arm架构CPU支持,即计划利用其芯片与使用Arm架构的CPU协作打造超级计算机。

这为高性能计算(HPC,High Performance Computing)行业开辟了一条全新的路径,为能够实现“exascale”性能的超级计算机铺平道路,有助于构建具有极高能效水平的百万兆级AI超级计算机。

NVIDIA表示,将于年底前向Arm生态系统提供全堆栈的AI和HPC软件。堆栈优化完成后,NVIDIA将能为包括x86、POWER和Arm在内的所有主流CPU架构提供加速。

此外,NVIDIA还于今日推出了全球排名第22快的超级计算机DGX SuperPOD,据称可满足自动驾驶车辆部署计划的大量需求。

一、NVIDIA将支持Arm CPU

NVIDIA一直是数据中心市场的佼佼者,其GPU芯片被用于与英特尔、IBM等公司的中央处理器(CPU)协同工作,完成大规模并行计算的加速任务。

在超大规模数据中心和高性能计算的服务器市场,英特尔x86处理器长期占据主导地位,随后IBM Power芯片则成为后起之秀,而IBM的Power处理器在近年亦出现翻盘之势,主要在中低端服务器芯片市场分食x86的市场蛋糕,而Arm则试图在中低端服务器市场赢得更多的市场份额。

英国Arm公司是全球领先的半导体知识产权(IP)供应商, 于2016年被日本软银集团以234亿英镑(约合310亿美元)高价收购。

不同于英特尔和IBM,Arm公司本身不直接从事芯片生产,而是依靠给芯片厂商们提供底层的处理器架构授权,从而获得授权费用和一定版税。

苹果、三星、高通、华为、飞利浦等各大芯片厂商们都从Arm那里购买授权,全球绝大多数智能手机和平板电脑等便携式消费电子产品均采用Arm架构。

和其他架构相比,Arm的一大特色在于出色的能效,它能够为超级计算机提供开放式架构,因此用户可以添加各种有益于超级计算的有趣技术,例如紧密集成。

NVIDIA副总裁兼加速计算总经理Ian Buck称,通过将Arm CPU与Tesla GPU相结合,使用者可以完成大量的HPC仿真和AI所需的繁重计算,并且Arm可以使用快速单线程来执行CPU。

Arm已经在世界各地的许多HPC中心获得了越来越多的关注,此前采用Arm架构的exascale系统没有GPU,如今NVIDIA新增对Arm支持的举动并不令人意外。

Buck表示,从技术角度来看,用Arm制造超级计算机的项目将是一次“重举”。据他介绍,现在是NVIDIA宣布支持Arm CPU的最佳时期,他们花了两年的时间来完成所有这些工作,希望在今年年底之前发布第一个完整版本。

NVIDIA支持Arm CPU后,将为研发超算的研究人员们提供了除英特尔和IBM外的第三种选择,并使得研发者可以通过这种方式获得更多的自主控制能力。

二、年底前向Arm生态系统提供全堆栈的AI和HPC软件

HPC市场预计到2025年价值将达到596.5亿美元,NVIDIA一直是推动高性能计算发展的重要力量。今日发布的Green500排行榜,在全球最节能的25款超级计算机中,有22款都得益于NVIDIA的支持。

之所以能有如此成绩,源自NVIDIA的多项核心技术。采用NVIDIA GPU的超级计算机,能够将繁重的处理作业卸载至更为节能的并行处理CUDA GPU之上,另外NVIDIA与InfiniBand和以太网互连供应商Mellanox合作优化整体超级计算集群的处理,NVIDIA还在SXM 3D封装技术和可实现极密集型扩展节点的NVIDIA NVLink互联技术方面投入大量研发。

NVIDIA对基于Arm的HPC系统的支持建立在双方超过10年的合作基础之上。NVIDIA的几款用于便携式游戏、自动驾驶汽车、机器人和嵌入式AI计算的系统级芯片产品都采用了Arm。

据悉,NVIDIA将于年底前向Arm生态系统提供全堆栈的AI和HPC软件,该堆栈为600多个HPC应用程序和所有AI框架提供加速,其中包括所有NVIDIA CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具,如支持OpenACC的PGI编译器和性能分析器。

NVIDIA创始人兼首席执行官黄仁勋表示:“超级计算机是促进科学发现的重要工具,建立百万兆级超级计算将能够极大地扩展人类知识的边界。随着传统计算规模扩展步伐的停止,功率也将成为所有超级计算机的限制因素。NVIDIA CUDA加速的计算和Arm的高能效CPU架构的相结合,将助力HPC社区实现大幅提升,以达到百万兆级。”

“Arm正在与生态系统合作,为基于Arm的SoC带来前所未有的计算性能提升,并实现百万兆级功能,”Arm首席执行官Simon Segars表示,“HPC社区已经部署了Arm技术,以应对全球最复杂的研究挑战。通过与NVIDIA合作,将CUDA加速引入Arm架构,这一举措对于HPC社区来说,可谓是一大重要里程碑。”

三、在HPC行业及Arm生态系统,部分业内人士这么看

Ampere Computing董事长兼首席执行官Renee James认为,其客户正致力于寻求基于Arm的高性能处理器,来运行其最苛刻的工作负载,因此很高兴NVIDIA正在将CUDA和围绕NVIDIA所建立的丰富的生态系统引入Arm。

Arm生态系统另一位领导者——Atos的高级执行副总裁、大数据和网络安全部门负责人Pierre Barnabé亦表示,这一重要发布将加速AI和模拟世界的融合,同时优化能效。

Cray总裁兼首席执行官Peter Ungaro表示,其Cray系统管理和编程环境(编译器、库和工具)已经能够在XC和未来的Shasta超级计算机上支持Arm处理器,将CUDA和CUDA-X HPC和AI软件堆栈用于Arm平台,并将其与Cray系统管理和编程环境紧密集成。

此外, CSC、 EPI、HPE、Jülich超算中心、Marvell等均表态称,看好将Arm架构与NVIDIA GPU相结合,认为它将有助于优化HPC和AI工作负载,匹配未来百万兆级前(pre-exascale)解决方案的构建模块,助力HPC行业解决日益不可持续的功耗水平问题。

在高校与科研机构的一些专家也发表了看法,比如理化学研究所计算科学研究中心负责人、东京工业大学教授Satoshi Matsuoka。

“过去十年中,我们一直积极率先在大型超级计算机上采用NVIDIA GPU,包括日本最强大的ABCI超级计算机,”Satoshi Matsuoka说,“理化学研究所计算科学研究中心目前正在致力于开发下一代基于Arm的百万兆级Fugaku超级计算机,我们很高兴听到NVIDIA的GPU加速平台很快将能够用于基于Arm的系统。”

四、全球第22快的超算DGX SuperPod

今日,NVIDIA还推出了全球排名第22快的超级计算机:DGX SuperPOD。据NVIDIA人工智能基础设施副总裁Clement Farabet表示,它提供的AI基础设施可满足公司自动驾驶车辆部署计划的大量需求。

据介绍,SuperPOD包含96个DGX-2H单元和1536个V100 Tensor Core图形芯片,与Mellanox和NVIDIA的NVSwitch技术相互连接。

它比同等顶级超级计算系统小约400倍,组装只需三周,同时提供9.4 petaflops的计算性能。在实际测试中,它试图在不到两分钟的时间内训练基准AI模型ResNet-50。

“很少有AI挑战与训练自动驾驶汽车一样苛刻,这需要对神经网络进行数万次重新训练,以满足极端的精确度需求,”Farabet说,“没有像SuperPOD那样的大规模处理能力的替代品。”

客户可以从NVIDIA的任何DGX-2合作伙伴处购买SuperPOD的全部或部分内容。

结语:进一步推动HPC扩展性能和优化能效

如果NVIDIA按照预期,在年底前为Arm生态系统提供全套的人工智能和高性能计算(HPC)软件,这将为超算研发者们提供除x86、Power之外,另一种更具开放性的选择。

此外,从众多业内人士的表态来看,这一重要发布对于基于Arm打造超级计算机的研发机构或企业而言,将是进一步扩展其超算性能,推动高性能计算提供更出色能效的重要推动力。