米兰·(milan)中国官方网站- 英伟达「三芯」策略初步奏效 | ISC 2022

2026-03-30 22:21:59

导语:量子体系的下一个庞大奔腾朝着混淆体系迈进。

比拟几年前评论辩论的重点只有GPU,于拥有CPU及DPU以后,英伟达作为体系公司可以或许评论辩论的话题越发富厚。

于方才已往的Computex及时隔两年从头回归线下的ISC 2022(国际超等计较机年夜会),英伟达都展示了诸多其GPU、CPU、DPU的最新互助结果,这于很年夜水平上注解了英伟达的“三芯”计谋已经经初见成效。

英伟达「三芯」策略初步奏效 | ISC 2022

别的,英伟达于混淆量子计较中的结果,也表现了其于高机能计较范畴的前瞻性结构。

固然,英伟达CEO黄仁勋也于与媒体的交流中再次夸大,“英伟达是一家体系公司,提供从硬件到体系软件的全栈方案,客户可以根据其需求选择咱们的产物。加快计较的世界与CPU大相径庭,咱们的产物及方案很是怪异。”

英伟达的“三芯”到底怎样加快那些世界上最快的加快体系?

怪异的CPU+GPU组合

GPU作为英伟达发现的产物,也是英伟达的标签,于本年GTC 22上,雷峰网(公家号:雷峰网)先容了英伟达最新一代Hopper架构GPU H100发布,比拟两年前的Ampere架构A100 GPU,实现了数目级的机能晋升。

黄仁勋暗示,20个 H100 GPU 即可承托相称在全世界互联网的流量,使其可以或许帮忙客户推出进步前辈的保举体系以和及时运行数据推理的年夜型语言模子。

不外,比拟GPU,英伟达的Grace CPU更能吸引外界的存眷。市场上已经经有许多优异的CPU产物,英伟达于如许的配景下推出CPU让人感应不测,也让人好奇Grace CPU的差别的地方。

当被问和Grace CPU有何怪异的地方时,黄仁勋说,“Grace旨于比其它CPU更好地解决与数据处置惩罚有关的问题,可以或许更高效处置惩罚年夜量数据,而且与咱们的GPU慎密联合,更好地完成解决AI使命。”

英伟达的Grace CPU超等芯片集成为了两个基在Arm的CPU,有多达144个高机能Arm Neoverse焦点,而且带有可伸缩矢量扩大及1 TB/s的内存子体系,撑持最新的PCIe Gen5和谈,可实现与GPU之间最高机能毗连,同时还有能毗连NVIDIA ConnectX-7智能网卡以和NVIDIA BlueField-3 DPU。

由此看来,英伟达于设计Grace CPU的地方就已经经很是明确要将其所有硬件产物之间很好地互联。这也轻易理解,跟着摩尔定律的放缓,异构计较成了将来趋向,作为提供高机能计较产物的公司,英伟达有如许的结构也十分合理。

ISC 2022上,英伟达CPU+GPU的产物组合得到了承认,美国及欧洲的领先超等计较中央都将率先采用这两款超等芯片。

美国阿拉莫斯国度试验室(LANL)今日公布,其新一代体系Venado将成为美国首个采用NVIDIA Grace CPU技能的体系。Venado是利用HPE Cray EX超等计较机构建而成的异构体系,将同时配备Grace CPU及Grace Hopper,这一体系建成后的AI机能估计将跨越10 exaflops(10的18次方,百亿亿次)。

另外一个率先采用英伟达Grace CPU及GPU的体系是瑞士国度计较中央的新体系Alps,基在HPE Cray EX超等计较机构建,这是一个通用体系,向瑞士和其他国度的研究者开放。

英伟达还有公布,源讯、戴尔科技,技嘉科技、慧与、海潮、遐想及超微公布规划部署基在Grace CPU及Grace Hopper超等芯片的办事器。

DPU带来的年夜幅机能晋升

DPU是一个新观点,于英伟达动员下成为备受存眷的产物,涌现了年夜量草创公司以和本钱的投入

DPU的焦点价值是将通讯及计较负载从CPU卸载,进而得到巨年夜的机能晋升。不外DPU可以或许带来的详细的机能晋升,仍旧需要实践证实,英伟达借着ISC 2022给出了一些案例。

英伟达「三芯」策略初步奏效 | ISC 2022

洛斯阿拉莫斯国度试验室(LANL)的卓异高级科学Poole 正与英伟达举行一项为期多年的广泛互助,旨于将计较多物理运用的机能提高30倍。这此中包括利用 BlueField 和其NVIDIA DOCA软件框架于计较存储、模式匹配等。

LANL 已经经感触感染到收集计较的强盛功效,加快闪存盒(ABoF)将固态存储与DPU及InfiniBand加快器相联合,可为 Linux 文件体系的要害机能部门提供加快。它的机能高达同类存储体系的30倍,并将成为 LANL 基础架构中的要害组件。

俄亥俄州立年夜学的研究职员展示了 DPU 怎样将一个HPC热点编程模子的运行速率提高 21%。他们经由过程卸载动静通报接口(MPI)的要害部门,加快了P3DFFT,这是一个用在浩繁年夜范围HPC仿真的数学库。

对于在运行药物研发或者飞机设计等HPC仿真运用的超等计较机,DPU也可以带来高达两位数的机能加快。

欧洲的多个研究团队正使用BlueField DPU 加快 MPI 及其他 HPC 事情负载。英格兰北部的达勒姆年夜学正于开发一款软件,用在于 16 个节点的 Dell PowerEdge 集群上利用 BlueField DPU 以实现 MPI 功课的负载平衡。剑桥年夜学、伦敦及慕尼黑等的研究职员也于利用 DPU。

DPU也于用在加快份子动力学研究,还有能用在天气学、天体物理学、年夜数据、AI 及更多方面的研究。这些研究职员也于思量怎样利用新一代的BlueField-3 DPU 的焦点功效。

三芯计谋开端见效,结构量子计较

高机能计较体系对于在算力有着更高要求,也有怪异需求,于英伟达拥有了GPU、CPU及DPU以后,它可以或许实现更多的硬件组合,再共同上层的软件体系,可以或许更好满意前沿运用及更高计较的需求。

经由过程ISC 2022的浩繁结果展示,也能看到英伟达的三芯计谋已经经初见成效,差别的产物及产物组合已经经于HPC、AI等运用中实现机能的显著晋升。

不止在此,英伟达还有于结构前沿的量子计较。

英伟达「三芯」策略初步奏效 | ISC 2022

量子计较有两年夜上风,一个是可以为海量数据的并行计较(机能)带来指数级另外晋升,这类强盛的功效,可以应用于包括金融、数据的搜刮处置惩罚等范畴。另外一个是量子计较编译于电子原子上,于模仿方面会体现的很是天然,例如新质料的发明,生物医药的药物合成。

不外,量子计较的实现还有有许多挑战。跟着量子体系的成长,下一个庞大奔腾是朝混淆体系迈进:量子计较机及经典计较机协同事情。

是以,摆于眼前的一个主要使命就是将传统体系及量子体系桥接到混淆量子计较机中。GPU合适与量子计较协同事情,能年夜幅降低经典计较机及量子计较机之间的通讯延迟,解决现今混淆量子功课面对的重要瓶颈。

英伟达「三芯」策略初步奏效 | ISC 2022

据悉,已经经有数十家量子构造已经经于利用 NVIDIA cuQuantum 软件开发套件,于GPU上加快其量子电路模仿,可以或许于重要的量子软件框架上实现加快计较。好比,AWS展示了cuQuantum怎样于量子呆板进修事情负载上实现高达900倍的加快。

于经典计较的层面,英伟达不停经由过程富厚硬件产物及软件生态连结争力,面向将来的量子计较,英伟达也做好了预备。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

-米兰·(milan)中国官方网站

相关内容

All rights reserved ©2026 Jinko Power.Powered by Webfoss.沪ICP备15009312号-1