米兰·(milan)中国官方网站- 深圳理工大学唐志敏:异构计算已成必然,软件决定芯片胜负 |GAIR 2025

2026-03-12 20:39:38

导语:RISC-V具有必然的包涵性,有时机交融 CPU、GPU 及 AI 处置惩罚器的特征,冲破 CUDA 的生态壁垒。

深圳理工大学唐志敏:异构计算已成必然,软件决定芯片胜负 |GAIR 2025

作者|包永刚

编纂|林觉平易近

2025年12月12-13日,第八届GAIR全世界人工智能与呆板人年夜会于深圳·博林天瑞喜来登旅店正式启幕。

作为AI 产学研投界的标杆嘉会,GAIR自2016年开办以来,始终苦守“传承+立异”内核,始终致力在毗连技能前沿与财产实践。

于人工智能慢慢成为国度竞争焦点变量确当下,算力正之前所未有的速率重塑技能路径与财产布局。13日举办的「AI 算力新十年」专场聚焦智能系统的底层焦点——算力,从架构演进、生态构建到财产化落地睁开体系会商,试图为将来十年的中国AI财产,厘清要害变量与成长标的目的。

深圳理工年夜学算力微电子学院院长、龙芯 CPU 与海光 CPU 开创人唐志敏发表了题为《XPU的将来——软件决议成败》的主题演讲。

唐教员指出,算力不仅是硬件机能的表现,更是一种于资源与时间约束下完成使命的能力系统。于这一配景下,训力、推力等新型算力能力正于慢慢形成,鞭策人工智能从语言理解向多模态天生成长。

他夸大,跟着天生式 AI 对于算力需求的快速增加,单靠 CPU 已经没法满意实际需求,异构计较(CPU+XPU)成为一定选择。但硬件自己并不是决议因素,真正影响算力开释的,是软件与运用生态。他经由过程对于x8六、Arm及RISC-V的阐发,指出生态惯性及软件兼容性于贸易化及技能落地中起到决议性作用,生态成熟度往往比硬件机能更能决议芯片成败。

唐志敏也夸大,软件界说一切,这不仅象征着运用开发与机能优化,更决议了算力芯片的持久竞争力及财产格式。

于算力系统演进中,硬件是基础,但软件及生态才是真实的“决议因素”。不管是 CPU、GPU 还有是将来的 XPU,把握及构建完备的软件生态,才能于高速增加的算力需求与繁杂的技能挑战中立在不败之地。

如下为唐志敏教员的出色演讲内容,雷峰网(公家号:雷峰网)作了不转变原意的收拾与编纂:

从“算力”到 Computility:算力正于被从头界说

“算力”实在是中国人本身创造出来的一个词。之前于计较机范畴,更多讲的是performance(机能),而不是算力。中国人甚么工作都喜欢讲“力”,好比体力、臂力、脑力,此刻又有了算力。

既然是咱们本身创造的词,那怎么翻译成英文?有人翻成Computing Power,但这个词我感觉不太好,听起来就很费电,此刻的算力确凿费电,但咱们其实不但愿算力尤其“更费电”。

以是有计较所的教员创造了一个新词,叫 Computility,把Compute(计较)及Utility(设置)合于一路,我小我私家是比力认同这个说法的。咱们但愿算力像水、电同样,成为一种基础举措措施。

现实上算力就是:于可接管的资源、可接管的时间内,完成某种计较使命的能力。

于算力这个观点之上,近来几年又呈现了许多新的“力”。好比此刻各人讲患上比力多的:

训力,就是快速练习出年夜模子的能力;

推力,就是基在年夜模子快速推理、天生成果的能力。

将来还有可能会有甚么力?我本身也做过一些畅想。此刻的年夜模子已经经可以理解语言,也能够天生视频,GPU 可以衬着高度传神的图形。假如把这些能力联合起来,或许有一天,咱们可以把小说直接“演”成电视剧。这类能力,素质上还有是算力系统不停演进的成果。

CPU 不克不及满意需求,异构计较成为一定选择

各类各样的计较芯片,是算力的基础。我本来是做高机能计较机系统布局,厥后进入半导体行业,会发明处置惩罚器及其它许多芯片其实不同样。处置惩罚器不是一个纯真的硬件,它最繁杂之处于在,要支撑运行很是繁杂、范围巨年夜的软件体系,以是呈现了“软件界说一切”的观点,好比软件界说存储,软件界说收集,软件界说无线电。

虽然摩尔定律逐渐放缓,但算力需求,特别是天生式人工智能对于算力的需求,却于连续快速增加,并且增加速率远远跨越了制程及工艺所能带来的机能晋升。

深圳理工大学唐志敏:异构计算已成必然,软件决定芯片胜负 |GAIR 2025

于这类环境下,只靠CPU必定不克不及满意对于算力的需求。CPU的主频及总体架构,二十多年里并无发生素质变化,以是咱们只能经由过程CPU + XPU的方式,好比CPU+GPGPU,或者者其他的PU,总称为XPU,及CPU形成异构计较架构,于通用性、机能、能耗及成本之间寻觅均衡。

XPU 的素质:硬件只是资源,机能取决在软件

但异构计较带来了编程、软件兼容性两浩劫题:

编程变患上越发坚苦;

本来只于CPU上运行的步伐,如今要分为两部门,一部门仍于CPU上,另外一部门放到XPU上运行。

从计较机系统布局的角度看,我习气把架构分成三类。

第一类是比力激进的布局,重要靠硬件做动态优化。为了运行繁杂运用,硬件要阐发指令之间的并行性,典型代表就是传统 CPU。

第二类是比力守旧的布局,硬件其实不去做繁杂阐发,而是提供年夜量运算部件及存储资源,至在这些资源怎么用,重要依靠软件,好比GPU及各类XPU。

第三类是消息态优化相联合的布局。

XPU素质上属在守旧型布局。硬件只卖力把计较资源提供出来,其实不包管机能必然能阐扬出来。机能能不克不及出来,更多取决在软件、编译器及步伐员。

主动并行化这个标的目的,学术界及工业界研究了几十年,效果始终有限。实际中,真正能把机能跑出来的,还有是依靠经验富厚的步伐员及成熟的软件系统。

也正由于如许,我一直夸大,算力芯片真正面对的焦点问题,不是硬件架构,而是运用生态。

深圳理工大学唐志敏:异构计算已成必然,软件决定芯片胜负 |GAIR 2025

所谓生态,就是能于处置惩罚器上运行的所有软件的总及,包括运用软件、操作体系、编译器、中间件、函数库及开发东西。终极真正孕育发生出产力的,是运用软件,而不是芯片自己。

生态惯性:x8六、Arm与RISC-V的实际界限

于CPU范畴,x86生态颠末四五十年的成长,已经经有很是高的市场据有率及生态惯性。哪怕是英特尔本身,也很难去鞭策一个不兼容x86的系统。

按照Gartner给出的全世界企业软件的环境,颠末多年成长,x86软件市场愈来愈年夜,基在x86软件的发卖收入是3000多亿美元。为x86开发软件的用度,每一年年夜概是600亿美元。而全世界办事器市场总的收入,年夜概是800亿美元。也就是说,一年卖出800亿美元的办事器,为了开发x86软件,每一年要新增600亿美元。可见软件开发需要泯灭年夜量精神。

深圳理工大学唐志敏:异构计算已成必然,软件决定芯片胜负 |GAIR 2025

于手机范畴很乐成的Arm也想要进入办事器范畴,可以看到一个又一个Arm架构办事器公司屡战屡败。他们的掉败有各类各样的缘故原由,我认为Arm架构于办事器范畴要乐成需要有两个缘故原由:一个缘故原由是把握全栈技能的至公司再也不利用x86,这是Arm的时机,典型的好比苹果不消x86,本身把握软件栈可以切换。另外一个缘故原由是端云交融,手机上及云端都用Arm架构,如许手机上的运用比力轻易迁徙到云端,包括云游戏等,如许Arm于办事器市场才更易乐成。

除了了Arm,RISC-V也是一个各人都于存眷的标的目的,但RISC-V到底灵不灵?它的开放性确凿带来了新的可能性,但开放及开源自己,其实不主动等在乐成,开放的CPU有许多,好比OpenRISC、OpenSPARC、OpenPower此刻也开放了。

也有人说Arm太贵,用RISC-V可以省钱。但我以前做芯片公司的时辰,一直买Arm的IP授权,也没感觉有多贵。若干年前,Arm一年的收入十几亿美元,如今Arm每一年收入三四十亿美元,Arm收入的增长是于许多公司利用RISC-V的配景下,这从某个角度申明了做RISC-V的公司需要反思。

还有有人说RISC-V更合适做研究,由于可以随意修改。但我认为做研究用甚么架构均可以,纷歧定要用RISC-V,用x8六、Arm照样可以做研究,这不是理由。

RISC-V开放,许多人但愿用开源硬件去走一条近似开源软件的成长路径,但我一直感觉,这条路并无那末轻易。及开源软件比拟,开源硬件的难度要年夜患上多。

从实际环境看,此刻全世界的 RISC-V 都面对着贸易化的坚苦。我看到一条新闻,Jim Keller——这个行业里做CPU架构的顶级人物——开办了一家做RISC-V的公司Tenstorrent,近来最先裁人了。包括Tenstorrent于内美国好几家公司做出了RISC-V芯片,但问题是不知道卖给谁。

今朝相对于做患上好一些的,反而是一些软件相对于简朴的嵌入式场景,好比做存储的企业,把 RISC-V 用来做存储节制器。这种场景软件很是简朴,确凿能用,也用患上不错。但一旦进入计较范畴RISC-V面对的问题就多了许多。

这暗地里反应的,不只是软件生态的问题,硬件生态自己也还有不可熟。只要是 CPU,就必然会走向多核,多核就触及片上互联收集,Arm于片上互联这件事上,已经经有比力成熟的解决方案,但RISC-V还有没有。

在是就呈现一种很实际的困境:想做RISC-V CPU,但片上互联又要去找Arm买。Arm愿意把互联收集卖给你,也想趁便把CPU核一路卖给你。这就是RISC-V今朝于工程层面面对的现实坚苦,也申明还有有很长的路要走。

为何兼容 CUDA 轻易,复制 CUDA 生态极难?

也有人认为,未来指令体系可能没那末主要,由于此刻是“软件界说一切”,上层可以用 Python、Java 这些平台无关的高级语言。但从现实成长来看,环境其实不是如许。以Intel为例,不管是已往的AVX-5十二、SGX,还有是此刻缭绕人工智能不停插手的新指令,都申明:硬件指令的直接撑持,对于机能及能效始终是有价值的。

于XPU范畴也是近似的环境。此刻各人都于讲兼容 CUDA,由于 CUDA 的生态确凿做患上好。许多做其他XPU、AI加快器的厂商,第一件事就是要兼容CUDA。

但 CUDA素质上是甚么?它实在就是一个高级语言接口,是英伟达的一套API。从技能角度看,兼容一个API其实不难,有一个编译器,就能够兼容CUDA的接口。但真正难的,是兼容 CUDA 暗地里的软件生态。

生态从来不只是一个 API,它包罗了年夜量算力库、函数库、开发东西及工程实践,这是一套很是繁杂、持久演进的系统,事情量极为重大。

也正由于云云,此刻国度层面也意想到这个问题的主要性,正于鞭策各人一路做生态设置装备摆设。从这个角度看,打造咱们本身的算力生态长短常有须要的。除了了CUDA,英特尔、AMD 也都于做各自的生态,咱们假如不做,就永远受制在人。

谁能把芯片做成?软件生态决议成败

从总体来看,咱们此刻的算力系统仍旧存于不小的缺口及瓶颈。中国以致全世界规模内,半导体的成长速率都于放慢,但算力需求却于连续增长。中国还有面对制程方面的限定,这就决议了咱们必需经由过程跨学科交织,于体系、软件及算法层面,去寻觅现实机能的冲破。

深圳理工大学唐志敏:异构计算已成必然,软件决定芯片胜负 |GAIR 2025

算力的阐扬,靠的不只是硬件。硬件固然是基础,但硬件的峰值机能,素质上只是一个指标。真实的机能晋升,很年夜一部门来自软件优化。

做高机能计较的人都知道,LINPACK可以把整机效率跑到60%~70%,但LINPACK只是测试步伐,不是真实运用。真实的运用软件,能跑到整机20%~30%的效率已经经很是不易。这内里还有有很年夜的优化空间。

深圳理工大学唐志敏:异构计算已成必然,软件决定芯片胜负 |GAIR 2025

咱们的芯片峰值机能可能很难做到最高,但若能打破硬件及软件之间的隔膜,于软件、编译、体系层面多做一些优化,即便于峰值机能相对于低一些的芯片上,也彻底有可能得到不错的运用效果。这是将来很是主要的一项事情。

别的,此刻各人都于做 GPGPU,但GPU最基本的能力一样主要,好比纹理天生、图案着色、光照及暗影处置惩罚等。此刻有些GPGPU已经经发生了“异化”,只能计较,不克不及衬着。但若咱们真的要实现从小说天生电视剧,不仅需要 GPGPU 的计较能力,也一样需要GPU的图形衬着能力。AIGC不只是天生文章,还有应该能天生影视内容。

计较芯片财产的成长,自己是一个螺旋式上升的历程。初期体系厂商城市本身做CPU,由于 CPU是计较机体系的焦点;厥后因为量产及成本压力,x86快速成长,体系厂商慢慢退出;而此刻,体系厂商及平台厂商又从头最先自研芯片。

美国的互联网巨头云云,中国的互联网厂商、体系厂商也都于自研CPU。自研自用这条路能不克不及走通,要害其实不于在“能不克不及做芯片”,而于在:可否为产物及办事提供充足年夜的增值,可否掌控全栈软件系统。

苹果是一个很是典型的乐成案例。从跟摩托罗拉及IBM结合开发PowerPC CPU,到转向采用Intel CPU,再到基在Arm架构自研CPU,它之以是能乐成,缘故原由实在很是简朴:经由过程自研高机能芯片,共同自有的软件系统,形成很是领先的用户体验,于此基础上把产物卖患上很贵。手机卖患上贵,条记本也卖患上贵。其它厂商假如做不到这一点,仅仅自研芯片,终极年夜几率城市掉败。只有软硬件通吃,才能真正卖患上贵。

咱们要不要再弄新的指令体系?我小我私家的见解是:架构立异不需要依靠新的指令体系。指令体系只是硬件及软件之间交流的语言,咱们不必不停增长新的语言。假如要做立异,于现有指令系统下彻底可以做,RISC-V 已经经充足了。

归根结柢,谁能把芯片做乐成?不论是CPU还有是GPU,只有真正器重软件及运用生态,才有乐成的可能。“软件界说一切”,这个“一切”,一样包括乐成及掉败。

对于在平台厂商及体系厂商来讲,假如要自研芯片,必然要有清楚的差异化,而且这个差异化必需能为体系或者办事带来显著增值,不然利用成熟的商用芯片,反而是更理性的选择。

末了我还有是但愿,各人能把RISC-V作为一个同一的指令体系标的目的。不管是CPU、GPU还有是其他处置惩罚器,都只管即便同一到统一架构平台上,削减反复投入。

深圳理工大学唐志敏:异构计算已成必然,软件决定芯片胜负 |GAIR 2025

咱们常说“三国定律”,合久必分,分久必合。已往是CPU为中央,此刻是CPU + XPU的异构系统,将来或许会回到以CPU为中央的新一体化架构。RISC-V具有必然的包涵性,有时机交融 CPU、GPU 及 AI 处置惩罚器的特征,接收开源系统的气力,慢慢冲破 CUDA 的生态壁垒。

以上就是我全数的分享,谢谢各人。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

-米兰·(milan)中国官方网站

相关内容

All rights reserved ©2026 Jinko Power.Powered by Webfoss.沪ICP备15009312号-1