米兰·(milan)中国官方网站- 生产先进模型的「AI工厂」,有哪五大核心要素?|WAIC 2025

2026-04-04 08:44:32

导语:AI工场出产效率 = 加快计较通用性 × 单芯片有用算力 × 单节点效率 × 集群效率 × 集群不变性。

从GPT系列、Gemini到DeepSeek、QWen的快速更新,模子练习迭代时间已经缩短至不足3个月,于现今天生式人工智能高速成长的海潮中,AI模子的范围及繁杂度不停爬升,迭代速率也于缩短,怎样高效、不变地出产进步前辈AI模子,成了科技竞争的焦点核心。

年夜模子练习对于算力、效率及体系不变性的高要求,催生了全新的基础举措措施理念——“AI工场”。

生产先进模型的「AI工厂」,有哪五大核心要素?|WAIC 2025

摩尔线程开创人兼CEO张建中于世界人工智能年夜会(WAIC 2025)揭幕前夜的技能分享会中暗示,为应答天生式AI发作式增加下的年夜模子练习效率瓶颈,摩尔线程将经由过程体系级工程立异,构建新一代AI练习基础举措措施,致力在为AGI时代打造出产进步前辈模子的“超等工场”。

出产进步前辈模子的超等工场,不仅代表了AI算力架构的立异,更意味着从芯片设计到年夜范围集群协同的体系级工程进级。

甚么样的基础举措措施可以或许称之为AI工场?

可以类比传统的工场。起首,它必需拥有强盛且通用的计较引擎,可以或许支撑从练习、推理到现实部署的全流程AI出产。其次,AI工场不是冷冰冰的算力重叠,更是一套体系性的工程立异调集,包括硬件架构优化、软件体系协同、高效能集群设置装备摆设及连续不变的运行保障。

这些要素配合转化为更高的AI出产效率及更低的运用门坎,从而鞭策通用人工智能的财产化进程。

生产先进模型的「AI工厂」,有哪五大核心要素?|WAIC 2025

摩尔线程提出的“AI工场”,犹如芯片晶圆厂的制程进级,是一个体系性、全方位的厘革,需要实现从底层芯片架构立异、到集群总体架构的优化,再到软件算法调优及资源调理体系的周全进级。经由过程全方位的基础举措措施厘革,鞭策AI练习从千卡级向万卡级以致十万卡级范围演进,以体系级工程实现出产力及立异效率的奔腾。

张建中指出,“AI工场”的智能“产能”,由五年夜焦点要素配合决议,其效率公式可归纳综合为:AI工场出产效率 = 加快计较通用性 × 单芯片有用算力 × 单节点效率 × 集群效率 × 集群不变性。

生产先进模型的「AI工厂」,有哪五大核心要素?|WAIC 2025

晋升AI出产效率的五年夜焦点要素

加快计较通用性、单芯片有用算力、单节点效率、集群效率、集群不变性这五年夜焦点要素,刚好是体系由小到年夜,从硬件到软件再到体系的要害。

1. 加快计较通用性

摩尔线程的构建AI工场因此自研的全功效GPU通用算力为基石,具有全功效GPU具有“功效完整”与“精度完备”特征,于海内芯片公司中独具上风。

摩尔线程基在自研MUSA架构的全功效GPU,单芯片便可集成AI计较加快(训推一体)、图形衬着(2D+3D)、物理仿真及科学计较、超高清视频编解码能力,充实适配AI训推、具身智能、AIGC等多样化运用场景。

生产先进模型的「AI工厂」,有哪五大核心要素?|WAIC 2025

而全功效GPU撑持从FP64至INT8的完备精度谱系,原生撑持FP8年夜模子练习和推理,并经由过程FP8混淆精度技能,于主流前沿年夜模子练习中实现20%~30%的机能跃升,为国产GPU的算力效率树立行业标杆。

这类通用性不仅极年夜晋升了硬件资源使用率,降低了体系冗余及开发成本,更为将来世界模子及新兴AI形态的动态演进提供了坚实底座。

2. 单芯片有用算力

高效芯片并不是只谈峰值算力,更磨练现实运用场景下的“有用算力”,摩尔线程经由过程三年夜冲破——计较、内存、通讯,显著晋升单GPU运算效率。

生产先进模型的「AI工厂」,有哪五大核心要素?|WAIC 2025

运算效率依靠在架构,摩尔线程立异的全功效、多引擎、可配置、可伸缩GPU架构,经由过程硬件资源池化和动态资源调理技能,构建了全局同享的计较、内存与通讯资源池,答应按照方针市场快速裁剪出优化的芯片配置,年夜幅降低了新品芯片的开发成本,于保障通用性的同时显著晋升了资源使用率。

生产先进模型的「AI工厂」,有哪五大核心要素?|WAIC 2025

于计较层面,AI加快体系(TCE/TME)周全撑持INT8/FP8/FP16/BF16/TF32等多种混淆精度计较。此中FP8技能经由过程快速格局转换、动态规模智能适配、高精度累加器等立异设计,于包管计较精度的同时,将Transformer计较机能晋升约30%。

生产先进模型的「AI工厂」,有哪五大核心要素?|WAIC 2025

内存优化方面,经由过程多精度近存规约引擎、低延迟Scale-Up、通算并行资源断绝等技能,内存体系实现了50%的带宽节省及60%的延迟降低,有用晋升数据传输能力。

生产先进模型的「AI工厂」,有哪五大核心要素?|WAIC 2025

通讯效率的优化,是经由过程独创的ACE异步通讯引擎削减了15%的计较资源损耗。别的,MTLink2.0互连技能提供了超出跨越海内行业平均程度60%的带宽,为年夜范围集群部署奠基了坚实基础。

3. 单节点效率

单芯片的有用算力高还有不敷,节点层面的履行效率,更是AI工场总体效能的基础。

摩尔线程是经由过程MUSA全栈体系软件实现要害技能冲破,此中的焦点包括了五个方面:

起首是使命调理优化,核函数启动(Kernel Launch)时间缩短50%。其次是极致机能算子库,GEMM算子算力使用率达98%,Flash Attention算子算力使用率冲破95%。然后是通讯效能晋升,MCCL通讯库实现RDMA收集97%带宽使用率;基在异步通讯引擎优化计较通讯并行,集群机能晋升10%。还有有低精度计较效率改造,FP8优化与行业首创细粒度重计较技能,显著降低练习开消。以和开发生态完美,基在Triton-MUSA编译器 + MUSA Graph实现DeepSeek-R1推理加快1.5倍,周全兼容Triton等主流框架。

生产先进模型的「AI工厂」,有哪五大核心要素?|WAIC 2025

强盛的单节点处置惩罚能力,不仅可以或许缩短年夜模子单机练习时间,更能于AI推理及现实营业部署中实现更低延时及更高吞吐,显著晋升每一台装备的投资回报率。这也为边沿计较、私有部署等行业AI场景提供了强力撑持。

4. 集群效率

AI工场是成千上万甚至十万块GPU高效协同的年夜范围集群。摩尔线程自研KUAE计较集群经由过程5D年夜范围漫衍式并行计较技能,实现上千节点的高效协作,鞭策AI基础举措措施从单点优化迈向体系工程级冲破。

此中,立异5D并行练习经由过程整合数据、模子、张量、流水线及专家并行技能,周全撑持Transformer等主流架构,显著晋升年夜范围集群练习效率。

机能仿真与优化,经由过程自研Simumax东西面向超年夜范围集群主动搜刮最优并行计谋,精准模仿FP8混淆精度练习与算子交融,为DeepSeek等模子缩短练习周期提供科学依据。

还有有秒级备份恢复,针对于年夜模子不变性难题,立异CheckPoint加快方案使用RDMA技能,将百GB级备份恢复时间从数分钟压缩至1秒,晋升GPU有用算力使用率。

按照摩尔线程给出的数据,基在平湖架构KUAE2智算集群,不管千卡集群或者更年夜范围,于每一个运用场景都能做到比外洋主流产物更高的机能及效率,到达行业领先程度。

生产先进模型的「AI工厂」,有哪五大核心要素?|WAIC 2025

5. 集群不变性

即便集群的效率再高,对于在任何年夜范围练习使命,可连续产出的不变性才是真实的护城河。

为此,摩尔线程立异推出零中止容错技能,妨碍发生时仅断绝受影响节点组,其余节点继承练习,备机无缝接入,全程无中止。这一方案使KUAE集群有用练习时间占比超99%,年夜幅降低恢复开消。

同时,KUAE集群经由过程多维度练习洞察系统实现动态监测与智能诊断,异样处置惩罚效率晋升50%,让用户看患上见及治理获得每个练习集群的每一一片GPU。再联合集群巡检与腾飞查抄,练习乐成率提高10%,为年夜范围AI练习提供不变保障。

张建中说,“摩尔线程的AI工场从五个点别离去做许多的事情晋升能力,咱们高效率的工场等在全功效的GPU X MUSA同一体系架构X全栈软件栈X高效的KUAE集群X零中止。只有如许的组合,才能确保每个环节都做到最佳,100% X 100% X 100%才能确保100%的乐成率。”

生产先进模型的「AI工厂」,有哪五大核心要素?|WAIC 2025

AI工场将加快哪些行业的成长?

完美的“AI工场”不仅需要高效练习年夜模子,还有需具有推理验证能力。

生产先进模型的「AI工厂」,有哪五大核心要素?|WAIC 2025

摩尔线程基在自研MUSA技能栈,构建笼罩LLM、视觉、天生类模子的全流程推理解决方案,实现“练习-验证-部署”的无缝跟尾。其MT Transformer自研推理引擎、TensorX自研推理引擎及vLLM-MUSA推理框架,为模子验证及部署提供极致机能撑持。

摩尔线程的数据显示,其旗舰产物MTT S5000满血跑DeepSeek R1模子推理,速率到达100 tokens/s,到达行业领先程度。

生产先进模型的「AI工厂」,有哪五大核心要素?|WAIC 2025

这就象征着,AI工场驱动的不仅是AI财产自身的技能跃升,更是各行各业智能化进级的要害引擎,摩尔线程以“KUAE+MUSA”为智算营业焦点,将加快浩繁行业的成长。

好比AIGC与内容创作:经由过程超年夜范围模子练习,实现更高质量的文本天生、图象、音频及视频内容创作,催生数字媒体、告白动漫等新业态发作。

科学计较与工程仿真:AI工场全功效GPU于物理仿真、药物研发、质料设计中高效撑持科学建模与年夜数据阐发,鞭策科研立异周期年夜幅缩短。

工业智能体与智能制造:AI工场撑持工业范畴的年夜模子练习及及时推理,晋升主动化工场、呆板人、工业检测等焦点环节的智能化程度,实现出产降本增效、精益治理。

医疗影像阐发:高效算力赋能医学图象阐发、病理辨认及疾病诊断,助力医疗智能化进级与普惠康健。

聪明交通与智能驾驶:经由过程海量传感器数据的及时处置惩罚与模子练习,为主动驾驶、高速公路治理、都会交通优化提供坚实算力基础。

具身智能与智能体:万能GPU撑持具身智能AI体于虚拟与物理情况间、高效举行感知、思索与运动节制,鞭策智能呆板人、虚拟人等前沿成长。

摩尔线程于2025世界人工智能年夜会(WAIC)的站台上也展示了于上述场景中的运用。

可以看到,摩尔线程“AI工场”力求打破算力枷锁束缚,为千行百业的数智化转型提供底座。从图形衬着到AI算力引擎,从全功效GPU到体系级优化,其五年夜焦点技能要素修筑的不只是一个“出产进步前辈模子的超等工场”,更是AGI新时代财产智能进级的动力源泉。雷峰网(公家号:雷峰网)

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

-米兰·(milan)中国官方网站

相关内容

All rights reserved ©2026 Jinko Power.Powered by Webfoss.沪ICP备15009312号-1