米兰·(milan)中国官方网站- 更快、更强、更小，AI让HBM「卷」出新高度

2026-04-06 19:08:18

导语：高带宽内存（HBM）的销量正于飙升。

因为人工智能加快器、图形处置惩罚器及高机能计较运用步伐需求量连续激增，高带宽内存（HBM）的销量正于飙升。

人工智能海潮激发的本钱市场对于在年夜语言模子生态的投入使HBM经常处在断货状况，由于HBM是创立年夜模子所需数据的首选贮存器。而且，为了晋升机能而打造的多层高密度组织以和SRAM（静态随机存取存储器）面对的限定都将市场对于HBM的需求推到了更高的维度。

Rambus高级副总裁兼硅IP总司理Matt Jones暗示：“跟着人工智能练习模子的不停扩展，对于在硬件层面的机能要求也于不停提高，这就要求内存的立异解决方案，为了确保人工智能的连续增加及前进，业界必需继承降服内存带宽及容量方面的障碍。”

这类势头很年夜水平上由进步前辈封装鞭策，于很多环境下，进步前辈封装可以提供比体系级芯片SoC更高效的数据路径。日月光半导体（ASE）投资者瓜葛主管Ken Hsiang于近来的财报德律风集会上暗示：“前沿封装正处在发作的前夕，不管是人工智能、收集还有是其他正于研发的产物，对于进步前辈的互连技能的需求很是强烈。”

HBM与进步前辈封装高度契合。三星半导体副总裁兼DRAM产物计划主管Indong Kim于近来的一次演讲中暗示：“HBM定制将迎来一波年夜海潮，人工智能基础举措措施的成长需要极高的效率及扩大能力，咱们与重要客户一致认为，合用在人工智能产物的定制化HBM将是要害的一步。功率，机能及面积（power, performance and area，简称PPA）是人工智能解决方案的要害，定制将于PPA方面提供主要价值。”

已往，经济效益严峻地限定了HBM被广泛采用。硅中介层（协助上基层节点举行信息互换）价格昂贵，而于前道工序（FEOL）的存储单位之间处置惩罚年夜量硅通孔 (TSV，穿透硅晶圆或者芯片的垂直互连技能) 一样成本昂扬。日月光半导体的工程及技能营销高级总监曹立宏暗示：“跟着高机能计较、人工智能及呆板进修带来的需求增长，中介层的尺寸也显著增长，高成本是其面对的重要错误谬误。”

虽然这限定了它于公共市场的吸引力，但对于成本不太敏感的运用（如数据中央）仍体现出强劲的市场需求。HBM的带宽是任何其他存储技能没法相比的，硅中介层的2.5D集成已经经成为事实上的尺度。

但客户是贪心的，他们永远于寻求更好的机能，这就是为何HBM制造商于不停改良凸块质料及成型质料，实现从8层到12层和16层DRAM的奔腾，从而可以或许以闪电般的速率处置惩罚数据。HBM4的数据处置惩罚速率将于HBM3E的基础上有很年夜的晋升，而实现这一方针的重要计谋是将数据线的数目从HBM3的1024条增长到2048条。

于全世界市场中，有三家重要的公司出产HBM内存模块，即美光、三星及SK海力士。虽然他们都利用TSV及微凸点技能（于集成电路封装历程顶用在实现芯片间互连的微型毗连点），将DRAM仓库及配套装备集成到进步前辈的封装中，但每一家公司采用的要领略有差别。三星及美光于每一个凸块层都插手了非导电薄膜（NCF，该薄膜是一种聚合物质料，用在使芯片相互绝缘并掩护毗连点免受撞击）和热压键合（TCB，焊接工艺，将芯片与基板固定于一路）技能。而SK海力士则继承采用倒装芯片年夜范围回流工艺的模塑底部填充（MR-MUF）方案，该工艺可以将仓库密封于高导电性成型质料中。

HBM的垂直毗连是利用铜TSV及重叠DRAM芯片之间的缩放微凸块来实现的，下部缓冲器和逻辑芯片为每一个DRAM提供数据路径。产物的靠得住性问题很年夜水平上取决在回流、粘接及模具反磨历程中的热机械应力，而辨认潜于问题需要测试高温事情寿命（HTOL）、温度湿度误差（THB）及温度轮回，可以经由过程采用预处置惩罚、无偏湿度及压力测试（uHAST）来确定各层之间的粘附程度。此外，还有需要举行其他测试，以确保持久利用中不会呈现微凸块短路、金属桥接或者芯片及微凸点之间的接口分层等问题。混淆键合是替换HBM4代产物微凸块的一种选择，但条件是满意产量方针。

更快、更强、更小，AI让HBM「卷」出新高度

另外一项正于研发的技能是3D DRAM，其参考3D NAND闪存技能，将存储单位举行翻转。三星的Kim暗示：“3D DRAM重叠将年夜年夜降低功耗及占用的面积，同时消弭来自中介层的机能障碍，内存节制器从SoC移到基础裸片（晶圆颠末切割测试后没有颠末封装的芯片）将为人工智能提供更多的逻辑空间。咱们坚信定制HBM将实现机能及效率双双晋升，慎密集成的内存及代工能力将为年夜范围部署提供更快上市和更优质的产物。

更快、更强、更小，AI让HBM「卷」出新高度

这里的整体趋向是将逻辑组件挪动到更接近内存之处，以便于内存中或者内存四周履行更多的处置惩罚，而不是将数据挪动到一个或者多个处置惩罚元素。但从体系设计的角度来看，要实现技能的落地还有面对许多坚苦。

Lam Research高级封装技能总监cheping Lee暗示：“这是一个冲动人心的时刻，人工智能云云火热，HBM可以贮存一切，各家存储器制造商都于分秒必争地率师长教师产下一代HBM。”

关在下一代产物HBM4， JEDEC（固态技能协会）正忙在制订这些模块的尺度。同时，JEDEC将HBM3E尺度的最年夜内存模块厚度从720妹妹扩大到775妹妹，这仍旧合用在40μm厚的芯片。HBM尺度确定了每一针传输速度、每一个仓库的最年夜芯片数目、最年夜封装容量（单元为GB）及带宽等参数。尺度的设置使患上设计及流程患上以简化，从而帮忙HBM产物以更快的速率进入市场，现阶段为每一两年举行一次产物的迭代。行将推出的HBM4尺度将界说24Gb及32Gb层，以和4层、8层、12层及16层高TSV仓库。

HBM的进化史：对于工艺及带宽的极致寻求

高带宽内存的成长可以追溯到2008年，最初的研发愿景是经由过程这款产物解决计较内存面对的功耗及占用面积增长的问题。

三星电子的Sungmock Ha和其同事暗示：“其时，作为最高频段DRAM的GDDR5，其带宽被限定于28GB/s（7Gbps/引脚 x 32个输入/输出端口）。”而HBM Gen2的呈现使技能实现庞大的晋升，经由过程将输入/输出端口的数目增至1024个，于不降低频率的环境下，乐成实现了307.2GB/s的带宽冲破。

从HBM2E最先，厂商经由过程采用17nm高K金属栅工艺（使用高K介质质料取代通例栅，可以有用解决多晶栅极耗尽问题），到达每一引脚3.6Gbps，带宽460.8GB/s。而今朝HBM3新推出了每一引脚6.4Gbps的传输速度，实现8到12个芯片重叠，与上一代比拟带宽提高了约2倍。

这只是故事的一部门，HBM还有一直于向处置惩罚技能挨近，以提高机能。

年夜范围回流焊是最成熟及最自制的焊接方案。Amkor的工程及技能营销副总裁Curtis Zwenger暗示：“年夜大都环境下，城市采用年夜范围回流焊技能，由于装备安装的本钱支出很年夜，但后续的出产成真相对于较低。这项技能为将芯片与高端模块毗连到封装基板上提供了一种经济实惠且高效的方式。不外，跟着对于机能的需求不停晋升，以和异构集成（指将多个差别工艺节点零丁制造的芯片封装到一个封装内部，以加强功效性及提高机能）模块及高级基板解决方案空间的日趋扩展，其致使的后果是异构集成及基板的翘曲水平加重。而热压技能及R-LAB（反向激光辅助键合）作为传统年夜范围回流焊的工艺进级，可以更好地处置惩罚翘曲问题。”

微凸块金属化工艺经由过程优化后，可以提高靠得住性。假如微凸块与焊盘之间的毗连采用传统的回流工艺，而且此中含有助焊剂及底部填充质料，则填充的空地及残剩的助焊剂残留可能致使凸块之间夹带的形成。为相识决这些问题，预涂非导电薄膜（NFC）被广泛采用，其可以于一步键合工艺中代替助焊剂、填充质料及键合步调，而且不会孕育发生夹带。

三星每一一代产物城市增长NCF质料的厚度，NCF素质上是一种环氧树脂，含有固化剂及其他添加剂。这项技能带来许多利益，尤其是于更高的叠层上，由于业界正于努力减轻芯片裸片变薄带来的芯片裸片翘曲问题，而其优化的点于在彻底填充凸点周围的底部填充区（为凸点提供缓冲），使焊料流动，防止空地孕育发生。

SK海力士从HBM2E产物最先，就将年夜范围回流模塑底部填充技能改成NCF-TCB。其导电模具质料是与质料供给商互助开发的，可能利用专有的打针工艺，这一技能使患上SK海力士实现精彩的晶体管结温节制。

HBM中的DRAM仓库被放置于缓冲芯片上，因为各家公司都于努力将更多的逻辑运用到这一基础芯片上以降低功耗，同时还有将每一个DRAM内核与处置惩罚器毗连起来，使缓冲芯片的功效于不停增长。每一个芯片都被挑拣出来并放置于载体晶圆上，然后回流焊，末了重叠成型，颠末反面研磨、清洁及切割等工序打造生产品。台积电及SK海力士公布，晶圆代工场此后将向内存制造商提供基础芯片。

新思科技研发总监Sutirtha Kabir暗示：“逻辑存储器始终是市场存眷的核心，只管这个范畴于此前就已经经被研究过。但每一一种解决方案都将于电力及热能方面面对挑战，这二者是紧密亲密相干的。直接影响是热应力（因为温度变化引起质料内部或者外部孕育发生的应力），这不仅局限在组装层级，对于整个体系城市孕育发生影响。因为可能会利用混淆键合或者者细间距键合技能，热问题对于机械应力的影响更值患上探究。”

此外，基础逻辑孕育发生的热量也会于逻辑芯片及DRAM芯片之间的接口处孕育发生热机械应力。因为HBM模块的位置接近处置惩罚器，来自逻辑芯片的热量不成防止地传导到存储器内。SK海力士的高级技能司理Younsoo Kim暗示：“咱们的数据显示，主机芯片温度每一升高2℃，HBM的温度至少会升高5-10℃。”

NCF-TCB工艺一样面对挑战。于高温高压下发生的热压键合会致使2.5D组装呈现问题，例如突出与底层镍垫之间的金属桥接或者界面分层。别的，TCB自己的产量也相对于较低。

对于在任何多芯片重叠而言，翘曲问题与外貌质料的膨胀系数（TCE）不匹配有关，于加工及利用历程中，这会致使温度轮回孕育发生应力。应力凡是集中于一些要害部位，好比于基础裸片及第一个内存芯片之间，以和微凸块层级。产物的仿真模子可以帮忙解决这些问题，但也有部门问题只有于现实产物运用中才能充实表现其带来的影响。

人工智能运用的运行依靠在对于DRAM芯片、TSV、集成基本逻辑功效的芯片及多达100个去耦电容器的乐成组装及封装。与图形处置惩罚器、CPU或者其他类型处置惩罚器的联合是一个周详设计的组装工程，需要所有组件实现有机契合，以形成高产且靠得住的体系。

跟着行业从HBM3过渡到HBM4，制造高机能DRAM仓库的工艺只会变患上越发繁杂。不外，供给商及芯片制造商也于存眷更低成本的替换品，以进一步提高这些高速及不成或者缺的内存芯片仓库的被市场采用。

本文由雷峰网(公家号：雷峰网)编译自：https://semiengineering.com/hbm-options-increase-as-ai-demand-soars/

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

-米兰·(milan)中国官方网站

milan米兰官方网站科技近50MW工...