2026-01-29
milan米兰官方网站科技近50MW工商业分布式项目集中完工,赋能多元产业场景
了解详情
2026-04-06 14:10:30
导语:用ASIC还有是GPU?这是一个问题。 当GPT-4被问到于GPU(图形处置惩罚单位)上及于ASIC(专用集成电路)上运行,哪一个会更高效时,它答道:「假如我利用专门为AI使命设计的ASIC,我可能会实现更快的机能及更高的效率。」 于练习年夜模子数据呈现可预感枯竭确当下,ASIC逐渐进入人们视线,看重研发ASIC芯片的博通(Broadcom)乘风而起。上周五晚,美股市场呈现买博通、卖英伟达(NVIDIA)的场景——博通股价年夜涨超24%,创下汗青最高当日涨幅记载,成为继英伟达及台积电后,第三家市值冲破一万亿美元的半导体公司。 据雷峰网相识,今朝博通的市盈率(P/E Ratio)已经高在英伟达:按12月17日收盘价,博通的市盈率为184.79,而英伟达的市盈率为51.54。这好像也注解,投资者们更看好博通的将来。 与看重研发通用芯片GPU的英伟达差别,博通更专注在ASIC定制化芯片。这种能耗较低、专为特定使命设计的芯片,对于企业的研发技能程度要求很高、建造流程也耗时较长。也是以,有行业人士指出「这些芯片其实不合适所有人」。不外,于AI年夜模子推理被提上日程的今天,GPU的性价比也逐渐被打上问号。也许,博通及英伟达的将来成长,不仅是两家科技公司的贸易计谋相较,也是GPU及ASIC两种芯片运用场景的一较高下。 图源:greenmossinv 博通的突起:天时人地相宜 本年12月,博通发布的最新一期第四财季财报显示,其整年AI相干营业收入同比实现增加220%。 博通CEO Hock Tan指,这患上益在公司旗下AI XPU类芯片及以太网产物组合的需求支撑。他续吐露,今朝博通已经有三家超年夜范围客户制订本身的多代AI XPU线路图,估计到2027年,每一个客户于单一收集架构中将部署100万个XPU集群;同时,博通还有于为两家新的超年夜范围客户设计开发响应下一代AI XPU产物,估计将于2025年下半年实现对于3nm XPU的年夜范围出货。 按照业界阐发,博通ASIC芯片的年夜客户重要包括google、Meta。也有传言称,字节跳动及Open AI已经与博通互助开发芯片。近日也有动静吐露,苹果好像正与博通互助规划开发AI办事器芯片。 据相识,博通为这些知名科技公司开发用在AI、通用数据处置惩罚等用途的芯片,通常为与其客户确定事情的负载需求后,跟互助伙伴确定芯片的规格,使用博通于硅片设计方面的专业常识,开发其重要存于差异化因素的要害方面,如处置惩罚单位架构。以后,博通于硅片中实现该架构,并配备平台特定的IP、缓存、芯片间互联接口。 博通的AI计较ASIC还有使用共封装光学器件来提高能源效率及可扩大性,削减体系延迟,满意更繁杂的计较要求。与传统的光学器件比拟,其功耗可节省高达30%。 于本年12月初,博通公布推出其3.5D eXtreme Dimension体系级封装 (XDSiP™) 平台技能,使消费级AI客户可以或许开发下一代定制加快器 (XPU)及计较ASIC。3.5D XDSiP于一个封装装备中集成为了跨越6000平方毫米的硅片,及多达12个高带宽内存 (HBM) 仓库,可实现年夜范围AI的高效、低功耗计较。博通推出的这款业界首个Face-to-Face (F2F) 3.5D XPU,是一个主要的里程碑。 练习天生式AI模子所需的巨年夜算力依靠在10万个到100万个XPU的年夜范围集群。这些XPU需要愈来愈繁杂的计较、内存及I/O功效集成,同时最年夜限度地降低功耗及成本。于已往十年中,2.5D集成——触及于中介层上集成多个芯片(面积高达250妹妹²)及HBM模块(高达 8 HBM)——已经被证实对于XPU的开发颇有价值。然而,跟着渐趋繁杂的LLM(年夜型语言模子)推出,它们的练习需要3D硅重叠,以到达更好的尺寸、功率及成本。是以,将3D硅重叠与2.5D封装相联合的3.5D集成,有望成为将来十年下一代XPU的首选技能。 与F2B(正面临反面)比拟,博通的3.5D XDSiP平台于互连密度及功率效率方面取患了显著的改良,其重叠芯片之间的旌旗灯号密度提高了7倍。而且,经由过程利用3D HCB而非平面芯片到芯片PHY,可将芯片到芯片接口的功耗降低10倍。于此基础上,这一技能还有可最年夜限度地削减3D仓库内计较、内存及I/O组件之间的延迟;并实现更小的中介层及封装尺寸,节省成本并改善封装翘曲。 建立在1991年的老博通,最初是一家专注在宽带通讯解决方案的小型半导体公司,产物规模涵盖有线及无线通讯、企业存储及数据中央解决方案。该公司于2016年被Avago Technologies收购后采用博通(Broadcom)这个名字。如今,博通为当下最要害的技能提供撑持,包括5G收集、人工智能及物联网 (IoT)。 博通于人工智能市场的乐成很年夜水平上归功在其定制硅片解决方案及高速收集产物。它已经成为重要科技巨头的人工智能芯片的重要供给商,其XPU技能于超年夜范围客户中愈来愈受接待。博通还有指出,芯片市场正从以CPU为中央转向以毗连为中央,尔后者恰是博通的专长。Piper Sandler阐发师Harsh Kumar也看好博通:「咱们继承认为博通是最佳的AI公司(不包括英伟达),由于它于定制ASIC营业中盘踞强势职位地方,而且拥有强盛的软件产物组合」。 于AI革命热潮下,博通的多管齐下战略,包括投入资金举行收购、提供定制芯片及扩大到软件营业,使其成为强盛的竞争敌手。 与此同时,跟着AI年夜模子练习数据渐趋枯竭,AI范畴的使命从练习端慢慢转向推理端。有行业人士指,这一转型或者象征着人们对于芯片的计较精度要求相对于可能降低,但对于计较速率、能效成本等要求提高,而能以较低功耗实现快速推理计较的ASIC正好满意这一需求。对于此,博通CEO Hock Tan猜测:将来50%的AI算力城市是ASIC提供。他更放言:2027年市场对于定制AI芯片ASIC的需求范围将达600亿至900亿美元。 博通于AI范畴的斗胆举措,为AI芯片市场的史诗级对于决埋下伏笔。 X+ASIC vs 英伟达软硬件 「护城河」被攻破了吗 于英伟达盘踞AI芯片重要市场份额的环境下,年夜型科技公司都但愿能削减对于其依靠,博通也将本身定为替换方案。于此之下蓬勃生长的博通,甚至让英伟达CEO黄仁勋感应威逼。他认可:「博通(及其他草创公司)的复苏让英伟达的计划者感应紧张。」 与持久主导行业的英伟达GPU差别,博通于市场上的差异化于在它正于为全世界顶级科技公司制造很是昂贵的定制AI芯片,承诺帮忙他们将速率提高20%至30%,并将功耗降低25%。ASIC为拥有年夜量不变AI事情负载的科技巨头,提供巨年夜的商机,可以帮忙企业于本钱支出及功耗方面节省年夜量成本,这使其成为更具成本效益的选择。 不外,这些芯片对于企业的研发技能程度要求较高,且需要年夜量初始本钱投资,建造流程也较长。据悉,做一款ASIC芯片,需颠末代码设计、综合、后端等繁杂的设计流程,再经几个月出产加工以和封装测试,才能拿到芯片来搭建体系。有阐发师指出:「你必需是google、Meta、微软或者甲骨文如许的公司才能利用这些芯片,这些芯片其实不合适所有人。」 是以,英伟达于市场的带领职位地方还没有被减弱。 英伟达竖起的结实壁垒,靠的不仅是其通用芯片,还有有平台衍生出的重大软件生态。英伟达公认的强盛「护城河」CUDA,作为一种专门用在加快GPU运算的专利软件技能,能让工程师省下年夜量撰写低阶语法的时间,直接利用诸如C++或者Java等高阶语法,来编写运用在通用GPU上的演算法,解决平行运算中繁杂的问题。这一软件配以英伟达的GPU及收集传输NVLINK——后者是一种高速、低延迟的互联技能——三张王牌协力,强盛的软硬件协同完美的生态,巩固其广泛的客户群体。 但业界对于CUDA的过在依靠,已经让不少主打AI的公司最先警惕。而做收集身世的博通,强盛的技能堆集能为客户提供高机能收集传输;同时,客户于配备博通AI芯片的条件下,可以继承利用本身公司的算法、体系及模子,无需思量芯片是否顺应英伟达的CUDA——这让它逐渐成为一个有力的选项。 于汗青上,英伟达曾经面临诸多强盛的敌手,如Google、微软、META等巨头均有触及制造GPU,但由于产能、CUDA等限定,这些公司都没法与英伟达竞争;但此刻于ASIC芯片这一赛道上,因为场景于上述巨头手上,从而绕开了对于英伟达生态系统的依靠。 换言之,博通与英伟达以前的敌手如AMD、Intel差别,后者更可能是于技能上与英伟达睁开竞争,但博公例是经由过程与其他对于AI算力有需求的贸易巨头的互助,当Google、Amazon等本身设计芯片后,交由博通完成后续的制造,于贸易模式上撼动英伟达的带领者职位地方。 这类 X+ASIC vs 英伟达的模式,也恰是让英伟达感应紧张的缘故原由。 于半导体芯片的汗青上,近似的模式最乐成的案例是ARM,差别的是,ARM采纳的是IP授权模式,它不向市场出售制品芯片,而是靠将其研发的指令集架谈判处置惩罚器IP而赢利。依附这一模式,ARM于挪动互联网时代战胜了强盛的Intel,拿下了今天挪动终真个年夜市场。 不成否定的是,ASIC是专门为特定运用开发的,矫捷性较差,且开发成本昂扬耗时;而GPU是可编程的,矫捷性高,可用在各类使命,可快速实行,拥有成熟的软件及硬件基础举措措施,包括广泛利用的编程语言及库。纵然于可扩大性方面,GPU迄今为止也患上分颇高。英伟达今朝是最受接待的AI芯片制造商之一屡见不鲜。 可是,如许的场合排场还有能连续多久? 到达的极限GPU 可否交给ASIC接力 今朝,主流AI芯片重要包罗以GPU为代表的通用芯片、ASIC定制化为代表的专用芯片和FPGA为代表的半定制化芯片。当评论辩论年夜语言模子和练习集群或者一般的人工智能时,GPU仍是默许选择——专为图形处置惩罚而生的GPU,并行处置惩罚能力精彩,切合AI计较场景的需求,如处置惩罚年夜量数据集及加速模子练习时间等。英伟达的GPU仍被用在为最强盛AI模子的练习及运行提供动力。 然而,只管于练习场景中效率很高,GPU于扩大AI运用以举行广泛利用方面,却仍面对着庞大的错误谬误。于成本及能源上,它是一种昂贵的选择。雷峰网(公家号:雷峰网)相识到,GPU设计偏重在64位元夙来处置惩罚广泛的计较使命,但于及时AI事情负载中,抛却64位组件可以将芯片尺寸及能源需求削减多达三分之一,同时仍能满意年夜大都AI处置惩罚需求。 跟着AI走向推理,尤其是处在必需于接近源头之处处置惩罚数据的边沿情况时,与GPU相干的高成本及功耗将变患上愈来愈难以蒙受。GPU或者已经到达极限。 相反,专用在AI的ASIC此刻为特定推理使命提供了更具成本效益及更强盛的替换方案。举行推理更夸大的是合适边沿部署的可扩大、节能的硬件解决方案——边沿AI装备于现场处置惩罚数据,而非将其传输到中心数据中央,是以,它们会受益在轻量级、专用的芯片。 除了了博通,另外一家相对于年青的ASIC制造商Etched研发出了世界上第一款Transformer ASIC 「Sohu」。他们对于将来的决定信念不仅于产物上,还有于ASIC的成长势头上—— 已往几年内,AI模子已经变患上云云智能,甚至比人类更好地履行尺度化测试,这患上益在它们得到愈来愈多的计较能力。然而,数据中央的扩大并不是无穷,Etched指出:「再扩展1000倍将是昂贵的,下一代数据中央的成本将跨越一个小国的GDP。根据今朝的速率,咱们的硬件、电网及钱包都跟不上」 「假如模子的练习成本跨越10亿美元,推理成本跨越100亿美元,那末专用芯片是不成防止的。于这类范围下,1%的改良就足以证实一个价值5000万至1亿美元的专用芯片项目是合理的」,Etched说道。 此外,于另外一个范畴——挖矿,ASIC及GPU也各有千秋。ASIC作为定制专用芯片,于靠得住性、保密性、算力、能效上,都比通用芯片更强,相较在GPU及CPU,于挖矿时效率也会更高。据统计,ASIC计较哈希(Hashes)的速率比GPU及CPU快10万倍,一台ASIC矿机可以提供约3000美元的高端哈希算力。 不外,因为ASIC是为开采特订货币而制造的专用集成电路,是以于应答加密钱币挖矿营业或者挖矿难度的变化方面,则缺少矫捷性。虽然ASIC矿机效率高、盈利能力强,但零售矿工及刚进入挖矿行业的小我私家,或者会对于ASIC矿机的昂扬肇始成本望而生畏。 相较而言,GPU因为其多功效性,能挖掘各类加密钱币,矿工可以于差别的加密钱币之间切换,以应答收集难度及挖矿操作的变化。但GPU能耗高,经济性较差,且需要年夜量显卡及辅助冷却装备,GPU装备也需要更年夜的空间,这对于在空间有限的矿工可能会成为问题。 不成否定的是,GPU将继承于人工智能练习中阐扬要害作用,但因为其成本及能源效率限定,行业向ASIC的改变也已经呈现。将来GPU是否依然能盘踞年夜量的市场份额?ASIC漫长的开发周期及初始成本,又可否满意日月牙异的AI时代下用户的需求?于对于AI年夜模子的成长由练习转向推理确当下,一切悬而未决。 参考资料: https://www.cnbc.com/2024/12/14/broadcoms-long-path-to-the-trillion-dollar-club-and-trumps-role.html https://www.investing.com/news/swot-analysis/broadcoms-swot-analysis-ai-chip-leaders-stock-poised-for-growth-93CH-3775161 https://www.tomshardware.com/tech-industry/artificial-intelligence/ai-gpu-clusters-with-one-million-gpus-are-planned-for-2027-broadcom-says-three-ai-supercomputers-are-in-the-works https://finance.yahoo.com/news/nvidia-broadcom-top-analyst-picks-141957599.html https://www.artificialintelligence-news.com/news/broadcom-ai-surge-challenges-nvidia-dominance/ https://theafricalogistics.com/money/broadcoms-journey-to-the-1-trillion-club-a-semiconductor-success-story/ https://www.bitdeer.com/learn/asic-vs-gpu-what-are-the-main-differences-to-consider https://www.all-about-industries.com/asics-versus-gpus-does-the-ai-future-not-lie-in-nvidias-hands-a-616108ac6928e3d542c757192c7c26e7/ https://awavesemi.com/is-a-gpu-asic-or-chiplet-based-soc-better-for-ai-as-we-switch-from-training-to-inference/ 雷峰网原创文章,未经授权禁止转载。详情见转载须知。