米兰·(milan)中国官方网站- 自研芯片公司:英伟达在前,其余公司能否望其项背?

2026-04-06 19:08:16

导语:道阻且长,各家公司怎样打出本身的王牌产物?

于寻求构建更强盛人工智能(AI)模子确当下,一般的通用芯片已经难以支撑,行业对于人工智能芯片的需求显著增加。于AI芯片范畴,有英伟达(NVIDIA)、超威半导体(AMD)、英特尔(Intel)等耳熟能详的至公司连续深耕,也有Groq、SambaNova Systems、Cerebras Systems等后起之秀雨后春笋般涌出。AI势头正盛,将来AI芯片范畴中,谁能跻身前列?雷峰网按照行业现有陈诉,梳理今朝顶尖的AI硬件公司,回首其成长动态。

自研芯片公司:英伟达在前,其余公司能否望其项背?

重要的芯片带领者

1.英伟达NVIDIA

受益在天生式AI市场的发作,英伟告竣了数据中央人工智能芯片范畴霸主——据统计,英伟达今朝于数据中央AI市场拥有98%的市场份额,比拟之下,AMD仅有1.2%的市场份额,英特尔则只有不到1%,英伟达的带领者职位地方无庸置疑。

1990年月以来,英伟达一直于为游戏范畴出产图形处置惩罚单位(GPU),PlayStation3及Xbox都利用英伟达的视频图形阵列。同时,英伟达也出产Volta、Xavier及Tesla等人工智能芯片,其芯片组旨于解决各行业的营业问题。例如,Xavier是主动驾驶解决方案的基础,Volta则是针对于数据中央;而DGX™A100及H100是英伟告竣功的旗舰AI芯片,专为数据中央的AI练习及推理而设计。今朝为止,英伟达发布了H200、B200及GB200芯片,HGX办事器(如联合了8个此类芯片的HGX H200及HGX B200);将更多芯片组合成年夜型猬集的NVL系列及GB200 SuperPod。

不外,需指出的是,因为英伟达的AI芯片价格昂扬,且存于供给不足的问题,部门客户也但愿选择其他替换产物。

而于云端GPU上,英伟达也险些处在垄断职位地方,年夜大都云端厂商只将英伟达GPU作为云端GPU。英伟达也推出了DGX Cloud产物,直接向企业提供云真个GPU基础架构。

最近几年来,海内厂商华为海思、景嘉微、海光信息、寒武纪、芯原股分、龙芯中科等,也于加快GPU范畴的研发。

二、超威半导体(AMD)

AMD是一家拥有CPU、GPU及AI加快器产物的芯片制造商。于ChatGPT激发天生式AI热潮后,人们对于英伟达AI硬件的需求迅速增长,致使其采购更难。于2023年最先,有草创公司、研究机构、企业及科技巨头最先采用AMD硬件。

2023年末,AMD发布了新一代AI/HPC专用加快器Instinct MI300系列,包括纯GPU设计的MI300X、CPU+GPU交融设计的MI300A,周全对于标英伟达H100系列。因为AI算力需求激增,MI300销量增加迅速,于2024年二季度的收入跨越10亿美元,成为AMD有史以来增加速率最快的产物。

据悉,AMD将发布MI350系列来代替MI300,并与英伟达的H200竞争。此外,Instinct MI325X估计在2024年第四序度发货,与H200的年夜范围交付仅相差一个季度——AMD暗示,于运行Llama 3.1 及Mixtral 等年夜型AI模子时,MI325X的推理机能会比现有市场领先者H200超出跨越20%至40%。

AMD也与HuggingFace等呆板进修公司互助,使数据科学家能更有用地利用他们的硬件。不外,开发硬件的同时,软件生态体系也至关主要,因硬件效能很年夜水平上依靠软件优化。例如,AMD及英伟达于H100及MI300基准测试上存于公然不合,不合核心是基准测试中利用的包及浮点数。按照最新的基准测试,对于在70B LLM的推理,MI300好像更好、或者与H100相称。

3.英特尔Intel

英特尔是CPU市场最年夜的厂商,拥有悠长的半导体开发汗青。2017年,英特尔成为全世界第一家发卖额冲破10亿美元年夜关的AI芯片公司。

英特尔的至强CPU合用在各类事情,包括数据中央的处置惩罚,对于其贸易乐成孕育发生了影响。于2024年9月尾,英特尔发布了新一代至强6机能核处置惩罚器,代号Granite Ridge,专为满意AI、数据阐发、科学计较等计较密集型营业的需求而设计。据官方数据,与第五代至强比拟,至强6处置惩罚器拥有多达2倍的每一路焦点数,平均单核机能晋升高达1.2倍,平均每一瓦机能晋升高达1.6倍。

此外,Gaudi3是英特尔最新的AI加快器处置惩罚器,英特尔称其比英伟达的H100 GPU更快、更有用率,于练习年夜语言模子方面比H100快1.7倍,而且,Gaudi3的成本预算远比H100低。不外,自2024年4月公然发布以来,今朝对于Gaudi3机能的基准测试仍较有限。

出产AI芯片的大众云提供商

4.AWS

AWS出产用在模子练习的Tranium芯片及用在推理的Inferentia芯片。于2024年12月,AWS公布Trainium2正式可用,其机能比第一代产物晋升4倍,能于极短的时间内练习基础模子及年夜语言模子,且能源效率晋升多达2倍。AWS将推出一款由数十万颗自研Trainium芯片构成的巨型人工智能超等计较机。苹果也会成为其最新的芯片客户之一。

雷峰网(公家号:雷峰网)还有相识到,于全世界云计较办事市场中,AWS独有近豆剖瓜分。按照2022年的统计,AWS盘踞全世界IaaS市场份额的40%。不外,AWS是于google以后才最先构建本身的芯片。

5.google云平台

TPU是google推出的神经收集专用芯片,为优化自身的TensorFlow呆板进修框架而打造。其Google Cloud TPU为翻译、照片、搜刮、助手及Gmail 等产物提供撑持,也能够经由过程Google Cloud利用。

google于2016年发布了TPU,于2024年推出第六代TPU:Trillium。google暗示,Trillium TPU每一一晶片峰值计较效能晋升了4.7 倍,是“相称惊人的体现”,且Trillium TPU可以更快速地练习下一代基础模子,以较短的延迟时间与较低成本提供模子办事。google亦夸大这一产物的永续特质:与TPU v5e比拟,Trillium TPU的能源效率超出跨越67%。

除了此以外,Edge TPU是googleAlphabet的另外一款加快器芯片,它合用在多种装备类型的原型设计及出产装备,比一分硬币还有小,专为智能手机、平板电脑及物联网装备等边沿装备而设计。

6.阿里巴巴

阿里巴巴在2019年发布了首款AI芯片“含光800”,这款云端AI芯片是其时全世界最高机能的AI推理芯片,重要运用在视觉场景。据悉,其基在12nm工艺与自研架构,集成为了170亿晶体管,机能峰值算力达820 TOPS。于业界尺度的ResNet-50测试中,推理机能到达78563 IPS,比其时业界最佳的AI芯片机能超出跨越四倍;能效比达500 IPS/W,是第二名的3.3倍。

7.IBM

IBM在2022年发布其最新的深度进修芯片——人工智能单位(AIU)。IBM暗示,这是其第一个完备的体系单芯片,旨于比通用CPU更快、更有用率地运行及练习深度进修模子。IBM正于思量利用这些芯片为其天生式AI平台watson.x提供撑持。

AIU基在“IBM Telum处置惩罚器”构建,该处置惩罚器为IBM Z年夜型机办事器的AI处置惩罚功效提供撑持。Telum处置惩罚器推出时的凸起用例包括敲诈检测等。IBM还有展示了归并计较及内存可以提高效率,并于North Pole处置惩罚器原型中获得演示。

领先的AI芯片草创公司

一些AI芯片行业的草创公司只管才方才建立,却已经经筹集了数百万美元,将来咱们可能会更频仍听到它们的名字。

8.Groq

Groq由google前员工创建。其自研的LPU(语言处置惩罚器),旨于之前所未有的速率加快AI模子。于2024年,Groq依附自研的硬件加快器LPU,告竣了500个token/s的神级推理速率,秒杀ChatGPT。行内子士认为,Groq代表了可用速率的一步变化,为LLM提供了新的用例。Groq开创人暗示,Groq的存于是为了消弭“贫富差距”,帮忙AI社区中的每一个人蓬勃成长。

Groq专注在LLM推理,并发布了Llama-270B的基准测试。2024年第一季度,该公司暗示,有7万名开发职员于其云平台上注册并构建了1.9万个新运用步伐。而早于2022年3月1日,Groq收购了Maxeler,后者为金融办事提供高机能计较(HPC)解决方案。Groq已经经筹集了约3.5亿美元,并出产了GroqChip™处置惩罚器、GroqCard™加快器等。

9.SambaNova Systems

SambaNova Systems建立在2017年,旨于为年夜量天生式AI事情负载开发高机能、高精度硬件软件体系。该公司开发了全世界首款面向万亿参数范围AI模子的AI芯片体系——基在可重构数据流单位 (RDU) 的AI芯片SN40L。据悉,该芯片专门为运行企业运用步伐的年夜型语言模子而构建,其设计方针是能承载ChatGPT高级版本两倍容量以上的年夜模子,可为一个拥有5万亿个参数的模子提供办事。对于比英伟达的H100芯片,SN40L不仅推理机能到达了H100的3.1倍,于练习机能也到达了H100的2倍,而总拥有成本更仅有其1/10。

不仅云云,SambaNova Systems还有将其平台出租给企业。SambaNova的人工智能平台即办事方式,使其体系更容易在采用,并鼓动勉励硬件反复利用以实现轮回经济。该公司也已经筹集了跨越11亿美元的资金。

10.Cerebras Systems

Cerebras Systems建立在2015年,鞭策了芯片设计范畴的一场革命——将整片晶圆制成一个巨年夜的芯片。其在2019年推出的WSE-1,具备1.2万亿个晶体管及40万个处置惩罚焦点,可同时专注在AI及HPC(高机能计较机群)的事情负载。

而于2021年,Cerebras推出专为超等计较机使命打造的Wafer Scale Engine 2(WSE-2),为其时全世界最年夜AI芯片。与其以前推出的WSE-1比拟,WSE-2于面积上没有变化,但拥有创纪录的2.6万亿个晶体管以和85万个AI优化核,其芯片的所有机能特性,均比一代增长了一倍以上。2024年3月,Cerebras发布拥有4万亿个晶体管及90万个AI焦点的WSE-3,将用在练习一些业界最年夜的人工智能模子,理论上能练习多达24万亿个参数的AI模子。WSE-3采用台积电进步前辈的5纳米工艺技能,将其现有最快AI芯片的世界纪录晋升了一倍。

雷峰网相识到,Cerebras的体系还有与阿斯利康及葛兰素史克等制药公司和研究试验室互助,如使用生物数据集练习年夜范围的语言模子,能显著缩短AI模子练习时间、加速研发进程,对于新药的发明及开发具备主要意义。

11.Etched

他们选择为了效率而捐躯了矫捷性——将变压器架构刻录到芯片中。

Etched公布推出一款针对于Transformer架构专用的ASIC芯片“Sohu”。据称,8个Sohu芯片每一秒可以天生500,000个token,远跨越配备8张英伟达最新的B200 GPU加快卡的办事器约10倍,其AI机能到达英伟达H100的20倍——这也象征着Sohu芯片将可以年夜幅降低现有AI数据中央的采购成本及安装成本。

不外,今朝,这些都是基在团队的内部丈量,很多问题还有没有获得解答:模子过不时怎样措置?用户是否需要采办新芯片,还有是旧芯片可以用下一个模子从头配置?他们怎样运行基准测试,利用了哪一种量化及模子?此外,思量到每一隔几个月就会发布新模子,将模子刻录到芯片中的做法是否可连续,这一谜底也使人期待。

12.Tenstorrent

Tenstorrent出产高机能AI芯片Wormhole芯片,可扩大且成本效益高;还有有供研究职员利用的台式机及由Wormhole芯片驱动的办事器(例如Tenstorrent Galaxy)。该公司还有为其解决方案提供软件栈。据悉,Tenstorrent在2024年12月从包括杰夫·贝佐斯(Jeff Bezos)于内的投资者那里筹集了7亿美元,估值跨越26亿美元。

行将到来的AI硬件出产商有哪些?

还有有一些惹人注目的AI硬件解决方案,但因为它们是市场新手,今朝对于其有用性的基准测试有限。

苹果作为一家重要的芯片设计商,也于自研数据中央AI芯片——项目名为ACDC。据称,该公司正于与台积电互助设计及出产这些人工智能芯片。这些办事器芯片的重要核心多是AI推理,此中触及颠末练习的呆板进修模子从新数据中患上出结论。而就于2024年12月尾,有动静称苹果正与博通互助开发AI芯片,是其首个专为人工智能设计的办事器芯片,或者为行业带来更深刻的厘革。

Meta也努力想于天生式AI范畴遇上竞争敌手。于英特尔公布其最新AI加快器硬件的第二天,Meta宣布其芯片研发的最新结果:下一代 MTIA(Meta Training and Inference Accelerator),MTIA是专为Meta AI事情负载而设计的定制芯片系列。据悉,下一代MTIA基在台积电5nm技能,据称与MTIAv1比拟机能提高了3倍。MTIA今朝供Meta内部利用,但将来假如Meta推出基在LLaMa的企业天生AI产物,这些芯片可以为此类产物提供撑持。

此外,微软在2023年11月推出Maia AI加快器。还有有总部位在韩国的草创公司Rebellions于2024年筹集了1.24亿美元,专注在LLM推理。

还有有一些AI芯片出产商 ,如Graphcore,一家建立在2016年的英国公司,已经发布其旗舰AI芯片IPU-POD256,能提供64 petaFLOPS的AI计较。该公司已经得到了约7亿美元的融资,与DDN、Pure Storage及Vast Data等数据存储公司成立了战略互助伙伴瓜葛,其AI芯片办事在牛津年夜学OMI量化金融研究院、布里斯托年夜学及加州年夜学伯克利分校等研究机构。不外,该公司的持久保存能力面对危害,因其每一年吃亏约2亿美元,2024年10月,软银(Softbank)以多在6亿美元的价格收购了它。

而建立在2012年、专注在边沿AI的Mythic,走的是一条很是规的线路——模仿计较架构,旨于提供节能的边沿AI计较。它推出了模仿计较引擎(ACE)M1076 AMP、MM1076 key card等产物,并已经筹集了约1.65亿美元的资金。不外,Mythic于2023年3月的融资中开除了年夜部门员工并重组了营业。

同时,OpenAI也于筹集资金打造本身的AI硬件。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

-米兰·(milan)中国官方网站

相关内容

All rights reserved ©2026 Jinko Power.Powered by Webfoss.沪ICP备15009312号-1