2026-01-29
milan米兰官方网站科技近50MW工商业分布式项目集中完工,赋能多元产业场景
了解详情
2026-04-06 23:22:25
导语:Trainium还有有很长的路要走。 Trainium是亚马逊云科技(AWS)专门为跨越1000亿个参数模子的深度进修练习打造的呆板进修芯片。于2024年 re:Invent年夜会上,AWS公布Trainium2正式可用,其机能比第一代产物晋升4倍,可以于极短的时间内练习基础模子及年夜语言模子。 AWS周二公布,将推出一款由数十万颗自研Trainium芯片构成的巨型人工智能超等计较机,这是其位在德克萨斯州奥斯汀的人工智能芯片设计试验室的最新结果。 该芯片集群将供由人工智能草创公司Anthropic利用,Anthropic是一家人工智能草创公司,近期得到来自亚马逊40亿美元的投资。AWS卖力计较及收集办事的副总裁戴夫.布朗(Dave Brown)暗示,这个名为 “Project Rainier ”的芯片集群将落地美国,2025年建成后将成为世界上最年夜的人工智能模子练习集群之一。 于拉斯维加斯进行的年度re:Invent集会上,AWS发布了“Ultraserver”办事器,该办事器由64个自研的互联芯片构成。此外,AWS还有于集会上公布苹果成为其最新的芯片客户之一。 re:Invent集会上发布的产物凸显了AWS此前对于自研芯片Trainium的承诺,其将Trainium视为替换英伟达GPU的备选选项。 按照研究机构国际数据公司(IDC)的数据显示,2024年人工智能芯片市场的范围预计为1175亿美元,到2027年末估计将到达1933亿美元。IDC去年12月的研究显示,英伟达于人工智能芯片市场中盘踞了约95%的份额。 AWS的CEO马特.加曼(Matt Garman)称:“今朝,GPU市场只存于一种选择,就是英伟达,假如市场上有其他的选择,咱们信赖客户会很接待。” 而亚马逊鞭策AI战略的要害举措是更新其芯片,如许可以为他们的客户降低成本,同时于财产链内把握更多的自动权。把握更多的自动权有益在亚马逊削减对于英伟达的依靠,只管今朝两家公司的瓜葛还有很是亲密。 觊觎英伟达芯片收入的公司其实不于少数,包括人工智能芯片草创企业Groq、Cerebras Systems及SambaNova Systems。亚马逊的竞争敌手微软及google也下场开发本身的人工智能芯片,并试图削减对于英伟达的依靠。 自从2018年推出基在Arm架构的CPU Graviton以来,亚马逊一直致力在为客户开发自研的芯片产物。亚马逊高管暗示,公司的方针是复制Graviton的乐成经验,向客户证实,其产物虽然成本更低,但机能其实不减色在市场领先者。 亚马逊造芯,复刻Graviton的乐成经验 AWS的人工智能芯片试验室位在德克萨斯州奥斯汀市,其前身是亚马逊于2015年以约3.5亿美元收购的以色列微电子公司Annapurna Labs。 加迪·哈特(Gadi Hutt)于亚马逊收购Annapurna以前就插手了该公司,担当产物与客户工程部的总监。他暗示:“芯片试验室自Annapurna创业之初就已经设立,其时Annapurna安家在奥斯汀的考量恰是但愿所处的位置要接近芯片巨头设有服务处之处。” 该试验室工程部主任拉米·辛诺(Rami Sinno)说,于试验室内部,工程师们可能今天还有于装置线上事情,明天就去焊接了。他们会当即着手处置惩罚任何需要完成的事情,这类精明务实的心态于草创企业中更为常见,而非像亚马逊如许的万亿美元公司。 辛诺称,这是成心为之的,由于Annapurna对于在人材雇用有本身的理解,其实不像行业中的其他公司那样寻觅专善于一个范畴的“专家”。他们会寻觅既精晓邦畿设计又精晓旌旗灯号完备性及功率传输,而且还有能编写代码的电路板设计师。 “咱们同时设计芯片、焦点、整台办事器及机架。咱们不会比及芯片预备好后再设计主板,”辛诺说。“这让团队可以或许以超快的速率进步。” AWS于2018年推出了Inferentia,这是一种专门用在推理的呆板进修芯片,行将数据输入AI模子以天生输出的历程。亚马逊高级副总裁兼卓异工程师詹姆斯·汉密尔顿(James Hamilton)暗示,团队起首专注在推理,由于与练习比拟,推理使命对于芯片的要求略低。 到2020年,Annapurna已经经预备好推出其首款面向客户用在练习AI模子的芯片“Trainium”。去年,亚马逊公布推出Trainium2芯片,称该芯片现已经可供客户利用。AWS还有暗示,今朝正于开发Trainium3芯片以和基在该芯片的办事器,其机能将是基在Trainium2芯片办事器的四倍。 范围决议算力,亚马逊办事器搭载芯片数目为英伟达两倍 跟着AI模子及数据集的范围愈来愈年夜,为其提供动力的芯片及芯片集群的范围也于不停扩展。科技巨头们不仅从英伟达采办更多的芯片,还有自行设计芯片。如今,他们正试图将尽可能多的芯片集中于一个处所。 “愈来愈年夜”也是亚马逊芯片集群的方针,该集群由Annapurna及Anthropic互助构建,目的是让AI草创公司利用该集群来练习及运行其将来的AI模子。亚马逊暗示,该集群的浮点运算能力是Anthropic当前练习集群的五倍。马斯克的xAI近来制作了一台名为Colossus的超等计较机,该计较机利用了10万个英伟达的Hopper芯片。 汉密尔顿说:“你将办事器的范围扩展患上越多,就象征着你需要解决的问题越少,整个练习集群的效率也就越高。一旦你意想到这一点,更年夜更强就成为了方针。” 亚马逊的Ultraserver将64个芯片整合到一个封装中,由四台办事器构成,每一台办事器包罗16个Tranium芯片。布朗说,比拟之下,英伟达的部门GPU办事器只包罗8个芯片。为了将这些芯片组合于一路,形成一个可以到达83.2万万亿次浮点运算的办事器,亚马逊的奥秘兵器是其收集技能NeuronLink,这项技能可使所有四个办事器彼此通讯。 汉密尔顿称,这是他们于不使办事器过热的环境下所能容纳的最年夜数目。从尺寸上看,它更靠近在冰箱巨细,而不是紧凑的小我私家计较机。但布朗及其他高管暗示,这其实不是于向客户施压,让他们从亚马逊及英伟达之间二选一。他们更但愿客户可以于其云平台上继承利用本身喜欢的产物。 AI编程草创公司Poolside的结合开创人兼CTO艾索.康德(Eiso Kant)暗示,他们公司于利用Amazon的芯片运行其AI模子时,相较在利用英伟达的芯片,可节省约40%的成本。但错误谬误是,工程师需要破费更多的时间让亚马逊的相干芯片软件正常运行。 康德暗示:“亚马逊直接经由过程台积电制造芯片,并将其运用在本身的数据中央,是以对于AI草创企业来讲,这是看起来更“稳当的选择”。他暗示,亚马逊的赌注下于哪里至关主要,由于于硬件范畴,掉队敌手6个月就可能象征着营业的闭幕。” 苹果呆板进修与人工智能高级总监贝诺伊·杜平(Benoit Dupin)于年夜会上暗示,苹果内部正于测试Trainium2芯片,估计可节省约50%的成本。 面临英伟达,Trainium能走多远 阐发师暗示,对于在年夜大都企业来讲,选择英伟达还有是亚马逊其实不是一个火急的问题。由于年夜型企业更体贴怎样从运行AI模子中得到价值,而不是研究怎样练习它们。 如许的市场趋向对于亚马逊来讲是件功德,由于客户不会留意到云办事暗地里是哪家芯片厂商于提供算力。它可以与Databricks如许的云数据公司互助,将Trainium运用在云计较,年夜大都企业都不会留意到任何差异,由于计较可以或许正常运行,并且成本还有会愈来愈低。 市场研究及IT咨询公司Gartner的阐发师奇拉格.德卡特(Chirag Dekate)暗示,亚马逊、google及微软正于开发本身的AI芯片,由于他们知道自行设计芯片可以节省时间及成本,同时提高机能。由于定制硬件可以提供很是详细的并行化功效,这可能比通用型GPU的机能更好。 研究公司Redburn Atlantic的阐发师亚历克斯·海斯尔(Alex Haissl)暗示,AWS于人工智能不太被存眷到的范畴也有着被低估的实力,包括收集、加快器及名为“Bedrock”供企业利用人工智能模子的平台。 不外,公司带领对于在AWS的芯片可以或许走多远持思疑立场,至少今朝是如许。AWS CEO加曼说:“现实上,我预计于很长一段时间内,市场还有是会被英伟达盘踞,由于今朝99%的事情负载都是由它们来处置惩罚的,这类环境可能不会转变。可是,我但愿Trainium可以或许斥地出一个不错的利基市场,它将会是许多事情负载的绝佳选择。 本文由雷峰网(公家号:雷峰网)编译自:Exclusive | Amazon Announces Supercomputer, New Server Powered by Homegrown AI Chips - WSJ 雷峰网原创文章,未经授权禁止转载。详情见转载须知。