马斯克超级核算机算力将扩展十倍!曾被黄仁勋称作“奇观”
日期:2025-04-30 | 作者: 磨矿机
当地时间12月5日,美国大孟菲斯商会(Greater Memphis Chamber)宣布声明称,马斯克的草创公司xAI许诺将其超级核算机项目Colossus的算力扩展十倍,未来将搭载100万块GPU,然后对立谷歌、OpenAI和Anthropic等竞争对手。
Colossus不只被业界视为世界上最大的超级核算机,也是历史上建造速度最快的超级核算机项目,马斯克本年早一点的时分仅用了3个月就完成了该核算机集群的建造。英伟达创始人CEO黄仁勋曾表明,Colossus这种规划的数据中心常常要三年才干建成,他表明世界上仅有马斯克一人能如此高效地建成这一项目,可谓“奇观”。
该超级核算机现在运转着由10万多块GPU组成的集群。这些芯片用于练习xAI的谈天机器人Grok,但Grok的用户数量少于商场领导者OpenAI的大模型ChatGPT或谷歌的大模型Gemini。
马斯克方案的Colossus扩张项目估计将需求数百亿美元的出资,此外,为支撑如此大规划的建造,还需求大规划的服务器供电和冷却体系,这些都将发生昂扬的本钱。
另据大孟菲斯商会最新的声明,除了马斯克的xAI之外,、戴尔和超微电脑(SuperMicro)等公司也将在孟菲斯扩张。本年早一点的时分,戴尔和宣告将为xAI供给服务器机架。
马斯克正在基础设施上进行巨大的投入。xAI本年已融资约110亿美元的资金,其间大部分资金都被用于购买英伟达的GPU芯片。
依据网站LessWrong近来宣布的一篇博客多个方面数据显现,依据揭露数据对英伟达芯片的产值以及各大科技巨子的GPU数量预估,截止现在,全球具有GPU数量最多的公司分别为谷歌、微软、Meta、亚马逊以及xAI。
上述网站多个方面数据显现,如以H100芯片算力来核算,谷歌具有100万至150万块等效H100,下一年估计到达350万至420万块;具有75万至90万块等效H100,下一年估计到达250万至310万块;Meta具有55万至65万块等效H100,下一年估计到达190万至250万块;具有25万至40万块等效H100,下一年估计到达130万至160万块;xAI具有10万块等效H100,下一年估计到达55万至100万块。
这意味着,马斯克的xAI要赶上谷歌、等巨子科技还需求支付很大的尽力。现在,xAI使用了大约2万块H100练习Grok 2大模型,并方案用10万块H100练习Grok 3大模型。跟着英伟达最新一代Blackwell开端很多出货,马斯克声称,将在2025年夏天布置一个有30万块Blackwell芯片的运算集群。
一份最新发布的2024 AI现状陈述对Blackwell芯片收购量进行了预算。陈述称,大型云核算公司正在大规划收购英伟达的GB200体系:微软介于70万到140万块之间,谷歌为40万块,OpenAI也将具有至少40万块,AWS为36万块。
曩昔一年,科技公司都在大力抢夺芯片资源,并活跃投入AI基础设施建造。依据风投组织Menlo Ventures的最新数据,生成式AI商场的收入估计将在十年内超越1万亿美元,而本年企业在生成式AI上的开销激增500%。