马斯克3个月建成世界最强算力集群由10万片英伟达H100组成

“
埃隆·马斯克的人工智能公司xAI推出的超级计算机“Colossus”在田纳西州数据中心上线,装备了10万个Nvidia H100处理器,旨在训练大型语言模型Grok,预计将为特斯拉带来巨额利润。
埃隆·马斯克的人工智能新创公司xAI在劳动节周末推出了名为“Colossus”的超级计算机,这台机器的诞生标志着人工智能领域的又一个重要里程碑。Colossus旨在训练xAI的大型语言模型(LLM)Grok,与Open AI的GPT-4形成竞争。目前,Grok仅对马斯克的X社交媒体平台的付费用户开放,但据特斯拉专家预测,未来它可能会成为特斯拉人形机器人Optimus的智能核心。
马斯克对Colossus寄予厚望,他预计这个战略性项目最终可能每年为特斯拉带来高达1万亿美元的利润。位于田纳西州的xAI新数据中心装备了10万个Nvidia基准Hopper H100处理器,数量之多超过了任何其他单一的AI计算集群。 马斯克在社交媒体上表示,Colossus的建设“从零到一,仅用了122天”,并称赞其为“全球最强大的AI训练系统”。

xAI的野心不止于此。马斯克预计,在获得Nvidia新一代、性能更强的H200系列芯片后,几个月内就能将Colossus的计算能力翻倍。xAI的目标是训练Grok-3,这可能是下一代AI模型的领军者。
Colossus的建设速度令人惊叹,考虑到xAI在6月才选定孟菲斯作为基地。与此同时,包括微软、谷歌和亚马逊在内的几家科技巨头,也在这场AI芯片的淘金热中与马斯克竞争,争夺Nvidia的Hopper系列AI芯片。但马斯克作为Nvidia的重要客户,已承诺今年将斥资30亿至40亿美元购买CEO黄仁勋的硬件产品,仅特斯拉一家就如此。
xAI还利用了已经交付给特斯拉的AI芯片库存,从而获得了先发优势。孟菲斯的集群将用于训练马斯克的第三代Grok。马斯克在7月对保守派播客主持人Jordan Peterson表示:“我们计划在12月发布Grok-3,届时它将成为全球最强大的AI。”
Grok-2的早期测试版上个月刚刚向用户推出。尽管它只在大约1.5万个Nvidia H100图形处理器上进行了训练,但根据竞争性聊天机器人排行榜的一些标准,它已经是最先进的AI大型语言模型之一。将GPU数量增加近七倍,表明马斯克无意将开发人工通用智能的竞赛让给OpenAI,他在2015年底共同创立了OpenAI,当时他担心谷歌在这项技术上的主导地位。

马斯克后来与CEO Sam Altman产生分歧,现在正在第二次起诉该公司。为了增加胜算,xAI在5月的B轮融资中筹集了60亿美元,得到了Andreessen Horowitz和Sequoia Capital等风险投资公司的支持,以及富达和沙特王子Alwaleed bin Talal的Kingdom Holding等财力雄厚的投资者。
马斯克还暗示,他将提议特斯拉董事会考虑是否向xAI投资高达50亿美元,这一举措受到了一些股东的欢迎。然而,xAI的超级计算机集群在孟菲斯引起了担忧,因为市政府官员以极快的速度同意了这个项目,该项目将经济活动带回了该市一个曾经是伊莱克斯白色家电工厂的地区。
一个主要的担忧是它将对城市资源造成的压力。市政公用事业公司MLGW的官员估计,Colossus每天需要高达100万加仑的水来冷却服务器,并将消耗高达150兆瓦的电力。但马斯克是那种只考虑大事的人,任何值得做的事情都值得快速完成——否则就有落后于竞争对手的风险。
在播客主持人Lex Fridman参观了xAI迅速扩张的业务后,马斯克在接受他的采访时表示,速度是他五步管理过程的关键部分。“任何给定的事情都可以加快速度,无论你认为它可以多快完成,”他上个月说,“它可以更快地完成。”这反映了马斯克对于推动技术进步和企业扩张的坚定决心和紧迫感。



共有 0 条评论