谷歌Gemma
搜索文档
Meta闭源转向:巨头的求生与AI行业的范式重构
36氪· 2025-12-11 18:05
Meta的战略转型:从开源到闭源 - 公司核心战略发生根本性转变,从开源先锋转向押注闭源模型Avocado [2] - 此次转型由商业现实驱动,公司每年AI投入超700亿美元,但企业授权收入不足10亿美元,开源模式盈利困难 [2] - 为支持转型,公司进行了一系列激进动作,包括以143亿美元收购Scale AI股权并任命其创始人为首席AI官 [2][5] - 内部伴随剧烈动荡,首席AI科学家杨立昆因理念不合离职,FAIR实验室大规模裁员 [3][6] 闭源模型Avocado的技术与商业路径 - 新模型Avocado计划融合谷歌Gemma、OpenAI gpt-oss与阿里通义千问的技术亮点,采取“博采众长”策略 [2][3] - 模型主打复杂推理与长视频分析,目标对标GPT-5与Gemini 3 Ultra,计划于2026年第一季度发布 [3][9] - 发布后将仅开放API与托管服务,旨在构建“模型-硬件-广告”的商业闭环,预计带动广告收入提升10-15% [8][10] - 为保障算力,公司官宣了270亿美元的Hyperion数据中心计划 [7] 开源模式的商业化困境与行业格局演变 - 尽管Llama系列曾构建全球最繁荣的开源AI生态,下载量超3000万次,但开发者成果多流向竞争对手云平台 [2] - 与闭源模式的商业成功形成强烈反差,例如OpenAI仅凭闭源API服务在2025年就斩获约120亿美元收入 [2] - 行业进入“二元共存”新阶段,开源模型主导学术与中小场景,闭源模型凭借性能与合规抢占企业核心市场 [3] - 市场洗牌加速,头部企业倾向于通过闭源构建护城河,而DeepSeek、Mistral等玩家有望承接Meta留下的开源生态空白 [4] 中美AI巨头战略路径差异 - 美国巨头以闭源为主,商业闭环清晰,如OpenAI的订阅制与企业API,谷歌的闭源API与云服务融合 [11] - 中国玩家采取开源与闭源并行策略,如阿里通义千问采取“开源引流+闭源变现”模式 [11] - 技术路径差异:美国以闭源保护壁垒并推动前沿能力,中国通过开源弥补单点短板并加速行业落地 [11] - 迭代节奏差异:美国以半年或年为单位更新一代,中国则以周或双周为单位进行高频小版本迭代,开源社区驱动更快 [13]
英伟达GPU被SpaceX送上太空,在天上训练卡帕西的NanoGPT
36氪· 2025-12-11 15:32
事件概述 - 人类首次在太空轨道上成功训练并运行人工智能大模型 此次演示由初创公司Starcloud主导 其Starcloud-1卫星搭载英伟达H100芯片 通过SpaceX火箭发射升空 [1][5] - 在轨演示运行了谷歌的开源大模型Gemma 并首次在太空直接训练了前OpenAI联合创始人Andrej Karpathy开发的大语言模型NanoGPT [1][3][7] 参与方与具体行动 - **Starcloud**:作为英伟达Inception计划成员 该公司发射了搭载英伟达H100芯片的Starcloud-1卫星 并成功完成首次太空AI训练与运行演示 [5][7] - **英伟达**:其H100 GPU被用于此次太空AI演示 公司计划在2026年10月的后续发射中携带更多H100芯片 并将下一代Blackwell平台也送入太空 [1][9] - **SpaceX**:提供了火箭发射服务 将搭载H100芯片的卫星送入轨道 [1][5] - **谷歌**:其开源AI大模型Gemma在太空H100芯片上成功运行并获取回应 [1] - **Andrej Karpathy**:其开发的大语言模型NanoGPT在太空中使用莎士比亚全集进行了训练 [3][7] 行业动机与发展目标 - 推动太空计算的核心驱动力是突破地球上的能源与基础设施瓶颈 地球数据中心面临电力、土地稀缺及高昂电费等限制 制约了AI增长曲线 [10] - 太空低轨环境理论上能提供更低成本 没有地面土地和制冷的约束 且太阳能供给持续充足 为在轨算力提供了长期运行的能源优势 [10] - Starcloud的长期目标是建造一座基于太阳能面板、功率达5GW的轨道数据中心 其造价和运营成本预计将显著低于地球上的数据中心 [8] 行业竞争与未来计划 - **谷歌**:在英伟达H100上天后 其CEO表示计划将自家的TPU也发射到太空 最早的两颗卫星预计2027年初启程 [11] - **中国参与者**:中国在太空算力领域早有布局 自2019年起 中科院计算所、武汉大学等科研机构便开始探索太空智能计算 [12][13] - 2024年 中科天算团队完成大模型在轨上注与部署 构建“太空智能链” 同年5月 国星宇航联合之江实验室成功发射全球首个太空计算星座“三体计算星座”首批12颗卫星 并于9月实现常态化商业运行 [14] - 2024年11月 中科天算发布“天算计划” 提出在近地轨道建设算力达10 EOPS的万卡超级智能体集群 并公布了应对太空辐射和散热挑战的工程方案 [15]
全球首个太空AI诞生,H100在轨炼出,马斯克爆赞
36氪· 2025-12-11 11:46
行业里程碑事件 - 首个在太空训练和运行的大型语言模型诞生,由搭载英伟达H100 GPU的Starcloud-1卫星基于Karpathy的nanoGPT项目,使用莎士比亚语料训练完成 [1][3][9] - 谷歌开源模型Gemma首次在太空成功运行,并向地球发出了问候信息 [1][11] - 该成就获得了包括马斯克、前谷歌CEO在内的科技界AI领袖们的广泛赞誉 [7] 技术实现与性能 - Starcloud-1卫星搭载的H100 GPU,其算力比以往任何进入太空的GPU强100倍 [9] - 该卫星在短短一个月内即在太空中成功训练出LLM [9] - 模型具备实时情报分析能力,例如可瞬间识别野火热点并通知应急人员,并能结合自身传感器数据(如高度、姿态、位置)进行实时交互 [16] - 太空运行的Gemma模型反馈复杂度与在地球上运行时无异 [12] 商业模式与成本优势 - 太空数据中心利用太阳能无限供电,其成本可降至地面数据中心的1/10 [20] - 公司最终目标是打造一个功率达5吉瓦(5GW)的轨道数据中心,配备宽高约4公里的太阳能板和冷却面板 [20] - 太空算力集群的功率将超过美国最大的发电厂,但占地面积和成本远低于地面同等规模的太阳能农场 [22] - Starcloud卫星的设计寿命约为五年,与英伟达芯片的使用周期一致 [22] 公司发展规划 - Starcloud计划于2026年10月进行下一次发射,将一次性搭载多枚H100 GPU,并整合Blackwell平台以提升AI性能 [22] - 下一次发射还将集成云基础设施公司Crusoe的模块,使客户能够直接从太空部署和运行AI工作负载 [22] 行业竞争格局 - 太空算力赛道竞争激烈,参与者包括Starcloud、谷歌、SpaceX和蓝色起源等 [25] - 谷歌启动了“Project Suncatcher”,计划将自研的GPU太阳卫星送入太空,目标利用近日点不间断的太阳能,计划在2027年进行早期测试 [26] - 马斯克表示Starlink V3卫星有望扩展成为轨道算力基础设施的骨干网络 [28] - SpaceX的“星舰”有望每年向轨道运送相当于300吉瓦至500吉瓦功率的太阳能AI卫星 [30] - 蓝色起源的“新格伦”(New Glenn)火箭取得重大进展,预计未来将向轨道运送大量卫星 [31][32] - OpenAI的Sam Altman也曾试图收购或合作火箭公司,希望将AI算力部署到太空 [33] 行业驱动因素 - 地面数据中心面临巨大压力:给电网带来负担、每年消耗数十亿加仑水资源并排放大量温室气体 [19] - 国际能源署预测,到2030年,全球数据中心的用电量将超过如今的两倍 [19] - 将数据中心迁至太空被视为应对地球资源约束的解决方案 [17] 核心团队背景 - 联合创始人兼CEO Philip Johnston:连续创业者,前麦肯锡顾问,负责国家航天机构卫星项目,拥有哈佛大学MPA、沃顿商学院MBA、哥伦比亚大学应用数学与理论物理硕士学位,是CFA持证人 [35][37] - 联合创始人兼CTO Ezra Feilden:拥有十年卫星设计经验,专攻可展开太阳能阵列,曾参与NASA“月球勘探者”等任务,拥有伦敦帝国理工学院材料工程博士学位 [39] - 联合创始人兼总工程师 Adi Oltean:前SpaceX首席软件工程师,负责“追踪波束”项目(用于Starlink),前微软首席软件工程师,拥有超过25项专利 [41]