Gemma
搜索文档
AI数据中心上天,与其说黑科技不如说是作秀
36氪· 2025-12-17 20:39
行业动态:太空AI数据中心成为科技巨头新方向 - 硅谷创投圈与科技巨头正积极探索在太空部署人工智能数据中心,以解决地面能源瓶颈问题 [1][5][6] - 英伟达支持的初创公司Starcloud首次在太空轨道上成功训练并运行了AI模型,验证了技术可行性 [1][3] - 谷歌CEO桑达尔·皮查伊表示,公司计划于2027年初开始建设太空AI数据中心,目标是利用太空太阳能 [5][6] - SpaceX的马斯克计划扩大星链V3卫星规模,并通过星舰在4到5年内实现每年部署100吉瓦(GW)的数据中心 [6] 核心驱动力:应对AI算力增长的能源挑战 - 美国AI发展面临的主要挑战是电力基础设施不足,而非芯片短缺 [9] - AI是巨大的“电老虎”,例如ChatGPT每天响应2亿次请求需消耗50万千瓦时电力,相当于一座美国小城一天的用电量 [9] - 根据美国能源信息署测算,到2030年全球AI数据中心的电力需求将达到347吉瓦(GW) [9] - 太空太阳能的效率远高于地面,单位面积发电量可达地面的5倍,例如一平方米砷化镓太阳能电池在太空可输出300W电力,而地面最多仅60W [11] 技术进展与验证:Starcloud的里程碑 - Starcloud公司利用基于H100的Starcloud-1卫星,在太空成功运行了谷歌的开源模型Gemma和用莎士比亚全集训练的NanoGPT [3] - 该卫星向地球发送了一段AI生成的莎士比亚风格消息,证明了在轨AI推理能力 [3] - Starcloud CEO表示,其目标是实现轨道数据中心的能源成本比地面数据中心低10倍 [3] - 此次在轨运行旨在验证构建需要大型计算集群的太空数据中心的可行性 [3] 主要技术挑战:散热与抗辐射 - 太空接近完美真空,热量主要通过辐射传递,效率低下,导致散热成为重大难题 [11][13] - 一个1吉瓦(GW)水平的太空数据中心,其散热所需的专用辐冷板面积将达20万平方米,重量超过1000吨 [13] - 以SpaceX星舰单次发射载重150吨计算,仅运送散热系统就需要10次发射 [13] - 太空高能粒子(宇宙射线)会引起电子元器件的单粒子翻转,导致数据位错误,严重影响GPU进行矩阵乘法等计算的准确性 [13] - 为应对辐射,宇航级芯片通常使用90纳米、130纳米等“落后制程”,而非最先进的2纳米制程 [13] 当前阶段评估:概念验证与商业化障碍 - 在散热与电磁防护两大技术难关被攻克前,太空AI数据中心更多是技术演示,缺乏大规模商业化的实际意义 [15] - 尽管面临挑战,硅谷科技公司仍将其视为解决长期能源问题的潜在战略方向 [5][6][9]
Meta公开抄阿里Qwen作业,还闭源了...
猿大侠· 2025-12-12 12:11
文章核心观点 - Meta公司计划于明年春季发布一款代号为“Avocado(牛油果)”的闭源AI模型 这标志着其长期坚持的开源战略发生重大转向 [1][2][3][10][11] - 该闭源模型在训练过程中使用了包括阿里巴巴Qwen在内的第三方开源模型进行优化 此消息引发市场关注并带动阿里巴巴股价上涨 [4][5][6][13][16] - Meta的战略转向伴随着内部AI团队的重大重组 包括关键人物离职、新团队组建以及公司资源向闭源路线倾斜 [20][22][28][29][31] Meta的战略转向与“牛油果”模型 - Meta预计在明年春季发布代号“Avocado(牛油果)”的新AI模型 [2][10] - 新模型将是闭源的 这与Meta过去以“开源”为核心叙事的战略形成180度转变 [3][10][11] - 该闭源模型在训练过程中使用了多款第三方模型进行优化 其中包括阿里巴巴的Qwen [4][5][13][16] - 消息曝光后 阿里巴巴美股盘前一度上涨4% 收盘涨幅2.53% [6] Meta内部AI团队重组与权力更迭 - 2025年4月 Llama 4的发布未能达到预期且陷入争议 导致扎克伯格对团队进行重组并启动“梦之队”招聘计划 [22][23] - 公司以高额薪酬吸引人才 年薪一度飙到数亿美元 并通过一笔高达143亿美元的交易从Scale AI引入亚历山大王 [23] - 公司高层指令“少谈开源 少提Llama” FAIR实验室遭遇裁员 包括研究科学家总监田渊栋在内的员工离职 [28] - 2025年11月 知名AI科学家LeCun因公司不再提供足够资源而离职 其开源理念在内部被“雪藏” [29][30] - 随着田渊栋、LeCun等人离职 新任首席AI官亚历山大王(闭源模型拥护者)彻底掌控了Meta的AI话语权 [21][31] 新团队“TBD Lab”与公司资源倾斜 - 由扎克伯格亲自组建的明星研究员团队组成了“TBD Lab” 该实验室是Meta战略转向的重要操盘手 [20][26] - 扎克伯格极为看重该团队 投入大量时间 并将公司最重要、最烧钱的产品项目之一交由其负责 [27][32] - TBD Lab成员被安排在扎克伯格办公桌附近办公 方便其随时了解进展 [33] - 该实验室旗下的团队曾对Qwen和Gemma等模型进行微调 [18]
阿里千问成全球开源模型“新标杆”,Meta新项目被曝蒸馏千问
新浪财经· 2025-12-11 20:59
Meta新模型“牛油果”动态 - Meta计划于明年春季推出代号为“牛油果”的新模型项目 该模型很可能以闭源形式发布[1] - “牛油果”模型的训练蒸馏了多方开源模型 包括谷歌的Gemma、OpenAI的gpt-oss以及阿里巴巴的通义千问[1] - Meta CEO马克·扎克伯格密切关注新组建的TBD实验室团队 其态度发生转变 从呼吁支持美国模型转向采用阿里千问[2] 阿里巴巴通义千问的全球影响力与市场表现 - 通义千问Qwen模型在2024年8月衍生模型数首次超越Meta的Llama 并在2025年10月全球下载量实现超越 取代Llama成为全球第一的开源模型[2] - Qwen3-Max旗舰模型性能超过GPT5、Claude Opus 4等国际竞争者 跻身全球前三[3] - 消息传出后 阿里巴巴美股于12月10日上涨1.83% 收于每股158.82美元 总市值达3790亿美元 今年以来股价已涨超90%[2] 通义千问的广泛生态应用 - 亚马逊、Airbnb等公司使用Qwen发展新业务 英伟达、微软、Meta等科技企业基于Qwen开发衍生模型[3] - 斯坦福李飞飞团队、硅谷独角兽Thinking Machines Lab、艾伦AI研究所等机构基于Qwen进行前沿技术创新[3] - 来自韩国、泰国、越南、日本、阿联酋、巴西等全球的公司和开发者使用Qwen开发新模型、新技术和应用[6] - 新加坡国家人工智能计划放弃了Meta模型 转向通义千问Qwen开源架构[6] 阿里巴巴的AI战略与业务进展 - 公司走出了一条完整的AI发展之路 涵盖基模迭代引领、全栈布局加速、生态协同放大[6] - 最新一季财报显示 云计算季度营收同比增长34%至398.24亿元 AI相关产品收入已连续九个季度实现三位数同比增幅[6] - 公司于今年2月宣布投入3800亿元用于AI基础设施建设 并设定了到2032年将云数据中心能耗规模扩大十倍的长期目标[6] - 千问APP自11月17日公测仅23天 月活跃用户数已突破3000万 成为全球增长最快的AI应用 上线一周下载量便突破1000万[6]
Meta上亿年薪的研究员们,却在偷师中国开源模型
观察者网· 2025-12-11 18:17
公司动态与战略调整 - Meta组建名为TBD Lab的新团队,其正在训练的“牛油果”(Avocado)模型使用了包括谷歌Gemma、OpenAI GPT-oss和阿里巴巴Qwen在内的多个第三方模型,该模型预计于明年春季首次亮相并可能作为闭源模型推出 [1] - 针对相关报道,Meta发言人回应称模型训练工作正按计划进行,时间表没有发生有意义的变更 [1] - 消息曝光后,阿里巴巴美股盘前一度上涨4%,收盘涨幅2.53% [1] - 因Llama 4表现不佳,Meta在最新一季度财报会上仅轻描淡写地提及Llama一次,该模型已不再是公司焦点 [5] - 扎克伯格随后对公司内部进行人事调整,拥有20年工龄的首席产品官Chris Cox在Llama 4翻车后被撤掉AI部门管理权限,部分Llama 4团队成员也被边缘化 [5] - 扎克伯格亲自挂帅开启AI“梦之队”招聘计划,从外部高薪挖来Scale AI创始人Alexandr Wang担任新的人工智能负责人,执掌全新的TBD实验室,并开出亿元薪酬大肆挖角同行 [5] - 公司更直接叫停了部分激进的元宇宙项目,以集中资源与OpenAI等竞争对手较量,对名为“牛油果”的新AI模型可谓孤注一掷 [6] - Alexandr Wang作为闭源模型的拥簇者,被认为是Meta新模型转向闭源的核心原因 [6] - 在Alexandr Wang领导下,Meta Superintelligence Lab在11月几乎毫无动作 [11] 行业竞争格局演变 - 过去两年,Meta通过开源Llama系列成功扮演了“反OpenAI联盟”的盟主,Llama一度被视为开源界的Linux,是全球开发者(包括中国开发者)的首选底座 [2] - 这一格局在2025年开始瓦解,随着年初DeepSeek开源模型的横空出世,以及后续阿里Qwen、月之暗面、智谱、Minimax等AI新势力纷纷发布高性能开源模型,Meta对开源生态的统治地位开始摇摇欲坠 [3] - 2025年4月,Meta发布的Llama 4性能未获开发者认可,且模型在LMArena的榜单排名被曝出存在“作弊嫌疑”,进一步饱受负面评价 [3] - 从性能角度看,无论是中国的“AI六小龙”还是阿里等互联网大厂,其最新的开源模型发布时均选择性能对标OpenAI、Google等头部闭源模型,Meta的Llama系列模型甚至已不配作为参照组来展示性能 [3] - 在下载和衍生模型数量上,阿里Qwen模型对Meta实现了赶超,2024年8月,千问的衍生模型数量第一次超过Llama,到了2025年10月,千问模型在全球下载量上也正式超过了Llama [4] - 这意味着Meta无论在数量还是质量上都失去了全球开源模型老大的地位 [4] - 华尔街投行KeyBanc资本市场的分析师在11月的报告中写道,在某种程度上,Meta的AI之路恰恰与Alphabet相反:年初被视为AI赢家,但现在投资回报和战略方向却成了最大的问号 [10] - 美国媒体CNBC在报道中表示,真正具有突破性的AI产品不会出现在小团队手中,而是出现在那些掌握完整生态体系的企业里 [10] - Meta今年成为了美国资本市场上最让人失望的AI股之一 [10] 市场反应与舆论评价 - 社交媒体上,网友们对Meta花上亿美元挖角的员工们选择使用Qwen开源模型进行了大量调侃,有网友直言“花了数十亿美元雇AI研究员,敢情就是为了抄作业?” [6][9] - 扎克伯格过去多次借鉴抖音、微信等中国产品功能,本次使用千问模型被视作一个巨大的“回旋镖” [10] - 扎克伯格在今年年初的播客中曾警告,如果不进行开源对抗,世界将被“反映中国价值观”的AI模型所主导,而他本人也多次在公开场合渲染“中国科技威胁论”,在国会听证会上曾是唯一一个对中国窃取技术问题表现出强硬攻击姿态的硅谷CEO [10] - Meta在打造下一代闭源模型时向Qwen“取经”,某种程度上宣告其亲自承认了Llama在开源领域的统治力已经被终结 [10] - 从开源盟主到闭源追随者,从“中国威胁论”到“偷师”中国同行,Meta的“牛油果”尚未发布就已经舆论缠身,这被视作是硅谷面对中国AI快速崛起时集体焦虑的一个缩影 [11]
英伟达GPU被SpaceX送上太空!在天上训练卡帕西的NanoGPT
量子位· 2025-12-11 14:54
核心观点 - 人类首次在太空轨道上成功训练并运行了AI大模型 这标志着太空计算与AI融合的重大技术突破 其核心驱动力在于突破地球能源与基础设施的瓶颈 为AI算力发展开辟新路径 [2][7][13] 太空AI首秀事件 - 事件由初创公司Starcloud主导 通过SpaceX火箭将搭载英伟达H100芯片的Starcloud-1卫星发射升空 [6] - 在轨卫星上成功运行了谷歌的开源大模型Gemma 并获得了其回应 [4][9] - 首次在太空中直接训练了大语言模型 即前OpenAI联合创始人Andrej Karpathy打造的NanoGPT 训练数据使用了莎士比亚全集 [4][9] 太空计算的发展目标与规划 - Starcloud公司的长期目标是建造基于太阳能面板的轨道数据中心 规划算力达5GW 并预期其造价与运营成本将显著低于地球数据中心 [10] - 公司计划在2026年10月的下一次发射中携带更多英伟达H100芯片 并将Blackwell平台送入太空 [11] - 公司CEO指出 转向太空发展的核心原因是地面面临的能源限制 太空在土地、制冷方面约束更少 且有持续充足的太阳能供给 [12][13] 行业参与与竞争格局 - 谷歌CEO表示计划将TPU发射至太空 最早的两颗卫星预计2027年初启程 [15] - 中国科研机构与企业在该领域早有布局 自2019年起便开始探索太空智能计算 [16][17] - 2024年 中科天算团队完成大模型在轨部署 国星宇航联合之江实验室成功发射全球首个太空计算星座“三体计算星座”首批12颗卫星 并于9月实现常态化商业运行 [18] - 2024年11月 中科天算发布“天算计划” 提出在近地轨道建设算力达10 EOPS的万卡超级智能体集群 [19]
外媒:扎克伯格态度转变 Meta使用阿里千问优化其最新AI模型
环球网· 2025-12-11 10:39
Meta AI模型训练策略转变 - 美国科技巨头Meta在训练其代号为“牛油果”的新模型时,使用了阿里巴巴的Qwen模型进行蒸馏优化 [1] - Meta的团队在训练过程中使用了多个第三方模型,包括谷歌的Gemma、OpenAI的GPT-OSS以及阿里巴巴的通义千问(Qwen)[3] - 此举标志着扎克伯格态度的空前转变,其此前曾对中国模型可能受到审查影响表示担忧 [3] 阿里巴巴Qwen模型的行业地位 - 阿里Qwen模型被Meta等硅谷巨头用作追赶行业领先水平时的重要参考坐标 [3] - 市场分析认为,阿里Qwen已成为开发者和企业市场的首选模型之一 [3] - 英伟达首席执行官黄仁勋表示,中国在开源领域遥遥领先 [3] 阿里巴巴C端应用增长 - 自11月17日开启公测以来,千问App在短短23天内,全端月活跃用户数已突破3000万 [4] - 千问App成为目前全球增长最快的AI应用 [4]
Meta公开抄阿里Qwen作业,还闭源了...
量子位· 2025-12-11 09:33
文章核心观点 - Meta公司计划于明年春季发布一款代号为“Avocado(牛油果)”的闭源AI模型,标志着其从长期坚持的开源战略向闭源模式进行重大转变 [1][2][3][10][11] - 这款闭源模型在训练过程中使用了包括阿里巴巴Qwen在内的第三方开源模型进行优化,此消息刺激阿里巴巴美股盘前一度上涨4%,收盘涨幅2.53% [4][5][6] - Meta的战略转向源于其开源路线的挫折(如Llama 4的失败)以及内部权力结构的重组,以新任首席AI官亚历山大王为代表的闭源拥护者掌握了AI话语权 [11][22][31] Meta的战略转向与“牛油果”模型 - Meta预计在明年春季发布代号为“牛油果”的新AI模型,该模型将是闭源的 [2][10] - 此举意味着Meta进行了一百八十度的战略转向,放弃了其长期以“开源”为核心叙事、并自比“AI时代的安卓系统”的发展路线 [11][12][14] - 新模型在训练过程中使用了多款第三方模型进行优化,其中包括阿里巴巴的Qwen、谷歌的Gemma以及OpenAI的gpt-oss [13][16] - 计划走向闭源的Meta,通过使用开源模型来训练自己的闭源模型,这一做法被解读为印证了当前开源阵营的崛起 [13] 市场反应与行业影响 - 彭博社关于Meta使用阿里巴巴AI训练闭源模型的消息引发市场强烈反应,阿里巴巴美股盘前一度上涨4%,收盘涨幅2.53% [6] - 市场观点认为,此事件凸显了阿里巴巴等公司在开源AI领域的领先地位和影响力 [9][15] Meta内部重组与权力更迭 - 2025年4月,Llama 4的发布未能达到预期,且陷入榜单排名“作弊嫌疑”的争议,成为一次重大挫折 [22] - Llama 4失败后,Meta公司高层开始下达“少谈开源,少提Llama”的指令,并逐步边缘化相关团队成员 [22][28] - 公司进行了大规模重组和裁员,FAIR实验室整组被裁,包括研究科学家总监田渊栋在内的开源路线支持者离职 [28] - AI领域的知名人物LeCun于11月离职,原因之一是Meta不再为其提供足够资源,离职前内部甚至要求员工“雪藏”他及其开源理念 [29][30] - 随着田渊栋、LeCun等人的离开,新任首席AI官亚历山大王彻底掌控了Meta的AI话语权,他是闭源模型的坚定拥护者 [21][31] - 亚历山大王通过一笔高达143亿美元的交易从Scale AI加入Meta [23] - 扎克伯格如今将自己定位为“王的导师”,并将公司最重要、最烧钱的产品项目之一亲自交到亚历山大王手上 [32] “梦之队”的组建与TBD实验室 - Llama 4失败后,扎克伯格亲自挂帅开启“梦之队”招聘计划,为顶尖AI人才提供高额薪酬,年薪一度飙到数亿美元 [23] - 扎克伯格求贤若渴,甚至亲自带着自己煮的南瓜汤上门游说OpenAI的核心研究员 [25] - 这批招募来的明星研究员组成了Meta的“超级智能实验室”旗下的TBD Lab,该实验室是此次战略转折的重要操盘手 [20][26] - 扎克伯格对TBD Lab极为看重,投入大量时间,并将该团队成员安排在自己办公桌附近以便随时了解进展 [27][33]
Meta或转向闭源!小扎亲自带队,引入阿里Qwen模型训练
第一财经资讯· 2025-12-11 09:17
公司动态 - 扎克伯格组建了一个名为TBD Lab的新团队 [1] - TBD Lab团队在训练新模型"Avocado"时使用了多个第三方模型,包括谷歌的Gemma、OpenAI的GPT-oss和阿里巴巴的Qwen模型 [1] - 新模型"Avocado"预计将于明年春季首次亮相 [1] - "Avocado"模型可能作为"闭源"模型推出 [1] 市场反应 - 阿里巴巴美股收盘上涨1.83%至158.82美元 [1]
Meta或转向闭源!小扎亲自带队,引入阿里Qwen模型训练
第一财经· 2025-12-11 09:11
Meta新AI团队与模型进展 - Meta首席执行官扎克伯格组建了一个名为TBD Lab的新团队 [1] - 该团队在训练新模型“Avocado”时使用了多个第三方模型,包括谷歌的Gemma、OpenAI的GPT-oss和阿里巴巴的Qwen模型 [1] - 新模型“Avocado”预计将于明年春季首次亮相,并可能作为“闭源”模型推出 [1] 阿里巴巴市场表现 - 阿里巴巴美股收盘上涨1.83%,股价达到158.82美元 [2]