Workflow
Meta Platforms(META)
icon
搜索文档
放弃开源、重组权力!扎克伯格掏出Muse Spark,杀回大模型主桌
AI科技大本营· 2026-04-09 14:12
公司战略与组织重构 - 公司AI战略发生根本性转变,从以研究为导向转向以产品化和平台分发为核心,旨在将AI能力深度整合进其庞大的产品矩阵中[4][16] - 公司于2025年6月重组AI资源,成立Meta Superintelligence Labs (MSL),并由Alexandr Wang领导,标志着公司AI权力结构从以Yann LeCun为代表的研究派转向强调高执行力和产品化的新阶段[5][14][16] - 公司发布Muse Spark模型,是MSL团队在9个月内重建AI技术栈后的首个公开成果,定位为“通向个人超级智能的第一步”,而非一次常规模型升级[7][11] 新产品:Muse Spark模型 - Muse Spark被定义为原生多模态推理模型,采用分层推理系统设计,提供Instant、Thinking和Contemplating三种模式以应对不同复杂度的问题,其中Contemplating模式会调用多个专用智能体并行处理最困难的任务[8] - 模型在多项关键基准测试中表现突出:在HealthBench Hard上得分42.8,高于GPT-5.4的40.1和Gemini 3.1 Pro的20.6;在FrontierScience上得分38.3%,高于GPT-5.4的36.7%;在Humanity‘s Last Exam综合推理基准上,无工具条件下得分为50.2%,Contemplating模式下可提升至约58%[9] - 模型在多模态理解能力上具有竞争力:在CharXiv Reasoning上得分86.4,高于GPT-5.4的82.8和Gemini 3.1 Pro的80.2;在MMMU Pro Multimodal Understanding上得分80.4%[9][10] - 模型展现出显著的训练效率优势:在Artificial Analysis Intelligence Index v4.0评测中仅使用5800万tokens,而GPT-5.4使用了1.2亿tokens,Claude Opus 4.6使用了1.57亿tokens,实现了约2到3倍的token效率[22] 商业模式与分发策略 - 公司改变了以Llama为代表的开源优先策略,Muse Spark当前版本为闭源,仅向部分合作伙伴提供private preview API,未来可能同时存在闭源与开源变体,优先级转向先将核心能力与体验整合进自家分发系统[13][20] - 公司的核心战略是利用其庞大的分发网络,计划将Muse Spark作为默认智能接口整合进Meta AI app、meta.ai网站、WhatsApp、Instagram、Facebook、Messenger和AI眼镜等全线产品,旨在将AI能力转化为平台入口优势[8][17][20] - 公司追求的不只是模型能力的领先,更是一个能在消费级产品中大规模运行的高效推理系统,其设计权衡了能力、时延和规模化部署的可行性[8][22] 行业竞争格局 - 在Artificial Analysis Intelligence Index v4.0中,Muse Spark得分为52,排名第4,落后于Gemini 3.1 Pro和GPT-5.4的57分,以及Claude Opus 4.6的53分,表明其已进入前沿模型阵营但尚未实现反超[14] - 行业主要参与者各有优势:OpenAI拥有产品迭代速度,Anthropic占据高端用户心智,Google掌控基础设施与系统入口,而公司的优势在于社交网络、内容流、消息系统和可穿戴设备的组合分发能力[20] - 公司通过Muse Spark重新获得了一套能同时阐述模型、产品、组织和平台的完整AI叙事,标志着其重新回到了AI竞争的核心舞台,但能否将能力优势通过分发系统转化为市场胜势仍是待解问题[23][25]
The Market Just Gave You a Rare Chance to Buy These 3 AI Stocks at a Discount
The Motley Fool· 2026-04-09 14:00
市场环境与投资逻辑 - 当前市场出现板块轮动 人工智能相关股票因中东局势等因素回调 而资金流入能源和价值股 [1] - 这种轮动可能是暂时现象 增长型公司最终推动规模和重要性提升 优质股票在折价交易时是买入机会 [2] 英伟达 (NVIDIA) - 公司是人工智能繁荣的核心引擎 股价自高点下跌约17% 为买入时机 [4][5] - 当前股价为182.08美元 市值达4.4万亿美元 当日上涨2.23% [4] - 基于2027财年(截至2027年1月)的盈利预期 其前瞻市盈率仅为21倍 基于2028财年预期则低于16倍 而公司上季度营收增长达73% [5] - 公司已从单纯的GPU供应商演变为端到端人工智能基础设施领导者 不仅主导AI模型训练 还提供用于推理和智能体AI的完整服务器机架 [6] 美光科技 (MICRON) - 公司股价自3月高点下跌20% 基于2027财年(截至2027年8月)分析师盈利预期 其前瞻市盈率低于4倍 [7][8] - 当前股价为405.98美元 市值4590亿美元 当日大幅上涨7.52% [7] - 内存市场正经历结构性变化 高带宽内存的需求为业务带来顺风 英伟达的GPU等AI芯片需要搭配HBM才能发挥最佳性能 [9] - 内存合同结构发生重要转变 从季度合同转向为期三至五年的长期协议 美光已宣布其首个五年期协议 这为业务设定了新的底部 [10] 元平台 (META PLATFORMS) - 科技股回调中 公司股价自高点下跌近30% 前瞻市盈率低于19倍 [11] - 当前股价为612.35美元 市值1.5万亿美元 当日上涨6.49% [11] - 公司正从人工智能中极大获益 并看到营收增长加速 尽管过去在元宇宙等投资上有过失误 [11] - 公司在人工智能和数据中心基础设施上的大规模支出计划曾令股价承压 但这些投资已产生强劲回报 与长期巨额亏损的元宇宙业务形成鲜明对比 [12] - 其人工智能投资产生了飞轮效应 向基于兴趣的AI内容推荐转型有助于延长用户停留时间 增加广告库存 并帮助广告客户获得更好的转化率 [13]
异动盘点0409 | 健康160股价较158.4港元的阶段高点已回撤超六成,光通信概念延续近期涨势;英特尔拉升11.42%创2021年4月以来新高
贝塔投资智库· 2026-04-09 12:03
港股市场动态 - 国民技术(02701)早盘上涨,公司宣布因晶圆、封装材料等核心原材料成本连续大幅上涨,决定自2026年4月7日起对部分产品价格上调15%-20% [1] - 迅策(03317)早盘大涨并刷新上市新高,消息面上,国家数据局定名的AI核心术语“词元”受关注,截至今年3月,我国日均词元调用量已超过140万亿,较2024年初增长1000多倍 [1] - 海西新药(02637)午前上涨,公司公告其新一代原创创新药HXP056在治疗眼底病的前期研究中安全性、药代动力学数据良好,并展示初步积极疗效 [1] - 蔚来-SW(09866)上涨,公司宣布其全新旗舰大型SUV蔚来ES9全国首批展车已陆续抵达各地门店并开放品鉴 [1] - 贝壳-W(02423)上涨,花旗研报开启30日上行催化剂观察,理由包括投资者对公司新业务模式等存在误解,以及3月及4月初核心城市二手房成交改善 [2] - 中国宏桥(01378)上涨,消息面上,力拓集团和世纪铝业公司等美国主要铝材供应商将关键半成品铝材的溢价提高了约12% [2] - 健康160(02656)大幅下跌,该股自3月9日纳入港股通后曾7个交易日内累计上涨1.15倍,但随后股价急转直下,目前股价较阶段高点158.4港元已回撤超六成,公司2025年全年收入6.52亿元,同比增加5%,公司拥有人应占亏损7298.6万元,同比减少32.22% [2] - 潍柴动力(02338)早盘上涨,公司发布投资者关系活动记录表显示,全年实现营业收入2318亿元,同比增长7.5%,归母净利润109亿元 [3] - 宝济药业-B(02659)盘中上涨,公司公告其自主研发的注射用人玻璃酸酶(葆舒宜®)已获国家药监局批准上市,用于辅助皮下输液 [3] - 光通信概念股延续涨势,汇聚科技、长飞光纤光缆、鸿腾精密等上涨,消息面上,Google Cloud Next '26大会将于4月22-24日举行,聚焦企业级AI、云端创新等主题 [4] 美股市场动态 - Metals Royalty(TMCR.US)登陆美股市场后下跌,该公司是一家专注于关键金属与矿产特许权的资源金融公司 [5] - 石油股盘初大幅下挫,阿帕奇石油跌9.8%,墨菲石油跌8.52%,西方石油跌5.04%,康菲石油跌4.97%,雪佛龙跌4.29%,消息面上,国际原油价格回落,布伦特原油期货暴跌超13%报95.02美元,WTI原油期货暴跌超15%报95.32美元,此前美国总统特朗普称同意暂停对伊朗的轰炸和袭击行动两周 [5] - 芯片股早盘普涨,英特尔涨11.42%,阿斯麦涨8.77%,台积电涨5.96%,博通涨4.99%,英伟达涨2.23%,消息面上,随着美伊达成停火协议,市场风险偏好回升 [6] - 英特尔(INTC.US)股价月内累计上涨约30%,创2021年4月以来新高,消息面上,公司宣布加入马斯克旗下“Terafab”项目,合作推进半导体制造与高性能芯片研发 [6] - 存储概念股集体大涨,闪迪大涨9.86%一度创历史新高,美光科技涨7.72%,西部数据涨8.6%,希捷科技涨5.88%,消息面上,戴尔科技CEO警告全球AI内存需求将较现有水平激增625倍,而供给端追赶需要数年时间 [6] - 航空股开盘集体飙升,阿拉斯加航空涨8.07%,西南航空涨6.68%,美国航空涨5.55%,达美航空涨3.75%,消息面上国际原油价格暴跌 [7] - 纳斯达克中国金龙指数开盘涨超4%,热门中概股集体走强,富途控股大涨11.47%,金山云涨7.81%,万国数据涨5.82%,阿里巴巴涨4.68%,拼多多涨4.23%,消息面上特朗普表示同意暂停对伊朗的袭击两周并前提是霍尔木兹海峡立即重新开放 [7] - 美股三大指数大幅高开,纳指大涨3.33%,明星科技股普涨,博通涨4.99%,Meta Platforms涨6.5%,英伟达涨2.23%,谷歌A涨3.88%,亚马逊涨3.5%,苹果涨2.13% [7]
150亿豪赌迎来翻身之作?Meta发布首款重磅AI模型Muse Spark
华尔街见闻· 2026-04-09 11:54
Meta发布自研AI模型Muse Spark的战略意义 - 公司发布自研AI模型Muse Spark,标志着其重金押注AI战略后的首次实质性落地[2] - 该模型是公司去年宣布成立“超级智能实验室”(MSL)以来的首个核心成果,也是公司豪掷约150亿美元挖角Scale AI创始人Alexandr Wang后发布的首款重大AI模型[3] - 模型公布后,公司股价午盘刷新日高时日内涨超9.5%,收盘涨6.5%,两连涨刷新三周来高位,显示投资者反馈积极[3] 战略定位与模型特点 - Muse Spark一改公司过去主打开源的Llama路线,转向闭源模式,模型权重和架构均不公开[6] - 这一转向标志着公司从依赖开源建立生态影响力,向商业化与竞争导向靠拢,未来可能通过API收费或订阅模式变现,是从“AI布道者”向“AI竞争者”的身份转变[7] - 公司内部对Muse Spark的定位较为谨慎,承认其在部分能力上尚不及行业领先模型,尤其是在编程等领域存在短板[10][11] - 模型特点包括:提供多层推理模式(即时/思考/深度推理)、在科学、健康、数学问答方面表现较强、主打“小型、高速”模型定位、研发周期约9个月[11] - 该模型被视为公司AI发展轨迹上的一个早期数据点和“起跑信号”,而非终局产品[5][11] 组织变革与资源投入 - 2025年6月,公司斥资约150亿美元投资Scale AI并将其创始人Alexandr Wang挖至公司,由其执掌新成立的“超级智能实验室”[3][9] - 为应对在大模型能力上落后于竞争对手的局面,公司启动了一系列激进措施:大规模挖角AI顶级人才、精简组织结构提高研发效率、承诺投入数百亿美元建设AI算力基础设施[9] - Muse Spark是这套新体系下的首个“试验品”,其推出表明公司的组织改革初见成效[9][15] 商业化路径与应用场景 - 在应用层面,Muse Spark将直接嵌入公司核心产品矩阵:Facebook、Instagram、WhatsApp[12] - 其中一个重点方向是AI购物助手,帮助用户搜索商品、提供推荐与决策支持,但尚不能直接完成购买[13] - 这一布局与公司现有的广告、电商生态高度协同,显示其AI商业化路径正在逐步清晰,形成AI助手+广告+电商的闭环[13][15] 技术细节与行业影响 - Muse Spark的训练使用了多种第三方开源模型,包括阿里巴巴的千问,同时也借鉴了OpenAI和谷歌的模型[14] - 公司表示采用了“蒸馏”等行业通行技术,并设有严格安全措施[14] - 综合来看,Muse Spark的发布确认了公司的战略转向:从开源理想主义转向闭源商业竞争[15] - 评论认为,这不仅是技术竞赛,更是一场关乎公司未来十年的战略豪赌,但公司能否真正缩小与行业领头羊的差距,市场仍需继续观察[5]
Meta 143亿挖角后首个作品来了:Alexandr Wang 推出闭源模型,杨立坤点赞
AI前线· 2026-04-09 11:19
公司发布新一代AI模型 - 公司于深夜正式发布新一代AI模型“Muse Spark”,代号“Avocado”,这是其内部AI组织Meta Superintelligence Labs战略重组后的首个落地产品[5] - 该模型被视为公司迈向“个人超级智能”路线图的起点[5] - 该模型由Alexandr Wang带队研发,是其加入公司9个月后交出的首个作品,公司此前为挖角Alexandr Wang花费了143亿美元[2] 模型定位与核心能力 - Muse Spark被定义为“原生多模态推理模型”,不仅能够处理文本,还能理解图像、环境信息,并在此基础上进行推理、调用工具,甚至与其他智能体协同完成复杂任务[7] - 这种能力组合意味着公司正试图将AI从“对话工具”升级为“行动系统”[8] - 模型的核心突破集中在“多模态推理”,旨在应对科学、数学和健康领域的复杂问题[11] - 不同于传统视觉模型,Muse Spark能够将视觉信息与推理过程深度融合,不仅能“看见”,还能“理解并推导”[13] - 模型支持“可视化思维链”,即将推理过程以可视形式呈现,提升了可解释性,并为复杂任务的人机协作提供了新的交互范式[14] 模型性能表现 - 在多项基准测试中,Muse Spark表现优异。例如,在CharXiv Reasoning Figure Understanding测试中得分为86.4,高于Opus 4.6的65.3、Gemini 3.1 Pro的80.2、GPT 5.4的82.8和Grok 4.2的60.9[6][12] - 在MMMU Pro Multimodal Understanding测试中得分为80.4[6][12] - 在ERQA Embodied Reasoning测试中得分为64.7[6][12] - 在SimpleVQA Visual Factuality测试中得分为71.3[12] - 在ScreenSpot Pro Screenshot Localization - With Python测试中得分为84.1[6][12] - 在HealthBench Hard Open-Ended Health Queries测试中得分为42.8,显著高于Opus 4.6的14.8、Gemini 3.1 Pro的20.6、GPT 5.4的40.1和Grok 4.2的20.3[12] - 在MedXpertQA (MM) Medical Multiple Choice测试中得分为78.4[12] - 公司发布了“思考模式”,可协调多个智能体并行推理,使其能够与Gemini Deep Think和GPT Pro等前沿模型的极限推理模式相媲美[12] - 在“思考模式”下,Muse Spark在“人类最后的考试”任务中取得了58%的完成率,在“前沿科学研究”任务中取得了38%的完成率[12] - 在对比表格中,Muse Spark Contemplating模式在Humanity's Last Exam Multidisciplinary Reasoning (With Tools)测试中得分为58.4,高于Gemini 3.1 Deep Think的53.4,略低于GPT 5.4 Pro的58.7[13] - 在FrontierScience Research Scientific Research测试中,Muse Spark Contemplating得分为38.3,高于Gemini 3.1 Deep Think的23.3,也高于GPT 5.4 Pro的36.7[13] 公司AI战略转向 - Muse Spark的发布是公司AI战略的一次整体转向,从过去开源导向的Llama系列,转向如今强调“超级智能”的闭环系统能力[9] - 核心变化在于不再单纯追求模型能力本身,而是强调“模型 + 工具 + 环境 + 多智能体”的系统级协同[9] - 为支撑这一方向,公司正在对整个技术栈进行重构,包括模型训练、数据管理以及底层基础设施[10] - 名为Hyperion的新一代数据中心被明确点名,成为未来大规模模型扩展的关键支撑[10] 技术优化与效率提升 - 在过去九个月中,团队重构了预训练体系,包括模型架构、优化方法和数据管理流程[16] - 在达到相同性能的前提下,Muse Spark所需的训练计算量相比上一代模型(如Llama 4 Maverick)下降了一个数量级以上[16] - 公司强调通过工程优化提升“单位算力产出”,试图证明性能增长不必完全依赖指数级资源投入[19] - 技术博客详细介绍了从预训练、强化学习和测试时推理三个维度研究和追踪模型的扩展特性[21] - 在预训练阶段,与之前的模型Llama 4 Maverick相比,公司用少一个数量级以上的计算资源就能达到相同的性能[21] - 在强化学习阶段,新技术栈能够带来平稳、可预测的性能提升,且收益具有可预测的泛化能力[23] - 在测试时推理阶段,通过思考时间惩罚和多智能体编排等手段,高效利用推理令牌,在不显著增加延迟的情况下提升性能[25][26] 健康领域应用 - 公司特别强调了Muse Spark在健康领域的应用潜力[15] - 公司与超过1000名医生合作构建训练数据,使模型在健康推理上具备更高的专业性与可靠性[15] - 基于此能力,模型可以生成带交互界面的分析结果,例如食物营养结构的可视化拆解、运动过程中肌肉激活情况的动态展示、个性化饮食建议等[15][18] - 这类能力的本质是将AI从“信息提供者”升级为“决策辅助系统”[15] 安全评估 - 公司表示已在部署前对Muse Spark进行系统性评估,依据其更新后的“高级人工智能扩展框架”,对威胁模型、评估流程及上线标准进行了统一规范[28] - 评估重点覆盖前沿风险、行为一致性以及对抗鲁棒性,并在安全措施实施前后进行对比测试[28] - 结果显示,Muse Spark在涉及高风险内容时表现出明显的拒绝倾向,主要得益于数据过滤、后训练安全对齐及系统级防护的多层机制[28] - 公司指出,在网络攻击或“失控”场景中,当前模型尚不具备执行复杂威胁任务的自主能力[28] 市场反响与社区讨论 - 模型发布在技术社区引发巨大反响,Stability AI创始人Emad Mostaque、公司前首席科学家Yann LeCun、Coinbase联创兼CEO Brian Armstrong等纷纷在X上表示祝贺[31] - 有网友认为模型在排行榜上的表现令人印象深刻,并好奇公司是否会在智能体编码领域展开竞争[32] - 有网友认为模型的多代理编排部分很有意思,能原生处理并行代理协调问题,对于大型代码库的复杂重构来说是一个真正的突破[32] - 有网友认为公司能在短时间内用低10倍的计算能力构建出性能强大的模型,这9个月的基础设施建设工作构成了制胜的护城河[34] - 也有网友将新模型与Opus 4.5进行对比,认为“牛油果”表现逊色于Opus 4.5[36] - 值得注意的是,此次发布的新模型走的是闭源路线,与此前主张的开源模型完全相反,这让一些X用户感到失望[39] - 有网友认为公司这次之所以将模型闭源,是因为此前的一系列开源没有为股东创造足够价值[39] 公司现状与未来计划 - 公司承认Muse Spark目前仍存在明显短板,尤其是在长时程智能体和编码与复杂工作流两个关键领域,未达到真正“代理人级别”的能力[41][42] - 公司尚未在大模型市场取得显著突破,而其在该领域的主要竞争对手已经遥遥领先,OpenAI和Anthropic的估值总和现已超过1万亿美元[41] - 据Grand View Research称,全球生成式人工智能市场预计将以每年40%以上的速度增长,从2025年的约220亿美元增长到2033年的近3250亿美元[41] - 公司正在加大对人工智能基础设施的投入,其2026年与人工智能相关的资本支出将在1150亿美元至1350亿美元之间,几乎是去年的两倍[45] - 公司正在尝试一种新的AI模型盈利模式,即通过API向第三方开发者提供Muse Spark底层技术的访问权限,目前只有部分“特邀合作伙伴”可以访问“私有API预览版”,但计划在未来向更广泛的用户群体提供付费API访问权限[45] - Muse Spark目前已应用于公司独立的Meta AI应用程序和桌面网站中的数字助理功能,并将在未来几周内率先登陆Facebook、Instagram、WhatsApp和Messenger,以及公司与Ray-Ban合作推出的Meta AI眼镜[45] - 公司还计划最终让Muse Spark为Meta AI应用程序中的Vibes AI视频功能提供支持[46]
Bank OZK (OZK) – One of the 13 Bank Stocks with Highest Dividends
Insider Monkey· 2026-04-09 10:36
行业前景与市场预期 - 亚马逊CEO Andy Jassy将生成式AI描述为“一生一次”的技术 正在全公司范围内用于重塑客户体验[1] - 埃隆·马斯克预测 到2040年人形机器人数量将至少达到100亿台 单价在20,000至25,000美元之间[1] - 根据马斯克的预测 该技术市场到2040年可能价值250万亿美元 相当于重塑全球经济[2] - 普华永道和麦肯锡等主要机构认为AI将释放数万亿美元的价值潜力[3] - 比尔·盖茨将AI视为其“一生中最大的技术进步” 认为其变革性超过互联网或个人电脑 能改善医疗、教育并应对气候变化[8] - 拉里·埃里森通过甲骨文公司 正斥资数十亿美元购买英伟达芯片 并与Cohere合作将生成式AI嵌入其云服务和应用程序[8] - 沃伦·巴菲特认为这项突破可能产生“巨大的有益社会影响”[8] 技术突破与投资焦点 - 一项强大的技术突破正在重新定义人类工作、学习和创造的方式 并已引发对冲基金和华尔街顶级投资者的狂热[4] - 投资焦点可能并非英伟达等知名公司 而是一家规模小得多、默默改进关键技术的公司[6] - 一家未被充分关注的公司被认为是开启这场250万亿美元革命的关键[4] - 该公司的超低成本AI技术据称应引起竞争对手的担忧[4] 市场估值对比 - 250万亿美元的市场规模 粗略相当于175个特斯拉、107个亚马逊、140个Meta、84个谷歌、65个微软或55个英伟达的市值总和[7]
JPMorgan Trims Wells Fargo & Company (WFC) Target, Flags Volatility Risks for Banks
Insider Monkey· 2026-04-09 10:10
行业趋势与市场预测 - 生成式人工智能被亚马逊首席执行官Andy Jassy描述为“一生一次”的技术,正在被用于重塑客户体验 [1] - 埃隆·马斯克预测,到2040年,人形机器人数量将至少达到100亿台,单价在2万至2.5万美元之间 [1] - 根据马斯克的预测,该技术到2040年的潜在市场价值可能达到250万亿美元,这相当于重塑全球经济的一个完整生态系统 [2] - 普华永道和麦肯锡等主要公司认为人工智能具有释放数万亿美元价值的潜力 [3] - 人工智能被视为一个强大的突破,正在重新定义人类工作、学习和创造的方式 [4] 1 科技巨头与行业领袖的布局 - 亚马逊创始人杰夫·贝索斯曾指出一项突破性技术将决定亚马逊的命运 [1] - 比尔·盖茨将人工智能视为“我一生中最大的技术进步”,认为其变革性超过互联网或个人电脑,能够改善医疗保健、教育并应对气候变化 [8] - 拉里·埃里森通过甲骨文公司斥资数十亿美元购买英伟达芯片,并与Cohere合作,将生成式人工智能嵌入甲骨文的云服务和应用程序中 [8] - 沃伦·巴菲特表示,这项突破可能产生“巨大的有益社会影响” [8] - 硅谷和华尔街的亿万富翁们正将目光投向特斯拉、英伟达、Alphabet和微软之外,寻找他们认为更大的机会 [6] 潜在投资机会与焦点公司 - 一家持股不足的公司被认为是开启250万亿美元革命的关键 [4] - 该公司的超廉价人工智能技术据称应引起竞争对手的担忧 [4] - 真正的故事并非英伟达,而是一家规模小得多的公司,它正在悄然改进使整个革命成为可能的关键技术 [6] - 250万亿美元的市场价值并非与单一公司挂钩,而是与整个重塑全球经济的AI创新者生态系统相关 [2] - 该公司的潜在价值被比喻为175个特斯拉、107个亚马逊、140个Meta、84个谷歌、65个微软和55个英伟达的总和 [7]
Meta亿元天团首个大模型交卷!余家辉宋飏Jason Wei耗时九个月,一雪Llama前耻
量子位· 2026-04-09 09:35
Meta发布全新AI模型Muse Spark - Meta超级智能实验室(MSL)在亚历山大王带领下,耗时9个月从零重构了公司的AI技术栈,并发布了其首个主打原生多模态的模型Muse Spark [2] - 模型发布后,市场反应热烈,Meta股价当日整体上涨约6%,盘中一度涨超近10% [4] - 此次发布标志着Meta在第三方测评中重新进入AI第一梯队,一改此前Llama 4带来的落后局面 [7] 模型核心特点与定位 - Muse Spark是一款专注于**推理**能力的模型,其开发始于9个月前一个用于推理的Llama模型脚本 [5][6] - 模型在**多模态理解能力**上表现突出,在图表理解、屏幕定位等多项测评中得分位居第一或与Gemini 3.1 Pro、GPT 5.4等顶尖模型不相上下 [13][14] - 模型具备强大的**工具调用能力**,测评表现与多模态理解能力类似 [21] - 模型**医学能力**是其强调的重点,通过与1000多名医生合作,在开放式健康问答HealthBench Hard上获得42.8的最高分,在多模态医学问答MedXpertQA MM中也位居前列 [22] - 公司承认模型在**编程**和**长时间自主运行(Agent类任务)** 方面仍与竞争对手的顶尖模型存在差距 [8][23] - 模型采用**闭源**策略,目前仅上线Meta网站和APP,API仅向部分合作伙伴开放,但公司计划未来开源后续版本 [10][11][12] 模型性能测评 - 在CharXiv Reasoning Figure Understanding(图表推理理解)基准测试中,Muse Spark Thinking得分为86.4,高于Opus 4.6 Max的65.3和Gemini 3.1 Pro High的80.2 [13] - 在HealthBench Hard Open-Ended Health Queries(开放式健康问答)基准测试中,Muse Spark得分为42.8,显著高于Opus 4.6 Max的14.8和GPT 5.4 Xhigh的40.1 [13] - 在SWE-Bench Pro Diverse Agentic Coding(多样化智能体编码)基准测试中,Muse Spark得分为52.4,略低于GPT 5.4 Xhigh的57.7 [13] - 公司推出了**Contemplating(沉思)模式**,通过让多个智能体协作思考来提升复杂推理任务表现,在该模式下,模型在“人类最后的考试”多学科推理(无工具)测试中得分为50.2,高于Gemini 3.1 Deep Think的48.4 [24][25][29] 技术创新与训练细节 - 模型开发的核心是**9个月重构一切**,包括新的基础设施、架构和数据管道 [38][39] - 在预训练阶段,新模型能够以比Llama 4**少10倍以上(10.3倍)** 的计算量达到相同的性能水平 [41][45] - 强化学习训练展现出平滑且可预测的改进,在训练数据和未见过的任务上均表现出良好的泛化能力和可扩展性 [41][48][49][51] - 在测试时推理阶段,通过引入**思考时间惩罚**机制,模型学会了“思维压缩”,即用更少的token解决问题,从而在效果与效率间取得平衡 [41][56][59][60] 商业化应用 - 模型无预告直接上线了“**购物模式**”,该模式会结合用户在Instagram、Facebook、Threads上关注的创作者和品牌偏好,进行个性化购物推荐 [29][30] 市场评价与影响 - 第三方测评机构认为Muse Spark将Meta重新带回了人工智能第一梯队,在关键指标人工智能分析指数上,其得分仅次于Gemini 3.1 Pro、GPT-5.4和Claude Opus 4.6 [34][36] - 模型团队汇聚了多位顶尖AI研究人员,包括思维链作者Jason Wei、o1核心贡献者Hyung Won Chung、扩散模型核心人物宋飏等,阵容强大 [5]
谈谈Meta的芯片路线图
半导体行业观察· 2026-04-09 09:18
Meta Platforms的AI计算引擎战略 - 公司认为未来AI计算引擎形态难以预测,且模型更新速度快于芯片开发周期,因此大型模型构建商及大规模运行AI推理的机构必须采取多产品、多来源、多供应商的策略,以应对潜在的延迟或功能缺失 [1] Meta Platforms的业务与深度学习推荐模型 - 公司的核心业务是在庞大的社交网络上运行排名和推荐引擎,这些引擎最初由运行在大量CPU上的算法构成,后通过运行在GPU上的深度学习推荐模型进行增强 [1] - 深度学习推荐模型与大型语言模型不同,它创建巨大的多维向量空间来展示事物间的关联,是预测性的,这对作为全球最大广告商之一的公司来说是一项强大的功能 [2] - 为处理数十亿用户数万亿次操作所需的巨大内存空间,公司将任务分为两部分:配备高速HBM的GPU存储“热门”数据,配备大容量DRAM的CPU存储其余数据 [3] - 公司设计了“Zion”、“ZionEX”和“Grand Teton”混合CPU-GPU系统来运行深度学习推荐模型,并创建了名为“Neo”的内存管理程序,用于在节点内及机器集群中对参数和嵌入进行分级 [3] 从深度学习推荐模型到生成式推荐器 - 深度学习推荐模型的性能提升不会随计算资源增加而线性提升,规模更大并不总是更好 [5] - 从2024年开始,公司提出了一种新的深度学习推荐模型方法,称为生成式推荐器,该方法基于分层序列转换单元技术,借鉴了大型语言模型的技术,将用户行为视为一种语言进行预测 [5] - 公司已在其所有应用平台使用的深度学习推荐模型 v3 中嵌入了分层序列转换单元方法 [5] - 让深度学习推荐模型更像大型语言模型的洞察,以及分层序列转换单元技术,推动了公司的MTIA AI计算引擎项目,其唯一目的是通过协同设计大幅提升性价比 [5] MTIA AI计算引擎路线图与部署 - 公司公布了MTIA路线图,驳斥了发展受阻的传言 [5] - 未来的MTIA设备将采用分层序列转换单元技术进行协同设计,以降低排名和推荐训练及推理的成本,并可能在生成式AI推理方面表现出色,从而同时支持其深度学习推荐模型和大型语言模型项目 [6] - 公司已在其数据中心部署了数十万个MTIA 100和MTIA 200芯片,以及此前未提及的MTIA 300芯片 [7] - 公司自2023年下半年开始部署用于排名和推荐训练工作负载的MTIA 300计算引擎 [7] - MTIA 400芯片已在实验室完成测试,并准备在数据中心进行部署 [12] MTIA各代芯片技术规格演进 - **MTIA 100 (原MTIA v1)**:2023年5月发布,2023年下半年发货,采用台积电7纳米工艺,芯片面积373平方毫米,晶体管数量110亿,热设计功耗25瓦,专注于排名和推荐推理 [10] - **MTIA 200 (原MTIA v2)**:2024年3月发布,2024年下半年发货,采用台积电5纳米工艺,芯片面积431平方毫米,晶体管数量280亿,热设计功耗90瓦,专注于排名和推荐推理 [10] - **MTIA 300**:2026年3月发布,2025年下半年发货,采用台积电5纳米工艺,芯片面积647平方毫米,晶体管数量450亿,热设计功耗800瓦,专注于排名和推荐训练,标志着从INT8处理转向FP8处理 [10][11] - **MTIA 400**:2026年3月发布,2026年下半年发货,采用台积电3纳米工艺,采用双计算芯片设计,每个芯片面积810平方毫米,总晶体管数量2 * 870亿,热设计功耗1200瓦,目标为通用计算 [10][11] - **MTIA 450**:2026年3月发布,2027年上半年发货,采用台积电3纳米工艺,双计算芯片设计,热设计功耗1400瓦,目标为生成式AI推理,是MTIA 400的快速升级版,主要改进在于将HBM3E内存升级到HBM4,内存带宽翻倍至18.4 TB/s [10][14] - **MTIA 500**:2026年3月发布,2027年下半年发货,采用台积电2纳米工艺,采用四计算芯片设计,每个芯片面积435平方毫米,总晶体管数量4 * 580亿,热设计功耗1700瓦,目标为生成式AI推理 [10][15] 关键硬件特性与性能对比 - **内存与带宽**:MTIA 300配备216 GB HBM3内存,带宽6.1 TB/s;MTIA 400配备288 GB HBM3E内存,带宽9.2 TB/s;MTIA 450配备288 GB HBM4内存,带宽18.4 TB/s;MTIA 500将提供384 GB或512 GB HBM4E内存版本,带宽27.6 TB/s [10][18] - **张量性能**:MTIA 300的FP8/MX8性能为1200 Teraflops,FP16/BF16性能为600 Teraflops;MTIA 400的MX4性能为12000 Teraflops,FP8/MX8性能为6000 Teraflops,FP16/BF16性能为3000 Teraflops;MTIA 450的MX4性能为21000 Teraflops,FP8/MX8性能为7000 Teraflops,FP16/BF16性能为3500 Teraflops;MTIA 500的MX4性能为30000 Teraflops,FP8/MX8性能为10000 Teraflops,FP16/BF16性能为5000 Teraflops [10] - **互联与扩展**:MTIA 300采用多芯片设计,提供12条800 Gb/s RoCE以太网通道;MTIA 400将插入由AMD和Meta联合开发的“Helios”开放式机架,最多可将72个设备连接到共享内存域中 [9][11] - **成本与性价比**:据估计,博通向Meta提供的MTIA芯片价格从MTIA 100的700美元到MTIA 500的15000至20000美元不等;从2023年到2027年,公司MTIA设备的有效吞吐量将提升293倍,单位推理吞吐量的成本预计将下降9.1倍 [10][16]
全球大公司要闻 | 马斯克索赔1340亿硬刚OpenAI,AI史上最大权力清洗战一触即发
Wind万得· 2026-04-09 08:47
热点头条:全球AI与科技巨头动态 - OpenAI面临马斯克诉讼,马斯克寻求罢免CEO萨姆·奥特曼和总裁格雷格·布罗克曼,并要求OpenAI恢复非营利模式及索赔高达1340亿美元[3] - 软银集团正探索高达400亿美元的潜在贷款,主要用于为其对OpenAI的投资提供资金,同时其子公司软银公司筹备首只欧元计价债券[3] - 苹果正测试先进玻璃基板用于代号“Baltra”的AI服务器芯片,预计采用台积电3纳米N3E工艺,深化自研AI硬件布局[4] - Meta推出首款原生多模态推理AI模型Muse Spark,并将德州数据中心投资从15亿美元大幅增至100亿美元用于大模型训练[4] - Anthropic向亚马逊、苹果和微软等部分客户推出新的网络安全AI模型Claude Mythos Preview[4] 大中华地区公司要闻 - 三安光电副董事长兼总经理林科闯被监察机关留置并立案调查,公司称其他高管正常履职,生产经营保持稳定[6] - 腾讯QQ浏览器AI发布国内首个浏览器“龙虾”QBotClaw,支持用户配置国内主流大模型API Key,首期上线Mac版本[6] - 澜起科技预计2026年一季度营业收入为15.78~17.49亿元,同比增长29.1%~43.1%,受益于AI服务器相关芯片需求增长[6] - 佰维存储遭遇专利侵权诉讼,涉案金额达5000万元,案件已进入司法审理程序[7] - 中恒电气控股股东获宁德时代增资41亿元,宁德时代将获得其部分股权,市场解读为强化电力电子领域产业链布局[7] - 天华新能预计2026年一季度净利润同比增长27517.53%-32120.45%,主要因锂电材料业务量价齐升[7] - 云顶新耀以总对价2.5亿美元收购海森生物制药旗下新加坡子公司全部股权,标的公司2025财年实现常态化收入约5.66亿元人民币[8] 美洲地区公司要闻 - 英伟达H100老芯片租赁价格5个月内上涨40%,机构预测2026年其Blackwell系列高端AI芯片出货占比将超过七成,下一代Rubin系列因HBM4验证问题存在延迟风险[10] - 特斯拉向搭载HW4硬件的车型推送FSD V14.3版本,系统响应速度提升20%,并强化了神经网络训练强化学习[10] - 亚马逊将于5月20日起停止对2012年之前发布的老款Kindle设备提供服务支持,并于4月17日起对加拿大亚马逊物流卖家征收3.5%的燃油与物流附加费[10] - 达美航空一季度经调整后营收142亿美元(预估140.8亿美元),经调整后每股收益64美分(预估57美分),预计第二季度燃油成本将增加超过20亿美元[10] 亚太地区公司要闻 - 三星电子启动泰勒晶圆厂2nm工艺试产,并与德国林德公司签署氦气长期额外采购协议以解决供应短缺问题,有消息称其中国战略可能调整,未来重心转向存储等半导体业务[12] - SK海力士与美国空气产品公司签署额外氦气长期供应合同,并正式启动321层QLC NAND固态硬盘出货,首发供应戴尔[12] - 三星显示与苹果签署为期三年的独家可折叠OLED供应协议,计划第二季度开始量产,今年初期供应量约为300万片,远低于市场预期的约1000万片[13] - 丰田汽车首款搭载固态电池的量产车正式下线,并推出首款搭载鸿蒙座舱的纯电旗舰铂智7,起售价14.78万元[13] - 现代汽车因霍尔木兹海峡封锁调整货轮航运路线,CEO表示供应链有足够缓冲空间,不会对生产交付造成明显冲击[13] - 印度内阁批准为印度石油公司拉贾斯坦邦炼油项目拨款7945.9亿卢比,该项目预计创造1万个直接就业岗位[13] - 半导体设备厂商DISCO一季度出货金额同比增长28.2%,主要因全球半导体制造设备需求回暖[14] 欧洲及大洋洲地区公司要闻 - 宝马集团将携三大品牌共16款首秀车型登陆2026北京车展,其中4款为全球首发,涵盖全新7系、i7及专为中国打造的新世代iX3/i3长轴距版[16] - 梅赛德斯-奔驰GLC车型的M254发动机因凸轮轴中心阀滤网易脱落的设计缺陷遭消费者投诉,可能引发发动机大修风险,奔驰仅发布内部技术公告为车主免费改进,未公开召回[16] - 力拓因市场供应受阻推高生产成本,宣布上调铝坯溢价约12%,调整后铝坯价格约为每吨110美元[16] - 澳大利亚促销电商平台Click Frenzy因消费需求疲软、营收下滑及资金链断裂宣布自愿清算关站[16]