Workflow
闭源模型
icon
搜索文档
中国AI落后?“美国人压力太大,在说梦话”
观察者网· 2026-01-23 09:45
文章核心观点 - Mistral AI公司CEO反驳中国AI技术落后论 认为中国在开源技术方面领先 可能给美国公司带来压力[1] - AI成为重要地缘政治力量 市场由美国和中国主导 欧洲寻求差异化发展[1] - 关于中国AI发展水平的观点在西方科技领袖中存在分歧[3] 行业格局与竞争态势 - AI市场由美国和中国主导 欧洲寻求差异化发展路径[1] - 许多美国AI模型如谷歌Gemini和OpenAI的ChatGPT为闭源 中国在开源模型开发上处于领先地位[5] - 开源模型提供更高透明度 闭源模型通常成本更高且灵活性较差[5] - 企业和国家正投入数十亿美元建设AI基础设施和能力 英伟达CEO表示这将耗资数万亿美元[1] 公司动态与战略 - Mistral AI公司CEO预计公司到今年年底营收应超过10亿欧元[1] - 公司今年可能在高性能计算机芯片及相关基础设施上投入大致相同的金额(约10亿欧元)用于开发和运行AI模型[1] - 公司正在考虑一些收购机会 但未透露具体业务领域和地点[1] - Mistral公司在欧洲处于领先地位 去年在一轮融资中估值达到137亿美元 荷兰芯片制造巨头ASML是其主要投资者[1] - 与美国科技巨头数千亿美元的估值相比 Mistral公司的估值仍相去甚远[1] 技术发展路径分歧 - 谷歌DeepMind CEO认为中国在前沿模型开发上落后西方约六个月[3] - Anthropic CEO认为美国出口限制成功减缓了中国AI发展 并称放行英伟达H200 AI芯片对华出口是个错误[3] - 谷歌前CEO施密特指出 美国公司多转向闭源 而中国企业主要采用开放权重、开源的方式[3] - 施密特认为 除非欧洲愿意为欧洲AI模型投入巨资 否则欧洲最终会使用中国模型[3]
2025人工智能发展现状报告:超级智能与中美大模型PK,限制与超越 | 企服国际观察
钛媒体APP· 2026-01-12 13:39
报告概览与核心预测 - 报告为《人工智能现状报告 2025》,长达300多页,由业界顶尖从业者评审,涵盖技术、产业、政策、安全、市场等多个维度[2] - 报告对下一年度做出多项预测:中国研究机构在前沿AI模型研究上将超越美国;开放式AI智能体(Agent)更值得获得进一步科研发现;基于AI生成欺诈视频的网络攻击将引发国际讨论;美国某头部AI研究架构将转向开源生态以获得政府支持[2] 技术发展与模型竞争 - 2024年末至2025年,随着GPT-o1发布,基于深度推理的大模型发展热潮兴起,多家厂商快速面世多个推理模型[3] - 以Meta为代表的科技巨头定义了“超级人工智能”(Superintelligence)一词,“通用人工智能”(AGI)成为过去时[3] - 顶尖模型仍保持闭源,如GPT-5、GPT-o3、Gemini 2.5 Pro、Claude 4.1 Opus、Grok4等,其中OpenAI的GPT-5在多个基准测试中保持领先[5] - 中国基础模型虽未取得突破性进展,但在开源模型领域颇具竞争力,DeepSeek、Qwen和Kimi等模型崛起,在推理和编程任务方面正逐步缩小与领先者的差距[6] - 开源为中国厂商提供了快速追赶的契机,越来越多的开发者选择基于Qwen进行开发[6] - 曾作为开源模型标杆的Meta Llama,其市场份额已从2024年末的约50%大幅下滑至目前的15%[6] - 近期推理模型的方法改进完全处于基准模型的误差范围内,可能意味着其进步并不真实,且强化学习带来的实际收益微乎其微,容易过拟合[9] - 前沿AI实验室正探索将强化学习、可验证奖励机制、可验证推理与新环境结合,赋予模型规划、反馈、自我修正及长期执行任务的能力[11] - AI研究正考虑利用小语言模型构建智能体,因其成本显著降低且能满足实际操作需求,策略是采用小语言模型构建有限的异构智能体架构,仅在必要时调用大模型[11] AI智能体与产业应用 - AI智能体框架发展迅速,LangChain仍是众多选择之一,各细分领域涌现数十种框架,如研发领域的AutoGen、camel,软件工程领域的MetaGPT等[13] - AI智能体的研究正赋予其记忆能力,实现从拓展上下文窗口到结构化、持久性终身记忆的转变,并延伸至动态整合、遗忘和反思[13] - AI在跨学科领域应用价值凸显,例如DeepMind基于Gemini 2.0构建的AI系统“Co-scientist”能生成、辩论并进化其假设生成与实验规划过程[13] - AI在物理世界涌现,如艾伦人工智能研究所的MolmoAct和谷歌的Gemini Robotics 1.5,能提升物理机器人的可解释性和可靠性[13] - AI产业应用迅速普及,AI优先企业营收远超其SaaS同行,在各个行业展现出发展势头[13] - 2025年,随着AI采用率上升,用户留存率上升,企业支出增加,特别是在音视频、虚拟形象、图像生成领域,AI公司收入有望实现爆发式增长[13] - 企业内部AI应用场景以内容生成、代码生成、研究及分析密集型任务最为常见[18] - 使用频率最高的工具包括ChatGPT、Claude、Gemini/Google和Perplexity,DeepSeek覆盖率略低但使用频率相对较高[18] - 在开发者工具中,Cursor、Claude Code和GitHub Copilot备受青睐;非编程工具中,Deep Research、ChatGPT、ElevenLabs、Perplexity和Claude使用频率非常高[18] - 对1183名AI从业者的调研显示,95%的专业人士现在在工作或生活中使用AI,76%的人自掏腰包购买AI工具,且大多数人表示生产力持续提高[25] 市场竞争、风险与基础设施 - AI编程工具可能主动覆盖企业生产代码,导致开发成果受损[21] - 从事AI编程开发的初创公司面临严峻的单位经济效益挑战,盈利受制于上游模型价格和竞争对手,可能采取突然提价或限制用户功能等措施[21] - 浏览器正成为AI应用的最新焦点和企业竞争的新战场,OpenAI、Google、Anthropic和Perplexity均推出了能在浏览器中导航和操作的助手功能,将浏览器重新定义为智能操作系统[21] - 谷歌在其产品中嵌入Gemini能力,其每月Token消耗数量在2025年同比增长了50倍,达到千万亿个Token[22] - 电力供应正成为制约AI发展的新因素,若电力供应不足,国家AI计划将面临崩溃风险,未来1-3年内美国几个主要地区可能会出现电力短缺[22] - 美国能源部警告,由于电力供应不稳定和AI需求增长,到2030年,停电频率可能会增加100倍[22] - 2024年末DeepSeek搅动市场,市场重新认识“杰文斯悖论”,即更便宜的智能带来更高的需求,进而提高对芯片的消耗[22] - GPU至关重要,英伟达市值突破4万亿美元,占据90%的AI研究论文市场份额,定制芯片与新云服务同步崛起[25] - 除英伟达外,上市公司Coreweave、Nebius以及私企Lambda、Crusoe因客户对优惠价格、灵活合同条款及AI专用软件套件的需求增加而实现快速增长[25] - TPU和AMD的GPU普及程度并不高[25] 劳动力市场影响 - AI主要挤压入门级岗位市场,在软件和客服领域,这类岗位极易受AI技术影响,其招聘岗位持续下降,经验丰富的劳动力暂时保持工作稳定性[25] - 研究发现当前劳动力市场变化早于2022年ChatGPT的问世,AI自动化目前并未削弱经济领域对认知型劳动力的需求[28] 政策、安全与监管 - 美国推行“美国AI优先”战略并调整出口政策,中国加速推进自主研发与本土芯片制造,中美AI竞赛愈演愈烈[28] - 2025年,特朗普政府将人工智能安全研究所更名为人工智能标准与创新中心,并启动了5000亿美元的“星门计划”,同时美国政府发布《人工智能行动计划》力求保持其全球主导地位[28] - AI芯片出口限制政策用“反复”形容,美国政府需在国家安全目标与供应链依赖、供应商游说间寻求平衡,英伟达和AMD成为政治焦点,英伟达在中国市场并未达到稳定状态[28] - 美国监管措施在巨额投资浪潮中被边缘化,国际外交陷入僵局,《人工智能法案》实施遭遇重重阻碍[31] - AI数据中心建设陷入邻避主义瓶颈,美国公众对新建大规模数据中心的反对声日益高涨[33] - 政府《人工智能行动计划》提及需自主AI领域“基础科学”,但其核心研发资金远低于专家建议的2026年320亿美元投资目标[33] - 硅谷科技巨头采取“逆向”并购政策:通过快速引进人才(创始人及团队高薪)以规避并购限制,同时保留原业务精简的公司转型拓展小众市场,例如微软收购Inflection,谷歌收购Character AI,亚马逊收购Adept,Meta收购Scale AI[33] - 美国联邦贸易委员会对这类“逆向”并购行为的担忧日益加剧[35] - 美国就AI安全相关的政策议题发生转变,加之实验室间商业竞争激烈,某些安全规程已被列为非优先事项[36] - 外部安全机构年度预算甚至不及顶尖实验室单日总支出,曾以安全为核心的机构开始将重点转向产品化[36] - 报告估算,外部AI安全研究投入仅约1.3亿美元,而同期全球AI研发支出接近千亿美元,比例极低[36] - AI实验室为防范生物安全风险和网络攻击部署了空前防护,部分实验室却因错过自我设定的截止日期或悄然放弃测试方案[36] - 网络攻击能力每五个月翻一番,远超防御措施的更新速度,犯罪分子利用AI智能体的勒索软件已渗透至世界500强企业[39] - 涉及生成式AI的安全事件正呈急剧增长态势,大量报告事件涉及AI换脸技术,与大模型的滥用密切相关,AI代理正日益成为网络安全防御的重大挑战[39]
Llama 4被图灵奖得主曝作弊刷榜,Meta开源AI帝国一夜倾覆
钛媒体APP· 2026-01-11 19:49
文章核心观点 - Meta公司因Llama 4模型在基准测试中作弊及内部管理混乱、技术路线摇摆而陷入危机 导致其首席科学家杨立昆离职、FAIR团队被裁 公司正放弃长期坚持的开源战略 转而孤注一掷地开发名为“Avocado”的闭源模型 其2026年的AI命运将取决于此款模型能否成功 [1][2][3][4][21][22] Meta内部管理与技术路线问题 - Meta前首席科学家杨立昆证实 团队为优化Llama 4的基准测试结果 对不同评测使用了不同版本的模型 结果被篡改 [1][4] - 杨立昆离职源于与公司在大语言模型技术路线上存在根本分歧 他信奉世界模型 而公司则全力投入大语言模型 [4] - FAIR前技术总监田渊栋及其团队被裁 他指责Llama 4的研发是“外行领导内行” 并透露自己是在项目发布前2个月被临时拉来“救火” [2][8][14][15] - 田渊栋自嘲接手项目后 最终结果超出了他预想的四种可能 而是得到了“被裁掉”的第五种可能 [17] - 公司内部管理混乱 从Llama 3末期开始 高层过度强调“技术产品化” 急于将AI整合进各应用 导致研发资源严重向多模态和应用适配倾斜 忽视了底层推理能力 [13][15] - 公司曾研究思维链技术 但因FAIR与产品组缺乏良性互动及高层痴迷“技术产品化” 导致自研成果被埋没 错失先机 [15] 核心团队变动与战略转向 - 杨立昆已于2025年年底离职 [4] - 2025年7月 公司以约4年3亿美元的薪酬包与顶级资源挖来OpenAI研究员Jason Wei与Hyung Won Chung [19] - 公司以143亿美元收购Scale AI 49%的股权 并扶持其28岁的创始人Alexandr Wang成为Meta首席人工智能官 [19] - 扎克伯格亲手拆解了耗时十年建立的科研体系 裁撤旧体系并重金引入外部人才 [18][19][20] - 随着Llama 4溃败 公司基本宣告放弃长期开源战略 转向开发闭源模型“Avocado” [2][21] - 公司正从“理想主义开源先锋”向“务实闭源追随者”转型 在行业中的位置从引领者滑落为焦虑的追赶者 [21] Llama系列模型的兴衰与行业竞争 - Llama 2和Llama 3曾是该公司的骄傲 凭借开源策略在AI界受到尊重 Llama 3在多项指标上能与GPT-4竞争 [12][13] - Llama 4推出后表现不佳 社区开发者怀疑其宣称的性能靠“刷榜”取得 [17] - 外部竞争加剧 OpenAI推出基于思维链的o1模型 中国的DeepSeek以MOE架构横空出世 具备强悍推理能力与极低成本 打破了硅谷大厂的成本壁垒 [15] - 公司新模型“Avocado”放弃了纯粹自研路径 试图融合谷歌Gemma、OpenAI的技术亮点 并被曝使用阿里巴巴的通义千问进行优化 [2][21] 未来展望与风险 - 2026年春季Avocado的发布将是决定公司AI成败的关键 如果这款“博采众长”的闭源模型无法实现性能突破 公司可能在超级智能的竞赛中彻底掉队 [3][22] - 公司将AI命运几乎全部压在了拼凑而成的Avocado模型上 [3]
“短缺终将导致过剩”!a16z安德森2026年展望:AI芯片将迎来产能爆发与价格崩塌
硬AI· 2026-01-08 12:24
AI技术变革的宏观定位 - AI是比互联网更宏大的技术变革,其量级可与电力、微处理器和蒸汽机相提并论,目前仍处于“非常早期”阶段 [3][11][23] - 智能的单位成本正以远超摩尔定律的速度下降,形成“极度通缩”,这将推动需求的爆发性增长 [4][13][41] - 基础设施(如GPU、数据中心)的短缺将引发数千亿甚至数万亿美元的大规模建设,最终导致供应过剩,进一步压低AI成本 [2][5][13][41] 市场结构与竞争格局 - 未来AI行业结构将类似计算机产业:顶端是极少数类似超级计算机的“上帝级模型”,边缘侧将普及海量低成本的小模型 [6][19][48] - AI领域实质上是中美双雄争霸的局面,世界其他国家要么造不出来,要么不想造 [6][57] - 中国在AI领域的追赶速度惊人,例如DeepSeek的发布被形容为“超新星时刻”,其开源策略和芯片自研进展对全球竞争格局产生影响 [6][13][60] 商业模式与定价演进 - AI应用正从“按Token付费”向“基于价值定价”转移,初创公司在定价上比传统SaaS公司更具创造力 [7][17][38] - 高定价可能对客户有益,因为它能支撑更好的研发,使产品变得更好 [82] - 领先的AI应用公司(如Cursor)正在向后集成,构建自己的专用模型,而不仅仅是做大模型的“套壳” [7][17][97] 技术发展路径与扩散 - 大模型与小模型并非零和博弈,而是一个分工明确的“智力金字塔”,两者将共存 [19][48][89] - 开源模型(如中国的Kimi)正快速追赶闭源大模型的能力,并能以更低的成本在本地硬件上运行,加速了技术扩散 [46][86][87] - AI技术的民主化程度极高,全球最先进的文本、视频、音乐AI(如ChatGPT、Sora、Suno)已打破壁垒,任何人都能第一时间使用 [7][28] 行业动态与初创公司生态 - 新一代AI公司的营收增长和起飞速度是前所未有的,真实需求正快速转化为银行账户中的收入 [19][32] - 初创公司生态极其活跃,不仅有应用公司爆炸式增长,也出现了新的基础模型公司(如由Ilya Sutskever、Mira Murati创立的公司) [92][93] - 风险投资机构采取投资组合策略,同时押注大模型与小模型、专有与开源、基础模型与应用等多种看似矛盾的方向,以捕捉技术变革的机遇 [20][106][108] 地缘政治与监管环境 - 中美AI竞赛促使美国联邦层面的监管风向转变,两党都少有兴趣做任何可能阻碍美国战胜中国的事情,严苛监管风险已大幅降低 [14][64][65] - 监管焦点从联邦层面转移到各州(如加州的SB 1047法案),但存在监管割裂的风险,业界正推动由联邦政府主导监管 [65][68] - 欧盟的《AI法案》被视为过度监管,扼杀了本土AI发展,甚至导致苹果和Meta拒绝在欧洲发布最新功能,欧盟正试图进行修正 [8][69][70]
中国开源AI逆袭,美国围堵失效,半数美企为何集体倒戈?
搜狐财经· 2025-12-27 14:11
美国对中国AI的围堵与市场反应 - 美国通过高端芯片禁运和闭源模型技术壁垒试图限制中国AI发展[1][2] - 超过一半的美国初创企业将中国开源AI模型作为开发首选 市场风向发生反转[4] - 硅谷明星公司如AI独角兽Perplexity和Airbnb公开使用并依赖中国模型技术[4][6] 中国开源模型在美企及学术界的应用现状 - Perplexity的底层技术搭建在中国模型上 Airbnb的AI客服系统重度依赖阿里的Qwen模型[6] - 斯坦福大学使用Qwen作为基座进行推理模型研究 英伟达使用Qwen生成高质量合成数据训练自家AI[8] - DeepSeek GLM Kimi等中国开源模型在硅谷工程师中普及 成为办公室标配[6] 美国企业选择中国开源模型的核心原因 - 成本优势显著 有美国创业者从闭源模型切换至Qwen后 每年节省约40万美元的API调用费[10] - Dayflow测算显示 闭源模型人均年成本超1000美元 而中国开源模型近乎免费[12] - 开源模型提供控制权与数据安全 代码公开可自由修改 数据无需外传 避免了闭源模型如ChatGPT因规则调整导致系统瘫痪的风险[12][14] 中国开源模型的竞争力来源与发展路径 - 受美国高端GPU供应限制 中国团队被迫在算法上创新 致力于用更少算力获得更好效果 例如DeepSeek团队仅用560万美元就训练出高性能模型[18][20] - 中国模型发展出如MoE MLA等高效算法 实现了对算力极限的压榨 与美国企业烧钱拼参数的模式形成对比[20] - 中国开源模型正从工具转变为全球性基础设施 吸引全球百万级开发者进行二次开发 构建生态[22] 开源模式对技术竞争格局的影响 - 开源与闭源成为世界大模型竞赛的关键路线之争[24] - 中国通过将技术转化为全球共享的公共产品 以开源生态共建应对技术壁垒和闭源垄断[24] - 中国AI模型凭借成本低 效率高 更自由的市场竞争力 从可选工具转变为全球AI生态中的刚需基建[26][28]
金融大家评 | 中国农业银行董事长、党委书记 谷澍:提升AI应用普惠性的若干思考
清华金融评论· 2025-12-18 17:46
文章核心观点 - 金融业应主动融入国家“人工智能+”行动,通过平衡开源与闭源模型、协同决策式与生成式AI、优化算力供给与保障安全性等多维路径,提升人工智能应用的普惠性,推动技术与业务深度融合,最终提升金融服务质效和内部管理效能 [3][4][5][8][9] 开源模型与闭源模型 - 开源模型意味着技术平权和自主可控,通过分布式协同创新降低企业应用成本,提升AI普惠性,但存在模型迭代速度较慢、幻觉率较高的特点 [4] - 闭源模型在稳定性和可靠性上相对更高,同等参数规模下性能可能更优,服务支持更成熟,但自主定制化程度受限且模型透明度较低 [4] - 金融业应重点考虑“AI+”应用而非自建大模型,融合开源与闭源优势,围绕场景建设提升服务质效和管理效能 [4] - 以农业银行为例,采取“两条腿走路”策略:在普惠服务、办公等领域加快探索应用开源模型以提高普及率;同时通过本地化部署闭源模型,在客户服务、知识优化推荐等场景确保数据隐私和极致体验 [4] 决策式AI与生成式AI - 决策式AI擅长“确定性优化”,在强可解释性和准确性要求高的场景中仍是最优选择,目前金融业应用占比超过八成,主导风险评估、算法交易和欺诈检测等核心业务领域 [5] - 生成式AI擅长“可能性涌现”,在开放式和创意性场景中泛化能力更好,主要应用于智能客服、知识助手、报告撰写等非核心业务领域 [5] - 随着大模型能力增强、生态完善和算力突破,生成式AI应用可能实现指数级增长,并与决策式AI协同,形成以智能体为主的通用范式,二者边界趋于模糊 [5] - 多智能体配合的“双AI”编排协作模式能更好实现AI能力普惠化,例如在客户营销中,用决策式AI构建客户画像,用生成式AI形成个性化服务方案,提升服务精准性和获得感 [5] AI普惠与算力供给 - AI普惠性提升导致数据处理规模和复杂度指数级增长,数据中心计算量膨胀速度将远大于CPU处理效率进化速度,AI大规模应用意味着进入加速计算时代 [7] - GPU凭借强大并行计算能力能高效应对计算密集型任务,未来通用计算将退化为“控制平面”,高时效高计算负载场景由专用加速计算实现 [7] - AI加速普及过程中,GPU算力需求与供给将始终处于“紧平衡”状态,从绿色发展角度看这种平衡是必要的 [8] - 需从存量挖潜和增量扩容两端发力平衡矛盾:一方面通过算力灵活调度、参数合理匹配、模型压缩加速等工程化手段降低运行成本;另一方面加快建设支持AI高性能计算的智算中心 [8] - 以农业银行为例,依托“农银智+”平台构建参数多样、能力丰富的模型矩阵,通过模型蒸馏、微调等手段精细化匹配业务并充分利用GPU资源,同时建设支持多类型GPU组合的算力云平台,保障AI算力弹性、韧性和可持续供给 [8] 普惠性与安全性 - 提升AI应用普惠性同时必须高度重视安全性,需强化AI稳定性以保障大众利益,未来AI将成为数字世界“基础设施”,需建立模型安全护栏、主动防御等技术手段应对提示词注入、资源消耗攻击等风险,保障AI稳定运行和业务连续性 [9] - 需提升数据质量以增强模型可信度,在AI广泛应用背景下,数据来源更丰富、结构更复杂,数据倾斜、数据投毒等问题会加剧模型决策偏差,引发公众信任危机,需建立全生命周期模型评测和监控体系,加强算法公平性约束,提升模型稳定性和可解释性 [9] - 需避免模型共振以防范系统性风险,随着竞争加剧,市场主流大模型集中度会越来越高,商业银行依赖的模型算法逐步趋同,局部缺陷可能形成机构间模型共振并引发系统性风险,需加快构建更可靠知识体系,开展差异化模型训练,提升金融系统整体韧性 [9]
Meta再爆大瓜,气走杨立昆的Wang也受不了小扎了?
36氪· 2025-12-18 16:12
公司AI战略与重组 - 公司今年夏天开始投入重金打造“超级智能实验室”,并对内部AI团队进行多次重组,旨在加速AI发展 [1] - 经过半年四次重组,公司AI业务以“超级智能实验室”为核心,分为FAIR、MSL Infra基础设施、产品与应用、以及直接负责大语言模型的TBD Lab四个部门 [11] - TBD Lab是重组后的重中之重,由首席AI官Alexandr Wang直接领导,直接向首席执行官汇报,其现阶段核心目标是在明年一季度发布一个内部代号为“牛油果”的全新闭源AI模型 [1][2][11] 关键人物动态与管理挑战 - 公司以143亿美元收购数据标注公司Scale AI的49%股份,并聘请其28岁的创始人Alexandr Wang出任“首席AI官”,领导TBD Lab [2] - 包括Wang在内的多位关键高管对首席执行官的管理方式感到不满,Wang曾抱怨其微观管理令人窒息,而前GitHub负责人Nat Friedman也面临要求过快交付产品的巨大压力 [2][4] - 图灵奖得主、首席AI科学家杨立昆因需向Wang汇报以及路线分歧(反对闭源并质疑大语言模型路径),已于本月初官宣将于年底离职 [5][7] 人才与文化冲突 - 公司高薪从外部引进人才,但引发了与老员工的摩擦,有内部员工质疑Wang缺乏大公司管理经验且技术背景非顶级研究员,显得“德不配位” [7] - 高薪引进的人才留存也面临挑战,例如首席AI科学家赵晟佳曾考虑返回OpenAI,另有两位研究员在加入一个月内就离职返回OpenAI [7] - 公司正在抛弃早期强调“忠诚”的文化,激进引入外部管理者,导致“扎克伯格的朋友”等老派高层频频离职,如首席法律官和首席营收官近期相继离开 [8] 项目进展与财务压力 - 公司目前尚未拿出显著的AI成果,但正全力推进“牛油果”项目,计划使其在推出时达到Gemini 2.5的性能水平,并在夏季达到Gemini 3的水平 [1][11] - 公司2025年资本支出预计至少达700亿美元,远高于前一年的390亿美元,并已通过发行公司债券等方式筹资以支付数据中心和芯片成本 [12] - 公司宣布明年AI支出可能超过1000亿美元,但由于缺乏清晰的货币化路径,该消息导致股价下跌超过10%,市值蒸发超过2080亿美元 [12]
AI赛道竞争多维深化,生态应用格局加速演进
华金证券· 2025-12-12 16:18
报告行业投资评级 - 行业投资评级为“领先大市”,且评级为“维持” [4] 报告核心观点 - 核心观点认为AI赛道竞争正向多维度深化,生态应用格局正在加速演进 [2] - AI创作与推理应用已进入高速增长期,编程与角色扮演成为核心使用场景,中国开源模型崛起正带动多模态、端侧AI及智能体(Agent)等技术向产业化落地演进 [7] AI创作赛道市场表现 - 2025年11月,AI创作Web端产品总访问量超过2700万,总独立访客数超过770万 [7] - 头部产品优势明显,即梦AI和稿定AI的web端活跃用户超过百万 [7] - 部分产品增长迅猛,可灵AI的月活跃用户相比10月增长超50%,即梦AI新增下载量环比翻倍并重新突破千万,Canva可画、可灵AI等下载增速超100% [7] - 用户使用深度显著,多款产品平均使用时长达8分钟以上,其中Kuaizi平均访问时长近26分钟,度加创作工具达22.3分钟 [7] - 在AI视频生成细分赛道,共5款应用11月访问量超30万,包括即梦AI、可灵AI、Vidu AI等 [7] - APP端表现突出,美图秀秀平均日活跃用户近1800万,醒图、即梦AI分别超460万和超310万 [7] AI技术竞争与发展格局 - AI发展进入“大分流”阶段,竞争向多维度深化 [7] - 开源模型流量占比已达30%,成为特定场景的首要选择,其中中国开源模型占据全球开源模型流量近30% [7] - 推理优化模型主导,流量占比超50%,AI正从“生成文本”转向“思考问题” [7] - 主要使用场景为编程和角色扮演:编程类请求占比从2025年年初的11%飙升至50%以上;在开源领域,角色扮演占据开源模型流量的52% [7] - DeepSeek的流量中,超2/3为角色扮演和闲聊 [7] - 多模型生态格局逐渐清晰:闭源模型更多承担高价值、与收入强关联的工作负载;开源模型则更侧重于低成本、高并发的任务需求 [7] - 竞争已由单纯的技术竞赛转向关于场景适配、成本控制与生态构建的综合竞争 [7] AI应用扩展与技术趋势 - Agent(智能体)正在成为下一代AI范式,具备感知-规划-执行闭环能力,开发门槛因代码生成与框架支持而降低 [7] - 多模态融合逐步成熟,支持文本、图像、视频一体化生成,提升3D、视频等内容生产效率 [7] - 端侧AI生态快速发展,设备本地化部署兼顾低延迟与隐私保护 [7] - 整体趋势指向服务主动化、交互自然化与软硬件协同,推动AI从效率工具向智能伙伴演进 [7] - 中国正从AI领域的参与者向引领者转变:全球平台Hugging Face上,智源研究院和阿里巴巴的开源模型下载量分别达7.90亿次和7.49亿次 [7] - 应用层面,DeepSeek用户数已突破1亿,通义千问成为重要的开源基座模型 [7] 投资建议 - 建议关注蓝色光标、昆仑万维、天娱数科、因赛集团、视觉中国、汇量科技等公司 [7]
Meta上亿年薪的研究员们,却在偷师中国开源模型
观察者网· 2025-12-11 18:17
公司动态与战略调整 - Meta组建名为TBD Lab的新团队,其正在训练的“牛油果”(Avocado)模型使用了包括谷歌Gemma、OpenAI GPT-oss和阿里巴巴Qwen在内的多个第三方模型,该模型预计于明年春季首次亮相并可能作为闭源模型推出 [1] - 针对相关报道,Meta发言人回应称模型训练工作正按计划进行,时间表没有发生有意义的变更 [1] - 消息曝光后,阿里巴巴美股盘前一度上涨4%,收盘涨幅2.53% [1] - 因Llama 4表现不佳,Meta在最新一季度财报会上仅轻描淡写地提及Llama一次,该模型已不再是公司焦点 [5] - 扎克伯格随后对公司内部进行人事调整,拥有20年工龄的首席产品官Chris Cox在Llama 4翻车后被撤掉AI部门管理权限,部分Llama 4团队成员也被边缘化 [5] - 扎克伯格亲自挂帅开启AI“梦之队”招聘计划,从外部高薪挖来Scale AI创始人Alexandr Wang担任新的人工智能负责人,执掌全新的TBD实验室,并开出亿元薪酬大肆挖角同行 [5] - 公司更直接叫停了部分激进的元宇宙项目,以集中资源与OpenAI等竞争对手较量,对名为“牛油果”的新AI模型可谓孤注一掷 [6] - Alexandr Wang作为闭源模型的拥簇者,被认为是Meta新模型转向闭源的核心原因 [6] - 在Alexandr Wang领导下,Meta Superintelligence Lab在11月几乎毫无动作 [11] 行业竞争格局演变 - 过去两年,Meta通过开源Llama系列成功扮演了“反OpenAI联盟”的盟主,Llama一度被视为开源界的Linux,是全球开发者(包括中国开发者)的首选底座 [2] - 这一格局在2025年开始瓦解,随着年初DeepSeek开源模型的横空出世,以及后续阿里Qwen、月之暗面、智谱、Minimax等AI新势力纷纷发布高性能开源模型,Meta对开源生态的统治地位开始摇摇欲坠 [3] - 2025年4月,Meta发布的Llama 4性能未获开发者认可,且模型在LMArena的榜单排名被曝出存在“作弊嫌疑”,进一步饱受负面评价 [3] - 从性能角度看,无论是中国的“AI六小龙”还是阿里等互联网大厂,其最新的开源模型发布时均选择性能对标OpenAI、Google等头部闭源模型,Meta的Llama系列模型甚至已不配作为参照组来展示性能 [3] - 在下载和衍生模型数量上,阿里Qwen模型对Meta实现了赶超,2024年8月,千问的衍生模型数量第一次超过Llama,到了2025年10月,千问模型在全球下载量上也正式超过了Llama [4] - 这意味着Meta无论在数量还是质量上都失去了全球开源模型老大的地位 [4] - 华尔街投行KeyBanc资本市场的分析师在11月的报告中写道,在某种程度上,Meta的AI之路恰恰与Alphabet相反:年初被视为AI赢家,但现在投资回报和战略方向却成了最大的问号 [10] - 美国媒体CNBC在报道中表示,真正具有突破性的AI产品不会出现在小团队手中,而是出现在那些掌握完整生态体系的企业里 [10] - Meta今年成为了美国资本市场上最让人失望的AI股之一 [10] 市场反应与舆论评价 - 社交媒体上,网友们对Meta花上亿美元挖角的员工们选择使用Qwen开源模型进行了大量调侃,有网友直言“花了数十亿美元雇AI研究员,敢情就是为了抄作业?” [6][9] - 扎克伯格过去多次借鉴抖音、微信等中国产品功能,本次使用千问模型被视作一个巨大的“回旋镖” [10] - 扎克伯格在今年年初的播客中曾警告,如果不进行开源对抗,世界将被“反映中国价值观”的AI模型所主导,而他本人也多次在公开场合渲染“中国科技威胁论”,在国会听证会上曾是唯一一个对中国窃取技术问题表现出强硬攻击姿态的硅谷CEO [10] - Meta在打造下一代闭源模型时向Qwen“取经”,某种程度上宣告其亲自承认了Llama在开源领域的统治力已经被终结 [10] - 从开源盟主到闭源追随者,从“中国威胁论”到“偷师”中国同行,Meta的“牛油果”尚未发布就已经舆论缠身,这被视作是硅谷面对中国AI快速崛起时集体焦虑的一个缩影 [11]
Meta或转向闭源,小扎亲自带队,引入阿里Qwen模型训练
第一财经· 2025-12-11 09:46
公司动态与战略 - 扎克伯格组建了一个名为TBD Lab的新团队 [1] - TBD Lab团队在训练新模型“Avocado”时使用了多个第三方模型,包括谷歌的Gemma、OpenAI的GPT-oss和阿里巴巴的Qwen模型 [1] - 新模型“Avocado”预计将于明年春季首次亮相,并可能作为“闭源”模型推出 [1] 市场表现 - 阿里巴巴美股收盘上涨1.83%至158.82美元 [1]