Workflow
Qwen模型
icon
搜索文档
中国开源AI逆袭,美国围堵失效,半数美企为何集体倒戈?
搜狐财经· 2025-12-27 14:11
美国对中国AI的围堵与市场反应 - 美国通过高端芯片禁运和闭源模型技术壁垒试图限制中国AI发展[1][2] - 超过一半的美国初创企业将中国开源AI模型作为开发首选 市场风向发生反转[4] - 硅谷明星公司如AI独角兽Perplexity和Airbnb公开使用并依赖中国模型技术[4][6] 中国开源模型在美企及学术界的应用现状 - Perplexity的底层技术搭建在中国模型上 Airbnb的AI客服系统重度依赖阿里的Qwen模型[6] - 斯坦福大学使用Qwen作为基座进行推理模型研究 英伟达使用Qwen生成高质量合成数据训练自家AI[8] - DeepSeek GLM Kimi等中国开源模型在硅谷工程师中普及 成为办公室标配[6] 美国企业选择中国开源模型的核心原因 - 成本优势显著 有美国创业者从闭源模型切换至Qwen后 每年节省约40万美元的API调用费[10] - Dayflow测算显示 闭源模型人均年成本超1000美元 而中国开源模型近乎免费[12] - 开源模型提供控制权与数据安全 代码公开可自由修改 数据无需外传 避免了闭源模型如ChatGPT因规则调整导致系统瘫痪的风险[12][14] 中国开源模型的竞争力来源与发展路径 - 受美国高端GPU供应限制 中国团队被迫在算法上创新 致力于用更少算力获得更好效果 例如DeepSeek团队仅用560万美元就训练出高性能模型[18][20] - 中国模型发展出如MoE MLA等高效算法 实现了对算力极限的压榨 与美国企业烧钱拼参数的模式形成对比[20] - 中国开源模型正从工具转变为全球性基础设施 吸引全球百万级开发者进行二次开发 构建生态[22] 开源模式对技术竞争格局的影响 - 开源与闭源成为世界大模型竞赛的关键路线之争[24] - 中国通过将技术转化为全球共享的公共产品 以开源生态共建应对技术壁垒和闭源垄断[24] - 中国AI模型凭借成本低 效率高 更自由的市场竞争力 从可选工具转变为全球AI生态中的刚需基建[26][28]
微软或与Kimi合作上线Agent功能,阿里云Qwen下载量超7亿
36氪· 2025-12-18 17:54
微软与Kimi合作动态 - 微软Azure已于本月初接入Kimi的k2模型,双方合作有望进一步深入至应用层 [1] - 微软或将在本月与Kimi合作上线新的Agent功能,以应对本土厂商的激烈竞争 [1] - 该合作旨在利用AI的Agent能力,实现Office产品的自动化 [1] 阿里云与通义千问(Qwen)战略 - 阿里云是全球唯一一家积极研发先进AI模型并且全方位开源的云计算厂商 [1] - 阿里云在业界率先实现“全尺寸、全模态”的全面开源,其他三家头部云厂商未将模型规模开源 [1] - 通义千问Qwen衍生模型数量已突破18万,远超Meta的Llama系列模型 [2] - 通义千问Qwen在全球下载量超7亿,截至2025年10月,其下载量已超越Llama模型,成为全球第一AI开源模型 [2] - 阿里云的目标是让Qwen模型成为产业的默认依赖,通过开源策略建立行业标准 [2] 行业竞争格局与云厂商策略 - 阿里云作为市场份额较少的一方,选择全面开源被视为有魄力的战略,旨在牺牲短期利益以博取更多用户群体 [1] - AWS和微软缺少自研模型,两者已明显加速模型自研节奏,正处于关键的自我修正期 [2] - 头部云厂商面临的关键挑战是如何在保持平台中立与生态开放的同时,补齐模型层的确定性,并建立属于自己的第一梯队能力 [2]
中国AI再现全球级爆款,算力、应用呈两端协同跃升态势
新浪财经· 2025-12-12 22:13
中国AI大模型的全球崛起 - 阿里巴巴千问APP公测23天月活跃用户数突破3000万 首周下载量破1000万 刷新“增长最快AI应用”记录 [1] - 中国AI大模型在2025年完成蜕变 从全球竞争中的模仿跟随者转变为行业领先者与规则制定者 [1] - 知名报告将“中国AI体系”从“外围追赶者”提升为“平行竞争者” 并肯定其在开源AI和商业化部署方面设定节奏 [2] 中国大模型的全球市场拓展 - 中国大模型如Qwen、DeepSeek、Kimi、GLM等在全球市场攻城略地 市场份额显著提升 [2] - 新加坡国家人工智能计划放弃Meta模型 转向Qwen开源架构 美国Meta在研发新模型时采用Qwen进行蒸馏优化 [3] - 硅谷风投a16z与OpenRouter报告显示 中国开源模型全球市场份额从2024年底的1.2%飙升至2025年中的近30% [4] AI算力需求爆发与基础设施投资 - 中国大模型市场份额飙升直接导致算力需求爆发 亚太地区数据中心空置率处于历史低位的5.8% [4] - 阿里巴巴宣布投入3800亿元用于AI基础设施建设 并计划到2032年将云数据中心能耗规模扩大十倍 [4] - 联想集团作为服务器供应商受益 AI服务器收入在二季度同比激增155% 三季度保持高双位数增长 [5] 产业链协同与深度合作模式 - 联想集团服务器业务成功得益于与大模型厂商需求高度适配的定制化产品及与客户业务拓展的高度协同 [6] - 联想集团与阿里巴巴自2017年深入合作 其液冷方案部署于阿里多个“零碳”数据中心 并在多国云与AI基建中协同布局 [6] - 中国AI算力产业链形成正向循环 大模型全球拓展带动算力硬件商壮大 后者反过来促进大模型的全球征战 [6] 应用导向的发展策略与商业化成果 - 中国大模型采取“性能紧跟+应用差异化”策略 专注于赋能万物与服务实体经济 [7] - 阿里巴巴通过千问APP搭建体验入口 阿里云智能集团收入达398.24亿元 同比增长34% 证明AI投入的强劲回报 [7] - 应用端企业如联想集团通过接入Qwen等大模型 在个人、企业、城市智能领域实现领先落地 [8] 应用端企业的场景优势与市场表现 - 联想集团在C端拥有AIPC、AI手机等多终端布局 B端作为制造业龙头积累了丰富的场景应用经验与客户资源 [8] - 联想集团AI终端设备营收占IDG整体营收36% 在全球Windows AI PC市场份额达31.1% [9] - 联想集团企业超级智能体上线不到半年创收超18亿元 “双十一”期间贡献官网32%收入 方案服务业务同比增长22% [9] AI业务成为核心驱动力 - 联想集团最新财报显示 AI相关业务营收在总营收中占比提升至30% 同比提升13个百分点 [11] - 中国AI竞争力从模型端到应用端全面增强 将在全球市场扮演更重要角色 [11] - 兼具算力基础设施硬件、终端设备与场景落地多方面布局的企业 如联想集团 具备更大想象空间 [11]
Meta上亿年薪的研究员们,却在偷师中国开源模型
观察者网· 2025-12-11 18:17
公司动态与战略调整 - Meta组建名为TBD Lab的新团队,其正在训练的“牛油果”(Avocado)模型使用了包括谷歌Gemma、OpenAI GPT-oss和阿里巴巴Qwen在内的多个第三方模型,该模型预计于明年春季首次亮相并可能作为闭源模型推出 [1] - 针对相关报道,Meta发言人回应称模型训练工作正按计划进行,时间表没有发生有意义的变更 [1] - 消息曝光后,阿里巴巴美股盘前一度上涨4%,收盘涨幅2.53% [1] - 因Llama 4表现不佳,Meta在最新一季度财报会上仅轻描淡写地提及Llama一次,该模型已不再是公司焦点 [5] - 扎克伯格随后对公司内部进行人事调整,拥有20年工龄的首席产品官Chris Cox在Llama 4翻车后被撤掉AI部门管理权限,部分Llama 4团队成员也被边缘化 [5] - 扎克伯格亲自挂帅开启AI“梦之队”招聘计划,从外部高薪挖来Scale AI创始人Alexandr Wang担任新的人工智能负责人,执掌全新的TBD实验室,并开出亿元薪酬大肆挖角同行 [5] - 公司更直接叫停了部分激进的元宇宙项目,以集中资源与OpenAI等竞争对手较量,对名为“牛油果”的新AI模型可谓孤注一掷 [6] - Alexandr Wang作为闭源模型的拥簇者,被认为是Meta新模型转向闭源的核心原因 [6] - 在Alexandr Wang领导下,Meta Superintelligence Lab在11月几乎毫无动作 [11] 行业竞争格局演变 - 过去两年,Meta通过开源Llama系列成功扮演了“反OpenAI联盟”的盟主,Llama一度被视为开源界的Linux,是全球开发者(包括中国开发者)的首选底座 [2] - 这一格局在2025年开始瓦解,随着年初DeepSeek开源模型的横空出世,以及后续阿里Qwen、月之暗面、智谱、Minimax等AI新势力纷纷发布高性能开源模型,Meta对开源生态的统治地位开始摇摇欲坠 [3] - 2025年4月,Meta发布的Llama 4性能未获开发者认可,且模型在LMArena的榜单排名被曝出存在“作弊嫌疑”,进一步饱受负面评价 [3] - 从性能角度看,无论是中国的“AI六小龙”还是阿里等互联网大厂,其最新的开源模型发布时均选择性能对标OpenAI、Google等头部闭源模型,Meta的Llama系列模型甚至已不配作为参照组来展示性能 [3] - 在下载和衍生模型数量上,阿里Qwen模型对Meta实现了赶超,2024年8月,千问的衍生模型数量第一次超过Llama,到了2025年10月,千问模型在全球下载量上也正式超过了Llama [4] - 这意味着Meta无论在数量还是质量上都失去了全球开源模型老大的地位 [4] - 华尔街投行KeyBanc资本市场的分析师在11月的报告中写道,在某种程度上,Meta的AI之路恰恰与Alphabet相反:年初被视为AI赢家,但现在投资回报和战略方向却成了最大的问号 [10] - 美国媒体CNBC在报道中表示,真正具有突破性的AI产品不会出现在小团队手中,而是出现在那些掌握完整生态体系的企业里 [10] - Meta今年成为了美国资本市场上最让人失望的AI股之一 [10] 市场反应与舆论评价 - 社交媒体上,网友们对Meta花上亿美元挖角的员工们选择使用Qwen开源模型进行了大量调侃,有网友直言“花了数十亿美元雇AI研究员,敢情就是为了抄作业?” [6][9] - 扎克伯格过去多次借鉴抖音、微信等中国产品功能,本次使用千问模型被视作一个巨大的“回旋镖” [10] - 扎克伯格在今年年初的播客中曾警告,如果不进行开源对抗,世界将被“反映中国价值观”的AI模型所主导,而他本人也多次在公开场合渲染“中国科技威胁论”,在国会听证会上曾是唯一一个对中国窃取技术问题表现出强硬攻击姿态的硅谷CEO [10] - Meta在打造下一代闭源模型时向Qwen“取经”,某种程度上宣告其亲自承认了Llama在开源领域的统治力已经被终结 [10] - 从开源盟主到闭源追随者,从“中国威胁论”到“偷师”中国同行,Meta的“牛油果”尚未发布就已经舆论缠身,这被视作是硅谷面对中国AI快速崛起时集体焦虑的一个缩影 [11]
硅谷风向变了?Meta被指用阿里千问模型蒸馏优化,扎克伯格或转战闭源
凤凰网· 2025-12-11 11:09
Meta的AI模型研发与技术路径 - 美国科技巨头Meta在研发代号为"牛油果"的全新AI模型时 采用了阿里巴巴开源的Qwen模型进行蒸馏优化 [1] - 这一技术路径的选择 正值马克·扎克伯格在硅谷重金组建顶尖团队 试图扭转此前大模型研发颓势的关键时期 [1] 行业技术格局与模式猜测 - Meta作为曾经的开源领军者 此番借力Qwen模型 侧面印证了中国开源大模型在技术底层已具备比肩甚至反哺硅谷巨头的实力 成为行业重要的参考坐标 [1] - 这也引发了业界对于Meta可能放弃纯开源路线 转而寻求闭源盈利模式的广泛猜测 [1] 阿里巴巴AI应用的市场表现 - 阿里在C端市场的应用落地呈现出爆发态势 自11月17日启动公测以来 通义千问App在短短23天内 全端月活跃用户数已突破3000万 [1] - 这一数据刷新了同类产品的增长纪录 表明国产大模型正在加速完成从技术积累到用户规模化普及的跨越 [1]
Meta或转向闭源,小扎亲自带队,引入阿里Qwen模型训练
第一财经· 2025-12-11 09:46
公司动态与战略 - 扎克伯格组建了一个名为TBD Lab的新团队 [1] - TBD Lab团队在训练新模型“Avocado”时使用了多个第三方模型,包括谷歌的Gemma、OpenAI的GPT-oss和阿里巴巴的Qwen模型 [1] - 新模型“Avocado”预计将于明年春季首次亮相,并可能作为“闭源”模型推出 [1] 市场表现 - 阿里巴巴美股收盘上涨1.83%至158.82美元 [1]
Meta或转向闭源!小扎亲自带队,引入阿里Qwen模型训练
第一财经资讯· 2025-12-11 09:17
公司动态 - 扎克伯格组建了一个名为TBD Lab的新团队 [1] - TBD Lab团队在训练新模型"Avocado"时使用了多个第三方模型,包括谷歌的Gemma、OpenAI的GPT-oss和阿里巴巴的Qwen模型 [1] - 新模型"Avocado"预计将于明年春季首次亮相 [1] - "Avocado"模型可能作为"闭源"模型推出 [1] 市场反应 - 阿里巴巴美股收盘上涨1.83%至158.82美元 [1]
Meta或转向闭源!小扎亲自带队,引入阿里Qwen模型训练
第一财经· 2025-12-11 09:11
Meta新AI团队与模型进展 - Meta首席执行官扎克伯格组建了一个名为TBD Lab的新团队 [1] - 该团队在训练新模型“Avocado”时使用了多个第三方模型,包括谷歌的Gemma、OpenAI的GPT-oss和阿里巴巴的Qwen模型 [1] - 新模型“Avocado”预计将于明年春季首次亮相,并可能作为“闭源”模型推出 [1] 阿里巴巴市场表现 - 阿里巴巴美股收盘上涨1.83%,股价达到158.82美元 [2]
这是2025年度AI十大趋势,4个维度10大结论,“开源AI进入中国时间”
搜狐财经· 2025-12-10 23:20
文章核心观点 - 报告指出,2025年AI正从“工具时代”迈向“伙伴时代”,其发展将深刻重塑经济结构、社会形态和人类生活方式 [3] - 中国AI正从“参与者”转向“领导者”,在开源生态、芯片自主、AGI路径等基础层面加速布局,展现出从“跟跑”到“并跑”乃至“领跑”的体系化能力 [28][31] 算力与芯片 - 算力已成为影响国家和企业战略的关键资源,算力经济是智能产业第一大引擎,全球AI算力需求推动超大规模数据中心建设进入算力工厂时代 [5][6] - “东数西算”、“太空超级计算机”等国家工程正系统构建高效、绿色的全国一体化算力网络 [6] - 芯片层面,GPU主导地位受到挑战,NPU在端侧普及,ASIC/FPGA迎来增长 [8] - 中国正加速构建自主可控的算力生态,国产“芯片+SDK+框架”方案已在千亿级模型训练中得到验证,DeepSeek等模型针对昇腾芯片深度优化,标志着全栈国产化能力迈入新阶段 [11] 大模型技术与架构 - 预训练决定大模型格局梯队,架构创新决定预训练水平 [5] - 混合专家模型成为主流选择,其“大参数、小激活”的设计让模型可在不显著增加成本的情况下扩充容量,中国头部模型团队正普遍采用这一思路 [13] - 为突破Transformer的O(n²)复杂度瓶颈,线性注意力和稀疏注意力等新架构快速发展,让模型能够更高效地处理长文本、视频理解等需要长程依赖的任务 [13] - 2025年,大模型落地进入“推理时间”,模型在多模态深度推理、自适应推理、边缘推理加速等方面持续突破,任务复杂度推动推理框架持续进化 [15] 应用与交互范式 - 信息AI处于应用期,物理AI处于研发期,具身智能成合流风口 [5][17] - 世界模型与VLA(视觉-语言-动作)框架成为技术焦点,具身智能正从小规模商业订单走向更广泛的应用探索 [17] - 自变量机器人自主研发的“Great Wall”模型系列已实现从感知到高精度操作的端到端控制,在复杂任务中展现出了强大的泛化能力 [20] - AI正在重塑流量入口,从PC互联网、移动互联网迈向Agentic互联网,AI智能体具备感知、规划、决策、执行的闭环能力,正逐步取代传统App,操作系统亦向超级Agent演进 [5][20] - 构建智能助手的关键在于对用户个性化知识的理解与调用,例如腾讯的ima知识库允许用户构建专属知识库并与大模型深度结合,实现“知识即能力”的模式 [22] 多模态与硬件 - 多模态成为AI应用落地关键,视频、3D、代码依次展现生产力,新一代AI系统能够同时处理和理解文本、图像、声音、视频等多种信息类型,实现跨模态的关联理解和生成 [5][22] - 报告预测,未来2-3年内,随着技术能力成熟,AI会成为相关产业的标准工具 [22] - AI硬件百端齐放,轻量化模型和边缘计算技术成熟,推动AI能力向手机、汽车、IoT设备等终端普及,端侧AI解决了数据隐私、网络延迟和成本效率三大核心问题 [5][22] 科研与开源生态 - AI正从科研工具升级为科研主体,开启自主科学发现新范式,在材料、化学、生物、医疗等领域,AI的复杂问题解决能力已触及博士水平 [5][25] - 腾讯与广州呼吸健康研究院联合开发的DeepGEM病理大模型,仅通过常规病理切片图像即可在1分钟内高精度预测肺癌基因突变,将检测成本降低数倍 [27] - 开源AI进入中国时间,DeepSeek、Qwen等开源模型在全球社区影响力迅速提升,下载量位居前列 [5][28] - 在AGI领域,中国正通过开源生态、自主芯片、国家算力网络与产学研协同,走出一条独特的“中国路线” [30]
a16z 100万亿Token研究揭示的真相:中国力量重塑全球AI版图
36氪· 2025-12-08 16:33
报告核心观点 - 基于超过100万亿个真实生产环境Token数据的实证研究,揭示了AI领域正经历三大根本性转变:从单一模型竞争走向多元化生态系统;从简单文本生成迈向智能体推理范式;从西方中心向全球分布式创新格局演进 [3] 行业范式转变:从文本预测到机器思考 - 2024年12月5日OpenAI发布o1模型,标志着AI从“模式补全”转向“结构化内部认知”的关键转折点,该模型引入了扩展的推理时计算过程,包含内部多步思考、潜在规划和迭代优化 [6] - 推理优化模型所处理的Token量已从近乎零增长至占总量的50%以上,意味着半数以上的AI交互不再是简单问答,而是涉及多步思考、状态管理和工具调用的复杂过程 [4][18] - 交互序列长度显著增加,平均输入Token数从约1,500增长到超过6,000,输出Token数也从150左右增加到约400,反映了用户正在将更复杂的上下文交给AI处理 [20] 市场格局重塑:开源崛起与多元化竞争 - 开源模型使用量显著上升,打破了少数闭源巨头主导的市场格局,其中中国开源力量崛起尤为引人注目,其周使用量占比从2024年底的1.2%跃升至2025年后期某些周度的近30% [4][7][9] - 截至2025年底,开源模型市场呈现健康的多元化态势,没有任何单一开源模型能持续占据超过25%的市场份额,流量均匀分布在五到七个主要竞争者之间 [11] - 中型模型(参数规模在150亿至700亿之间)崛起,在能力与效率之间取得了更好的平衡,满足了大量实际应用场景的需求 [12] 主要参与者与市场份额 - 根据2024年11月至2025年11月的总Token使用量,DeepSeek以14.37万亿Token位居榜首,其次是Qwen(5.59万亿)、Meta LLaMA(3.96万亿)、Mistral AI(2.92万亿)和OpenAI(1.65万亿) [12] - 中国模型提供商如Minimax(1.26万亿)、Z-AI(1.18万亿)、Moonshot AI(0.92万亿)也进入了前十名,显示出中国在全球AI版图中的重要地位 [12] 应用场景分化:从生产力到情感陪伴 - 超过一半(约52%)的开源模型使用量流向了角色扮演、故事创作等创意对话场景,这一比例甚至超过了编程辅助,揭示了AI作为情感伙伴与创作引擎的巨大需求 [4][15] - 编程相关的查询量在2025年实现了稳定增长,从年初占总Token量的约11%攀升至年底的超过50%,成为推动输入Token增长的主要动力 [4][17][20] - 编程相关的提示平均长度是其他类别的3-4倍,且增长速率更快,表明软件开发者正以激进的方式探索AI能力的边界 [20] 全球化与区域市场动态 - 亚洲在全球AI使用量中的份额已从约13%显著提升至31%,反映了该区域企业采纳AI技术的加速和本地创新生态的成熟 [23] - 按大洲划分,北美以47.22%的份额领先,亚洲(28.61%)和欧洲(21.32%)紧随其后 [24] - 按国家/地区划分,美国以47.17%的份额占据绝对主导,新加坡(9.21%)、德国(7.51%)、中国(6.01%)位列其后 [24] - 从语言分布看,英语仍占据主导地位(82.87%的Token使用),但中文(简体)以4.95%的占比成为第二大使用语言 [25] 定价策略与市场分层 - 高端市场由Anthropic的Claude系列和OpenAI的GPT系列等闭源模型主导,其每百万Token成本在2美元(Claude)至35美元(GPT-4/5)之间,但在关键业务场景中用户对性能和质量的要求超过对成本的敏感 [29] - 大众市场以Google Gemini Flash、DeepSeek V3等高效模型为代表,以低于0.4美元每百万Token的成本吸引了海量日常使用 [29] - 市场呈现出复杂的价值分层,而非简单的成本驱动,研究显示价格弹性较弱,降价10%仅能带来0.5-0.7%的使用量增加 [29] - “技术”类查询的平均成本显著高于其他所有类别,但使用量依然保持高位,反映了高复杂性、高价值任务的特殊需求 [32] 用户行为与留存模式 - 报告提出“灰姑娘水晶鞋”理论,即当新模型恰好满足一类长期存在的高价值工作负载需求时,会形成“完美契合”,产生强大的用户锁定效应 [33][34] - 数据支持该理论,例如Claude 4 Sonnet在2025年5月的用户群体,在五个月后依然保持了约40%的留存率,显著高于后续用户群体 [34] - DeepSeek模型展现出“回旋镖效应”,部分用户在尝试其他模型后,会重新回归DeepSeek,暗示其在某些特定能力维度上建立了难以替代的优势 [4][35] 未来竞争焦点 - 行业竞争焦点正从对单一“最佳模型”的追逐,转向构建灵活、多样、适应性强的模型生态系统 [36] - 未来竞争将进一步转向运营卓越性,包括精确衡量真实场景下的任务完成率、降低模型性能波动、使AI行为更好对齐生产环境实际需求等 [36] - 开源模型的持续进步正在对闭源市场构成“底线压力”,推动整个行业的技术进步和成本优化 [32]