Workflow
Qwen系列
icon
搜索文档
2026 AI 大模型技术体系综合开源影响力榜单发布,中国开源实力领跑全球
AI科技大本营· 2026-04-18 18:35
全球AI产业进入新阶段 - 2026年,全球AI产业告别“百模大战”与参数竞赛,进入多模态融合、具身智能爆发、开源生态主导的新阶段,技术红利从“训练”转向“应用” [1] - 大模型市场的竞争焦点转向开源生态的完整性与影响力,这成为决定能否“行稳致远”的关键 [1] - 开源趋势从仅开放模型权重,扩展到数据集、论文、工具链、应用方案、评测体系等全栈技术体系开放,模型价值在于让开发者“用得起、用得好、用得顺” [1] 2026大模型技术体系综合开源影响力榜单 - 榜单由CSDN联合多家机构在2026奇点智能技术大会上发布,旨在为产业选型、技术迭代与生态共建提供权威参考坐标 [2] - 评估逻辑跳出“唯模型、唯性能”传统,以数据、模型、评测、系统四大维度、53项细分指标为标尺 [2] - 数据来源于全球17个开源平台、13541条公开数据链路,统计截止至2026年4月9日 [2][5] - 评估方法论及部分数据集已在GitHub和GitCode上开源,并计划推动其成为行业乃至全球标准 [7] 模型分榜:阿里巴巴登顶,中国整体实力超越美国 - 模型分榜从模态覆盖、下载量、社区热度、硬件适配等维度综合评估 [8] - 阿里巴巴以46个模型、覆盖5种模态的成绩在模型下载量TOP100机构中占据绝对领先地位,位居分榜第一 [9] - 2026年3月下载量占比显示,向量模型以38.4%高居首位,其次是语言模型(31.0%)和多模态模型(17.1%),印证了RAG等技术的规模化应用 [9] - 华东师范大学教授王伟表示,在多模态赛道,阿里巴巴Qwen系列已超越OpenAI,从整体看,中国在模型开源上的实力已经超过美国 [11] 1. 向量模型下载量榜首为UKP Lab的all-MiniLM-L6-v2模型,月下载量高达2.02亿次 [12] 2. 语言模型下载量榜首为阿里巴巴的Qwen2.5-7B-Instruct,下载量达2338万次 [12] 3. 多模态模型下载量榜首为OpenAI的clip-vit-base-patch32,下载量为1914万次 [12] - 除了商业机构,北京智源人工智能研究院、上海人工智能实验室、清华大学等非营利性组织也构成了中国开源生态的重要力量 [9] 数据分榜:中立机构领跑,数据加速向多模态升级 - 数据分榜重点评估数据集数量、模态多样性、行业覆盖与工具配套 [11] - 北京智源人工智能研究院以518个开源数据集位居数据分榜首位,其中多模态数据集195个、具身数据集199个 [13] - 上海人工智能实验室(241个)和Google(205个)分列数据开源数量二、三位 [13] - 数据开源呈现明显特征:非营利、中立科研机构更愿意开放数据集,企业则更多将数据视为核心竞争力 [13] - 数据正从语言主导,加速向多模态、具身智能方向升级 [13] 系统分榜:国产全栈工具链崛起,底层基建成胜负手 - 系统分榜涵盖并行训练框架、算子库、通信库、AI编译器、深度学习框架5项子指标,是大模型落地的关键底座 [14] - 目前,Google、百度、智源研究院、华为、微软、OpenAI、阿里巴巴共7家机构覆盖了其中4项指标 [16] - 系统开放程度的核心在于对AI全栈尤其是不同硬件的支撑能力 [19] - 北京智源人工智能研究院以500个高性能通用算子数量位居算子库首位,并在通信库和AI编译器上优势显著 [19] 评测平台分榜:标准日趋完善,降低验证成本 - 开源评测工具与数据集让开发者可直接复现、优化模型 [20] - 上海人工智能实验室的开源评测数据集从2025年1月的19个增长到34个,保持领先 [20] - 北京智源人工智能研究院的评测数据集从3个激增至16个,增速显著 [20] - 头部机构纷纷开放自研评测工具与数据集,大幅降低了行业验证成本 [20] 综合榜单与核心趋势 - 综合四大维度加权计算,阿里巴巴、北京智源人工智能研究院、上海人工智能实验室3家中国机构进入TOP5 [23] - 榜单呈现三大核心趋势:中国力量全面领跑;全栈开源成为标配(数据、系统、评测协同开放);社区共建成为主流(评估方法开源、标准共建) [23] - 大模型技术体系的竞争已进入涵盖数据、模型、系统、评测的全栈生态竞争阶段,开源、开放、共建成为推动AI普惠与创新的核心动力 [23]
互联网电商25Q4业绩总结及26年展望:AI深度赋能电商,线上消费迎拐点
申万宏源证券· 2026-04-09 22:47
报告行业投资评级 - 看好互联网电商行业 [2] 报告核心观点 - 线上消费呈现底部反转迹象,宏观数据验证需求韧性,全年展望积极 [3][85] - AI产业由模型能力竞争转向应用落地竞争,下游需求爆发驱动商业化加速,为头部厂商带来成长空间 [3][25][85] - 即时零售行业竞争格局趋稳,补贴强度边际缩窄,平台战略转向效率优化和UE修复,有望带动相关平台利润超预期修复 [3][38][85] - 25Q4电商平台主业增速受高基数和竞争扰动承压,但云业务继续环比加速,平台利润走势因策略和投放节奏分化,26年预期向上修复弹性充足 [3][48][68] 根据相关目录分别总结 1. 线上消费强劲复苏,AI需求扩张加速商业化变现 - **线上消费增速转暖,渗透率提升**:26年1-2月,全国网上零售额实现3.25万亿元,同比增长9.2%,实物商品网上零售额同比增长10.3%达2.08万亿元,渗透率同比提升1.93个百分点至24.2% [9] - **快递业务量增速低于线上零售额增速**:26年1-2月快递业务量同比增长7.1%,低于同期实物商品网上零售额增速约3.2个百分点,反映线上消费对快递业务的拉动边际减弱 [9] - **商品零售和餐饮增速边际回暖**:26年1-2月商品零售和餐饮增速分别为2.5%和4.8%,较25年下半年有所回升,服务零售增速达5.6% [14] - **平台GMV增速预计见底反弹**:25Q4各大平台GMV增速受高基数等因素影响显著放缓,但26年开年宏观数据表现强劲,全年平台GMV增速指引乐观 [19] - **春节与38大促延续消费热度**:各平台大促玩法呈现节奏拉长、规则简化、平台分化特征,淘天侧重生态协同与AI赋能,京东突出低价直降与补贴,抖音强化流量与内容协同 [22][24] - **AI下游需求爆发,市场高速增长**:中国AI大模型市场规模预计从2025年的约495.39亿元增长至2026年突破700亿元,年复合增长率达88.9% [25] - **互联网大厂AI迭代与竞争重心转移**:头部厂商竞争重心转向场景渗透、生态协同与商业化落地,阿里整合ATH事业群,字节发布豆包2.0等模型,腾讯混元与元宝加速渗透,美团深化本地生活AI应用 [28][29] - **春节营销催化AI应用用户规模快速放大**:春节期间,千问DAU峰值达7352万,MAU突破3亿;豆包DAU峰值达1.45亿;元宝MAU达1.09亿,DAU超4000万 [32][33] - **AI产业链商业化加速,价格普遍上调**:26Q1各平台纷纷上调大模型与云基础设施相关定价,反映Token消耗、Agent调用复杂度与算力需求同步上行,行业从以价换量转向能力与质量竞争 [34][37] 2. 平台业绩短期承压,新业务投入克制下利润修复预期上行 - **25Q4平台营收增速维持低位**:25Q4全国网上零售额同比增长1.3%,线上消费显著下滑,阿里/京东/拼多多/美团营收同比增速分别为1.7%/1.5%/12.0%/4.1% [48] - **核心主业收入增速承压**:25Q4阿里客户管理收入(CMR)/京东零售/拼多多广告/拼多多佣金/美团核心本地商业收入增速分别为0.8%/-1.7%/5.3%/19.2%/-1.1% [3][52] - **阿里云业务增速进一步加快**:25Q4阿里云智能集团收入同比增长36.0%至433亿元,AI相关产品收入连续十个季度实现三位数同比增长 [56] - **阿里持续加大AI领域资本投入**:25Q4阿里资本支出(Capex)达290亿元,高于同期腾讯的196亿元,投入聚焦AI算力集群升级与模型训练 [57][61] - **海外电商业务稳步推进**:拼多多Temu在政策扰动下保持韧性,25Q4交易服务收入同比增长19.2%至639亿元;阿里国际数字商业集团经调整EBITA亏损同比大幅收窄至20.2亿元 [63][68] - **平台现金储备走势分化**:截至25Q4,阿里/京东/美团/拼多多现金储备分别约为3081亿/2132亿/1668亿/行业前列,拼多多是唯一储备增加的公司 [64][68] - **25Q4平台盈利表现分化**:阿里巴巴/京东/美团/拼多多净利润分别为167.1/10.8/-150.8/263.0亿元,同比变化-67.3%/-90.4%/-253.1%/-12.0% [68] - **核心业务盈利能力分化**:25Q4阿里中国电商集团经调整EBITA同比下滑43.3%至346.13亿元;京东零售经营利润同比小幅下降2.46%至97.89亿元;拼多多经营利润同比增长8.3%至277.20亿元;美团核心本地商业经营利润转亏至-100.46亿元 [74][75][76][77] - **新业务亏损情况各异**:25Q4阿里、美团非核心业务亏损环比扩大,京东新业务经营亏损环比收窄9亿元至148亿元 [81][86] - **营销投放力度维持高位**:25Q4阿里/京东/拼多多/美团营销费用率分别为25.3%/7.2%/27.7%/34.4%,同比分别增加10.0/2.4/-0.6/14.9个百分点 [84][87] 3. 投资分析意见 - **推荐标的**:报告推荐阿里巴巴、美团、拼多多、京东 [3][88]
蚂蚁阿福,为啥不是王小川最先做出来?
搜狐财经· 2026-02-26 13:57
文章核心观点 - 文章探讨了在通用人工智能(AGI)能力快速演进的背景下,垂直领域AI创业公司面临的挑战,并以百川智能在医疗AI赛道与蚂蚁集团(蚂蚁阿福)的竞争为例,论证了强大的通用基座模型能力是决定垂直应用成败的关键,而仅依赖垂直行业数据和场景的“护城河”策略可能失效 [2][3][20] 行业竞争格局与关键参与者 - 百川智能自创立之初就专注于医疗赛道,试图利用其从搜狗时代延续的医疗搜索基因和行业数据构建护城河 [2] - 蚂蚁集团旗下的“蚂蚁阿福”背靠支付宝和阿里云生态,以金融级精准要求切入医疗应用市场,并凭借其基座模型优势实现了快速突破 [3][11] - 通用基座模型的头部竞争者包括阿里的Qwen系列、DeepSeek、ChatGPT、Gemini等,它们构成了行业的技术天花板 [9] 技术能力分析:基座模型的决定性作用 - 基座模型的能力被比作学生的“基础智商”和“逻辑下限”,决定了垂直应用的上限 [6] - 蚂蚁阿福的成功源于其背后强大的基座模型(如Qwen系列和蚂蚁百灵模型),其强大的逻辑推理和理解能力对专业文本的处理形成了“智力层面的跨代屠杀” [7] - 数据本身不是护城河,处理数据的“消化器官”(即基座模型能力)才是关键,若基座能力不足,海量垂直数据也无法产出高质量应用 [8] - 基座能力处于第二梯队的创企,其应用在对话体验、响应速度和准确率上难以给用户带来“惊艳感” [9] 产品与商业模式差异 - 蚂蚁阿福的优势在于深度嵌入支付宝的“国民级”入口和完整的医疗生态闭环,能够实现从对话到挂号、支付、报告解读等服务的“最后一公里”,即“模型即服务(MaaS)” [13] - 百川智能则被描述为拥有技术(绝世好剑)但需寻找落地场景的探索者,缺乏现成的生态闭环 [12] - 金融行业对“合规”和“精准”的“零容忍”要求,使得蚂蚁在转向医疗时,其产品对准确性的追求成为天然优势 [10][11] 资源与生态竞争 - 大模型研发是烧钱的军备竞赛,蚂蚁背靠阿里云的整建制支持,其算力成本和研发投入可能是创企的数十倍 [14] - 阿里系的“生态溢出”效应意味着,只要将通用模型能力稍向医疗倾斜,其产生的动能就可能覆盖垂直创企数年的深耕成果 [14] 对垂直AI创业的启示与趋势判断 - 缺乏顶级基座支撑的垂直深耕可能变成资金和精力的“焚化炉”,当通用基座的逻辑能力跨过临界点,其对垂直赛道的侵蚀将是全覆盖式的 [15] - 创企的破局思路可能在于:从迷信“垂直数据”堆砌转向追求“算法效率”和模型架构创新(如效仿DeepSeek),或者彻底拥抱顶尖开源基座,专注于场景精调和业务闭环 [16] - 未来优秀的医疗AI产品需要两个硬性指标:极强的逻辑引擎(能进行多步推理)和极深的场景嵌入(接管挂号、支付、随访等全流程) [17][18][19] - 大模型竞争是一场智力长跑,所有的行业应用、场景积淀和数据护城河都必须建立在稳固的基座之上,基座不稳,一切应用皆为泡沫 [20] - 蚂蚁阿福的成功本质上是通用人工智能(AGI)能力向垂直行业渗透的体现,未来的AI将不再严格区分行业,顶级通用大脑会自然渗透进每个领域 [21] - 文章警示,留给垂直领域创企的时间已经不多了 [22]
中国模型差距美国7个月
是说芯语· 2026-01-10 14:45
中美AI模型能力差距 - 研究机构Epoch AI报告显示,中国AI模型平均落后美国7个月,最小差距4个月,最大差距14个月 [1] - 从2024年开始,中国大模型的追赶步伐显著提速,从2023年的12-14个月的差距收敛至约6-8个月 [3] - 其中DeepSeek-V2和DeepSeek-R1的发布都形成了阶跃式的追赶 [3] 模型能力评估与竞争格局 - 评估指标ECI综合考虑了模型在数学推理、代码编写、语言理解等多个领域的表现,整合了全球数十个主流AI基准测试表现,数值越高代表模型综合能力越强 [3] - 美国的AI进程没有丝毫放松,仍然在引领最前沿的模型进展 [3] - 中美大模型的激烈竞争,几乎是开闭源模型之间的竞争 [6] - 美国目前最前沿的模型,如GPT-5、Gemini 3、Claude 4都是闭源模型 [6] - 中国的DeepSeek系列、Qwen系列都选择不同程度开放权重 [7] - 竞争格局是美国的闭源模型持续定义高度,而中国厂商通过“开源换生态”的策略实现加速迭代,在争取全球开发者和企业用户上形成极大竞争力 [7] 算力资源分布 - 全球算力版图失衡,美国控制着全球约75%的顶级GPU集群性能,而位居第二的中国占比为15% [3] 技术发展趋势与挑战 - 在经历了参数规模暴力增长、推理模式引入、算法架构优化之后,当下大模型性能的提升似乎在迫近天花板 [7] - 最近半年,除了Gemini 3,其他大多数模型的迭代都难言“惊叹” [7] - 许多人断言Scaling Law将死,接下来将回归“研究”时代 [7] - 谁能率先在下一个颠覆性范式中取得进展,谁就将定义新的大模型前沿 [7]
从开源最强到挑战全球最强:DeepSeek新模型给出了解法
观察者网· 2025-12-02 19:38
模型发布核心信息 - 12月1日,公司发布两个正式版模型:面向日常使用的DeepSeek-V3.2和面向极致探索的DeepSeek-V3.2-Speciale [1] - DeepSeek-V3.2是9月底实验版V3.2-Exp的正式版,平衡推理能力与输出长度,适合问答场景并强化了Agent能力,官方网页端、App和API均已更新 [1][4] - Speciale版本是V3.2的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力,目标是将开源模型推理能力推向极致,目前仅以临时API服务形式开放 [1] 模型性能表现 - 在公开推理测试中,V3.2已达到GPT-5水平,仅略低于Google Gemini 3 Pro,相比Kimi-K2-Thinking输出长度大幅降低,减少计算开销与用户等待时间 [6] - Speciale在多个推理基准测试中超越Gemini 3 Pro,包括美国数学邀请赛(96.0分)、哈佛MIT数学竞赛(99.2分)和IMO(84.5分) [7] - 在编程与理工科博士生测试中,Speciale仍略逊于Google顶级模型,如LiveCodeBench(88.7分)和GPQA Diamond(85.7分)低于Gemini 3 Pro的90.7分和91.9分 [7] 技术架构创新 - 公司设计了DSA(DeepSeek稀疏注意力)机制应对长文本计算量爆炸,该机制像图书管理员通过“闪电索引器”只检索关键信息,大幅降低计算复杂度 [8] - V3.2的核心亮点是“Thinking in Tool-Use”(思考型工具调用),这是AI Agent领域的“Interleaved Thinking”(交错思维链)技术的重要背书 [8][9] - 该技术将冗长、重度依赖工具的任务转化为稳定的“计划→行动→反思”循环,通过复用假设与部分结论减少多轮任务中的“状态漂移”与重复性错误 [9] 战略方向与行业定位 - 公司将“Agent能力”提升到与“推理能力”同等重要的战略位置,试图通过Agent能力将模型从“聊天机器人”进化为真正的“数字劳动力” [13] - 从经济维度看,企业真正愿意付费的是“降本增效的行动”而非“更优美的回答”,Agent使LLM从“对话式AI”进化为“动作式AI”以产生商业闭环 [13] - 公司思路已从工具转变为基础设施提供商,大模型正演变成调度工具的通用操作系统,模型是内核,Agent是用户态程序,插件则是工具 [14] 行业竞争格局 - 过去一年开源大模型生态集体爆发,阿里云Qwen系列、月之暗面Kimi、智谱GLM和MiniMax M系列均取得超越当时顶级闭源模型的成果 [1] - Google Gemini 3.0 Pro的发布重新定义了“全球最强”,其强劲性能让开源和闭源的差距瞬间又变成了一道新的天花板 [2] - 开源模型存在三个关键缺陷:对标准注意力机制的过度依赖、后训练阶段计算投入不足、Agent领域泛化能力和指令遵循能力存在明显差距 [15] 未来发展路径 - 公司计划通过增加预训练计算量填补知识空白,并优化模型推理链的“智能密度”提高效率,让模型学会“少说话、多办事” [16] - 研究员Zhibin Gou表示,训练后的瓶颈需通过优化方法和数据解决,而非仅等待更好的基础模型,持续扩大模型规模、数据量、上下文和强化学习 [17] - 公司用实打实的模型证明Scaling没死只是换了战场,当行业讨论Scaling Law是否撞墙时,公司想证明持续扩展的可能性 [19]
蚂蚁推出全模态通用AI助手“灵光”!科创人工智能ETF华夏(589010) 早盘稳步走高,呈短线结构性增强趋势
每日经济新闻· 2025-11-18 11:01
科创人工智能ETF市场表现 - 截至9点51分,科创人工智能ETF(589010)上涨约0.83%,早盘呈现低开后震荡走强态势 [1] - 分时价格持续运行在分时均线上方,短线动能偏强,持仓股涨多跌少(19涨、11跌) [1] - 部分核心组件与算力标的录得超过2%的阶段性领涨表现,板块内部呈现偏暖格局 [1] - 盘中成交保持活跃,换手充足,显示买卖双方均有参与意愿 [1] 人工智能行业动态 - 蚂蚁集团正式发布全模态通用AI助手"灵光",可在移动端实现"自然语言30秒生成小应用" [1] - "灵光"是业内首个全代码生成多模态内容的AI助手,首批上线"灵光对话"、"灵光闪应用"、"灵光开眼"三大功能 [1] - 该产品支持3D、音视频、图表、动画、地图等全模态信息输出,并已同步登陆安卓与苹果应用商店 [1] - 开源模型能力快速追赶,中国大模型被世界"看见",Deepseek引起世界关注并带来全球人工智能竞争格局的重塑 [2] 中国AI模型竞争力 - 全球领先的大模型主要来自美国和中国,LMArena数据显示中国的开源大模型已牢牢占据榜单前五 [2] - 阿里的Qwen系列和DeepSeek从2024年下半年起在开源社区构建起越来越深远的影响力 [2] 科创人工智能ETF产品特征 - 科创人工智能ETF华夏(589010)紧密跟踪上证科创板人工智能指数,覆盖全产业链优质企业 [2] - 该ETF兼具高研发投入与政策红利支持,20%涨跌幅与中小盘弹性有助于捕捉AI产业"奇点时刻" [2]
GPT-4o准确率仅为24%,权威中文教育基准:知识+情商的双重考验
36氪· 2025-11-14 15:20
研究背景与核心问题 - 当前大模型评测基准存在维度单一和忽视育人能力两大局限性,主要关注知识储备而忽略了启发式教学、情感支持等真实教育场景中的关键能力[1] - 行业面临的关键问题是现有评估方式不足以全面衡量大模型在复杂教育环境中的综合能力,一个好的AI老师不应仅仅是解题高手[1] OmniEduBench基准框架设计 - 该基准包含24,602个高质量问答对,采用独特的双维度评估体系,首次从知识+育人双维度系统评测大模型教育能力[1][3][5] - 知识维度包含18,121个条目,覆盖从小学到专业考试的五个难度级别和41个学科,包含11种常见考试题型[6] - 育人维度包含6,481个条目,聚焦6大细分领域和20个具体教学主题,包括思维与认知、个性化发展、情感与心理健康、品格与价值观等[7][8][9][10] 基准构建方法与质量保障 - 构建过程历经多源收集(927K)、结构化清洗(657K)、双机筛难(50K)、专家定版(24.6K)四道严苛关卡[11][13] - 采用对抗式筛选方法,先用QWQ-32B过滤简单题,再用更强的Qwen3-235B进行二次筛选,只保留高难度样本以防模型背题[13] - 最终由50位硕士生和5位资深专家进行人工审核,抽样质检显示整体质量4.8/5,答案准确性4.8/5,标注者一致性高达0.90[13] 主要评测结果与发现 - 在知识维度测试中,GPT-4o准确率仅为24.17%,远低于多个顶尖开源模型,显示其在处理本土化中文教育题目时存在水土不服[15] - 在育人维度上,表现最好的模型QwQ-32B准确率为70.27%,但与人类水平相比仍有近30%的巨大差距,表明当前LLM在高级教育能力上普遍缺乏[15][16] - 在高难度子集OmniEduBench HARD上,所有模型性能出现断崖式下跌,最强模型Gemini-2.5 Pro准确率也不足50%[16] 行业意义与影响 - 该基准首次将教育场景中的互动能力系统化、可量化,推动行业关注模型在启发、反馈等真实互动场景中的价值[17] - 作为原生中文教育基准,从数据到任务定义都更接地气,能更准确地评估模型在本土环境下的表现[19] - 为中文大模型在教育领域的评测提供了更全面的视角,清晰揭示了当前LLM在实现教育核心目标育人方面的明显短板[20][21]
开源模型TOP5,被中国厂商包圆了
量子位· 2025-10-15 14:27
中国开源大模型行业地位转变 - 中国开源大模型已占据全球榜单前五名,从追赶者转变为引领潮流的一方[1][6] - 阿里Qwen系列和DeepSeek自2024年下半年起在开源社区影响力持续扩大[1] - 行业普遍认为中国开源力量已对大模型格局产生冲击,重要节点是"DeepSeek时刻"[23] 文本能力表现 - 在LMArena文本排行榜中,智谱GLM-4.6和DeepSeek-v3.2紧随顶级闭源模型之后[7] - 阿里Qwen3-max-preview跻身文本排行榜TOP3,但该版本未开源[8] - 文本排行榜总投票数达4,222,042次,涵盖255个模型[9] 编程能力表现 - 前端开发排行榜中,国产开源模型与编程SOTA Claude分庭抗礼[10] - DeepSeek-R1/V3.1、GLM-4.6和Qwen3-Coder均进入前10名[10] - 前端开发排行榜总投票数为187,703次,涵盖49个模型[11] 多模态能力表现 - 视觉方面,腾讯Hunyuan-vision-1.5和Qwen3紧跟闭源SOTA,位列开源最强[12] - 视觉排行榜总投票数达532,681次,涵盖79个模型[13] - 视频模型领域,阿里Wan-v2.2在开源模型中表现最佳[13] - 国产闭源视频模型Kling-2.5、Seedance-v1-pro、Hailuo-02等位居榜单前列[14] 社区影响力与下载量 - 趋势榜中,蚂蚁Ling-1T和智谱GLM-4.6是最受关注的开源模型[16] - DeepSeek-R1是最受欢迎模型[17] - Qwen3是下载量最高的模型之一,在百亿参数级别领先包括gpt-oss在内的其他开源模型[18] - Qwen/Qwen3-0.6B模型下载量达6.86M,Qwen/Qwen3-32B下载量达6.24M[19] 全球竞争格局变化 - 开源模型领域主导地位转变可能重新定义全球创新格局[21] - Meta的Llama 4翻车为中国开源模型崛起提供了机会[24] - Meta以35亿美元offer挖走OpenAI前CTO公司联创Andrew Tulloch,引发对Llama 5的期待[25][26]
对话中概ETF鼻祖KraneShares:外资对中国互联网主题兴趣回归
第一财经· 2025-10-14 14:31
海外资金对中国互联网股票的情绪与流向 - 中国互联网主题成为海外市场最受欢迎的中国股票主题,KWEB指数今年回报高达50% [1] - 年初至今整体资金流入达近20亿美元,尽管近期有获利了结,全年累计净流入仍在1亿美元左右,而前几年相关资金一度大幅净流出 [1] - KWEB是全球最知名且唯一主题性的"中概互联网ETF",是众多海外公募基金和对冲基金获取中国互联网敞口的主要工具 [1] KWEB指数与中概互联网板块表现 - KWEB指数从2021年初的104美元跌至2024年底的21美元,累计跌幅接近80% [2] - 近期纳斯达克中国金龙指数或KWEB ETF出现回调,月内累计回调约10%,前期强势板块如互联网、电商、教育领跌 [4] - 部分龙头股如阿里巴巴、拼多多单周跌幅超过10%,市场波动率上升,表明买盘由趋势性转向短线博弈 [4] 驱动板块复苏的核心基本面因素 - 互联网板块的EPS增速回升,人工智能叙事增强了市场信心 [2] - 阿里巴巴的Qwen系列成为全球开源研究的事实标准,Apache 2.0协议催生出超过10万款衍生模型 [2] - 中国自研芯片进展提振市场信心,为互联网巨头训练大模型提供更多资源,云业务占比扩大助推估值抬升 [2] 机构对关键公司(以阿里巴巴为例)的展望与行动 - 摩根士丹利维持阿里巴巴目标价为200美元,建议增持,并指出其token使用量每2-3个月翻一番 [3] - 阿里巴巴预计到2032年其全球数据中心用电量将较2022年增长10倍,并在3800亿元人民币资本支出计划基础上进行额外投资 [3] - 高盛上调阿里巴巴美股和港股目标价至205美元和199港元,主要基于对其2026年至2028年资本开支达到4600亿元人民币的预期 [5] - 高盛对阿里巴巴云业务收入预期年化同比增速分别为31%、38%和37,并将云业务估值从4倍PS上调至5倍PS [5] 海外机构对中国市场的长期参与度 - 众多欧美长线投资机构对中国股市可能仍停留在"感兴趣"或"小试牛刀"的阶段,前几年曾大幅削减研究人员,当前第一步是重新"招人" [5] - 今年有众多机构向KraneShares寻求中国股市的研究服务 [5] - 未来进一步提振海外长线资金信心的关键在于内需表现,这是海外机构关注的核心指标 [1][5]
当中国开源AI领跑,美国科技圈和政界坐不住了
搜狐财经· 2025-08-15 02:58
中国开源AI模型发展 - 中国正加快将开源人工智能模型打造成全球标准 此举震动美国科技巨头与政策制定者 担心美国优势被取代并筹划应对策略 [2] - 中国AI领域2024年突破不断 DeepSeek推出R1推理模型引发轰动 阿里巴巴密集推进Qwen系列开源 几乎每个季度都有新动作 持续巩固开源AI地位 [2] - 开源模型提供免费下载和自由修改 推动中国AI技术迅速在全球落地应用 美国专有模型公司感受到压力 OpenAI于8月初推出首个开源模型gpt-oss应对挑战 [2] 中美AI竞争格局 - 中国出现反超美国的可能性 凭借开放权重模型生态和半导体设计制造积极布局积蓄势能 [5] - 美国特朗普政府7月发布"美国人工智能行动计划" 明确指出开源模型可能在部分领域成为全球标准 呼吁打造基于美国价值观的领先开源模型 [5] - 中国高度竞争的商业环境和知识快速扩散 在AI竞赛中积累惊人动能 中美在不同AI领域各有优势 美国在大规模云端AI部署领先 中国长期在安防技术占优 [5] 开源模型性能与应用 - 研究机构Artificial Analysis评测显示 自2023年11月起中国最好开放权重模型整体性能已超越美国开源冠军 [7] - 在数学和编程等能力方面 阿里巴巴Qwen3某一版本击败OpenAI的gpt-oss [7] - 华侨银行利用开源模型开发约30款内部工具 使用Google Gemma总结文件 Qwen协助写代码 DeepSeek分析市场趋势 同时使用约10个开源模型 [7] 开源生态商业模式 - 开源AI领先者难以立即获得可观回报 研发成本动辄上亿美元 但可通过锁定用户后在生态内其他服务盈利 类似谷歌在安卓系统捆绑搜索和YouTube [6] - 企业偏好开源模式 可自由定制并部署在内部系统 将敏感数据留在自家服务器 [6] - 科研界长期将开源视为加速新兴技术发展的方式 中国鼓励AI、操作系统、半导体架构和工程软件领域的开源研发 [6] 中美AI生态差异 - 美国公司基础模型研发采取相对封闭策略 需要投入巨额资金挖角竞争对手核心成员 知识流动缓慢且代价高昂 [9] - 中国开源AI生态呈现高度竞争态势 领先基础模型公司相互压低价格 高调宣传 在人才与客户上互相挖角 [9] - 这种达尔文式竞争会淘汰部分现有玩家 但孕育出更强大的公司 DeepSeek和阿里巴巴等免费模型赢得全球用户青睐 [9]