Workflow
开源模型
icon
搜索文档
美媒:越来越多硅谷企业正依托中国开源AI模型进行开发,“中国人是AI领域真正创新者”
环球网· 2025-12-01 10:47
行业趋势 - 越来越多美国硅谷企业正依托中国开源人工智能(AI)模型进行开发[1] - 美国AI企业正更多采纳免费、可定制且功能日益强大的开源AI模型,其大多产自中国[3] - 过去一年,越来越多美国热门AI初创企业转向使用中国开源AI模型,这些模型正日益取代昂贵的美国系统[3] - 中国AI系统不仅获取价格更低、可定制程度更高,且过去一年间其性能已能满足多数应用场景的需求[3] - 开源模型凭借其生态系统优势不断增加影响力,许多中国企业推出新产品的速度也比美国同行更快[4] 技术评价 - 中国模型与前沿技术的距离之近“令人惊讶”,正在涌现的产品已显然“非常接近”前沿技术[3] - 中国模型近期取得的进步并非偶然,中国人是AI领域真正的创新者[1][4] - 力量平衡在过去12个月里发生快速转变[4] 行业影响与竞争格局 - 美国企业越来越多使用中国免费模型,引发对“美国追求闭源模型的做法是否完全错误”的质疑[3] - 投资者已向美国OpenAI和Anthropic公司投入数百亿美元,押注美国领先的AI企业将主导全球市场[3] - 美国AI企业和联邦政府已注意到中国模型崛起,有专家将美国缺乏强大的开源模型视为“生存威胁”[4] - 美国在开源模式领域已失去领先地位——无论是在性能还是应用方面——而且正朝着进一步落后的方向发展[4]
“力量平衡变了,中国AI愈发成为硅谷技术基石”
观察者网· 2025-12-01 08:19
文章核心观点 - 中国开源AI模型(如DeepSeek、阿里巴巴通义千问)凭借低成本、高定制化、强隐私保护及完善的开发者生态等优势,在过去一年中被越来越多美国硅谷AI初创公司采用,部分场景下性能已接近甚至比肩OpenAI、Anthropic等美国闭源旗舰模型,引发了美国业界对其“封闭”路线的质疑 [1] - 美国AI初创企业的估值正创下纪录,但许多公司的技术根基却建立在可免费下载的低成本中国AI模型之上,这给依赖巨额投资的美国闭源AI产业带来了挑战 [1][4] 中国开源AI模型的优势与采用情况 - **性能接近前沿**:中国开源AI模型与前沿水平的差距“触手可及”,新一代模型正推动中国乃至全球人工智能的前沿发展 [1][2] - **成本与速度优势**:在许多情况下,在自有硬件上运行中国模型,比使用OpenAI的GPT-5或谷歌的Gemini等大型模型速度更快、成本更低 [4] - **具体案例**:估值7亿美元的AI搜索公司Exa表示,使用中国模型比GPT-5或Gemini更快、更便宜 [4] 效率工具Dayflow约40%的用户选择使用开源模型,因为为用户使用闭源模型付费每人每年可能带来高达1000美元的成本,开源模型对生存能力至关重要 [6] - **隐私保护优势**:开源模型可在用户个人电脑上本地处理数据,对注重隐私、不愿将数据上传至云端的用户颇具吸引力 [6][7] 技术生态与开发者支持 - **生态系统优势**:中国模型在在线开发者资源中占据主导地位,拥有丰富的培训指南和社区支持,例如Airbnb也“大量”依赖中国模型 [7] - **易于定制与适配**:开发者发现从开源模型入手,用自己的数据对其进行适配,添加特定技能或知识变得更简单高效,这使中国模型成为定制开发的默认起点 [7] - **市场渗透**:在热门编程应用Kilo Code用户最青睐的20款模型中,有7款是中国模型,其中6款为开源模型 [8] 中美AI发展路径对比 - **美国路径**:AI发展由私营部门主导(如OpenAI、Anthropic),奉行闭源模型路线 [8] - **中国路径**:更积极地规划国家AI发展愿景,呼吁加强“开源技术合作”,实验室通常会公开发布其模型 [9] - **发布速度**:中国公司产品推出速度更快,例如阿里巴巴大约每20天就发布一款新模型,而Anthropic的平均发布间隔为47天 [9] 美国业界的反应与竞争 - **性能认可与担忧**:行业专家指出,过去12个月里,力量平衡发生了迅速转变,中国是AI领域真正的创新者 [9][10] 但同时有硅谷人士认为闭源模型在性能、实用性和生态系统上仍有显著优势 [10] - **美国开源模型的觉醒**:为应对挑战,美国开始鼓励开源模型发展,例如白宫发布《人工智能行动计划》呼吁鼓励开源模型发展,OpenAI发布了五年来首款开源模型,艾伦研究所发布了最新开源模型Olmo 3并发起了“ATOM计划” [11][12][13] - **竞争意识**:美国业界认识到已失去在开源模型领域的领先地位,无论是性能还是采用率,并担忧进一步落后 [13]
展望2026,AI行业有哪些创新机会?
36氪· 2025-11-28 16:37
全球大模型格局 - 全球大模型发展呈“双核驱动”态势,技术路径上闭源与开源并行,地缘格局上美国与中国成为两大核心力量[10] - 美国在算力、算法和人才方面积累深厚,主导闭源领域;中国将开源作为重要发展方向,有助于应对供应链不确定性和外部制约[13] - 头部闭源模型形成OpenAI、Anthropic与Google“三驾马车”之势,OpenAI的GPT系列在综合能力方面具备优势,Anthropic聚焦专业场景,Google的Gemini路线更倾向于“全面而均衡”[17] 开源模型的崛起 - 2025年是中国大模型发展的“破局之年”,DeepSeek横空出世,在全球范围内率先以开源方式复现具备“长链推理”能力的大模型[18] - DeepSeek通过创新训练机制将推理过程中的Token成本大幅压缩,实现“低成本,长推理”范式,迅速引爆开发者社区[18] - 除DeepSeek外,通义千问和Kimi等国产大模型也已陆续开源,共同探索兼具技术深度与生态广度的新型开源路径[18] - 开源对中国而言是一种系统性战略,本土开源模型获得广阔应用试验场,并激活了中国庞大的工程师红利,实现算力、数据与人才的高效协同[19] 端侧模型发展 - 2025年“端侧推理”成为模型落地的重要战场,在云端训练昂贵、推理成本上升的背景下,部分推理能力迁移到设备端执行[20] - 端侧模型参数量级在几亿到数十亿,具备低延迟响应、强隐私保护和几乎可忽略的运行成本优势[21] - 家庭与办公场景成为端侧模型的典型载体,安防摄像头、家用机器人等开始依赖本地推理完成视觉理解和任务执行[21] 大模型关键技术演进 - 大模型从单一文本能力迈向更复杂综合形态,四大技术趋势包括原生多模态融合、推理能力、长上下文窗口与记忆机制,以及智能体能力[22] - 前沿大模型正转向原生多模态架构,将图像、语音、文本等多种模态嵌入同一共享向量表示空间,实现更高效一致的理解与生成[23] - 推理能力成为核心标配,模型在训练阶段学习“如何一步步思考”,在推理阶段采用“延长思考时间”等机制提升判断能力[24][26] - 新一代模型支持超长上下文并结合外部记忆存储机制,能够在多次交互中持续追踪用户身份和偏好,成为具备长期认知能力的数字伙伴[27] 训练范式与架构探索 - 大语言模型经历范式转变,从以大规模预训练为核心单一路径,演进为融合后训练精调与运行时计算增强的多阶段协同体系[31] - 能力提升遵循三条“规模法则”:预训练规模法则构建基础能力,后训练规模法则注入任务导向行为模式,测试时规模法则提升准确性[32][33][34] - Transformer仍是绝对主流架构,但研究者积极探索线性注意力模型、混合注意力机制和文本扩散模型等替代或混合方案[37] 物理AI和世界模型 - 世界模型和物理AI成为行业新焦点,物理AI指能够感知现实环境、理解物理规律并采取有效行动的智能系统[38] - 世界模型是AI在“脑海中构建的微型世界”,能模拟和预测未来状态,具备“内部模拟-预演-规划”能力,提升系统泛化能力和安全性[38] - 2025年世界模型领域迎来多项标志性进展,DeepMind发布Genie3,OpenAI推出Sora2,World Labs发布Marble,NVIDIA Isaac Sim获得业界广泛关注[44] 产业链与基础设施 - 算力基础设施层面英伟达领先地位依然稳固,市值一度突破5万亿美元,多元化生态虽已萌芽但远未成熟[47] - AI行业从依赖少数云厂商支持转向多方参与的“循环式资金支持”模式,形成以英伟达和OpenAI为核心的“软硬双核”驱动结构[48][51] - 截至2025年8月全球AI应用的年度经常性收入约300亿美元,但行业全链条成本需达到约6000亿美元年收入才能实现合理回报,存在数千亿美元亏损缺口[51] 应用层发展机遇 - 大模型公司通过打造“超级助手”和布局开发者工具、AI搜索等,希望成为下一代人机交互的入口掌控者[53][54] - AI应用创业者的机会存在于大模型边界之外的垂直领域,需要深度行业理解、复杂工作流整合或强用户关系沉淀的场景[55] - 成功创业路径包含三个关键策略:抢跑模型能力、搭建灵活脚手架、将护城河转向用户数据侧积累[56] AI应用进化与挑战 - AI应用从被动响应的对话工具向具备目标感与自主性的智能体进化,经历对话、Copilot、有限智能体和自主智能体四个阶段[61] - 软件开发方式发生根本转变,核心工作转向“上下文工程”,即动态编排提示词、记忆、状态与工具调用[62][65] - 高达95%的组织未能从生成式AI投入中获得可衡量的商业回报,出现“生成式AI鸿沟”,主因是应用场景错配和难以捕捉隐性知识[65][66] - AI应用面临“成本悖论”,尽管单位Token推理成本下降,但由于链式推理导致Token调用量大幅攀升,公司整体支出可能不降反升[67] 2026年AI行业展望 - 技术方向关注在线持续学习,期待模型能实现终身学习模式,在线持续地学习、感知反馈、自我调整[73] - 经济影响关注AI能否打破“生产率悖论”,当大模型承担智力工作、机器人接管体力任务,可能推动全要素生产率提升[74][75] - 投资逻辑从“技术叙事”回归“商业基本面”,投资者更关注项目是否具备真实竞争壁垒、清晰可持续的经济模型和规模效应[76]
第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件,了不起!
华尔街见闻· 2025-11-28 08:46
核心观点 - DeepSeek发布的开源数学模型DeepSeekMath-V2在复杂数学推理能力上取得重大突破,达到国际数学奥林匹克竞赛(IMO 2025)金牌水平,成为首个实现此成就的开源模型[1] - 该模型性能直接对标谷歌DeepMind的Gemini高级版本和OpenAI的实验性推理模型,标志着开源人工智能已具备与顶级闭源实验室同场竞技的实力[1] - 模型采用创新的自我验证训练框架,通过验证器评估证明过程质量而非仅关注最终答案,解决了AI模型缺乏严谨推理过程的问题[2][11] - 模型权重根据Apache 2.0许可证公开发布,可供公众自由下载、微调和优化,被视为人工智能民主化的重要一步[1][4] 技术成就 - 在模拟的2025年国际数学奥林匹克竞赛(IMO)中解决了6个问题中的5个,达到金牌水平,630名人类参赛者中仅有72人获得金牌[1][3] - 在中国数学奥林匹克(CMO)竞赛中达到金牌水平[3] - 在面向大学本科生的普特南数学竞赛(Putnam 2024)中,12道题完全解决了11道,另一道题仅有微小错误,最终得分118/120,超过人类参赛者90分的最高分记录[3] - 与谷歌DeepMind的Gemini高级版本和OpenAI的实验性推理模型表现相当,两者也解决了IMO 2025的5个问题并达到金牌标准[1] 技术创新 - 采用自我验证训练框架,训练专门的"验证器"评估证明过程质量,而非仅判断最终答案对错[2][11] - 验证器作为奖励模型引导独立的"证明生成器",只有当生成器成功识别并修复自身证明错误时才获得奖励[11] - 通过增加计算量和自动标记难以验证的证明来提升验证难度,防止模型过度拟合自身检查机制[2][12] - 实现验证-生成闭环和元验证机制,支持全自动化数据标注和持续性能优化[12] 开源意义 - 模型权重在Hugging Face上根据Apache 2.0许可证公开发布,允许研究人员和开发者自由下载、探索、微调和优化[1][4][7] - Hugging Face联合创始人盛赞此为"人工智能和知识民主化的最佳体现",用户可不受限制地运行在自有硬件上[4][5] - 证明开源社区有能力在尖端AI研究领域追赶甚至比肩顶级闭源实验室[2] - 可能引发市场对开源模型是否会侵蚀闭源产品商业护城河的讨论[2] 行业影响 - 标志着开源人工智能在复杂推理能力上的一次重大突破[1] - 将DeepSeek推向与OpenAI和谷歌等科技巨头同场竞技的舞台[1] - 展示了自驱动学习系统在解决复杂数学推理任务上的可行性[12] - 对于没有已知解决方案的开放性问题,自我验证在扩展测试时计算方面尤为重要[11]
英国《金融时报》:中国开源AI模型下载量占比首超美国
搜狐财经· 2025-11-27 20:13
全球开源AI模型市场格局 - 中国在全球开源人工智能模型市场已超越美国,在利用开源AI模型技术方面取得关键优势 [1] - 中国科研团队开发的开源AI模型在开源模型全球下载总量中占比上升至17%,超过美国科技公司的15.8% [3] - 这是中国科研团队首次在开源模型下载量指标上超越美国同行 [3] 中美企业模型发布策略差异 - 中国科技企业采用"颠覆性"模型发布方式,每周或每两周发布新模型并提供多种衍生版本 [5] - 美国实验室每六个月或一年才会发布一系列新模型 [5] - 美国OpenAI、谷歌和Anthropic等科技巨头倾向于"封闭"策略,保持对先进AI技术的完全掌控 [5] 开源模型的技术影响与开发优势 - 开源模型允许开发者免费下载、修改和整合,使创业公司更容易打造产品,研究人员更容易改进技术 [3] - 中国拥有大量本土研究人员,使得AI团队在模型开发方面更具创造性 [7] - 美国参与"开源"模型开发的大型独立机构要少得多 [7] 中国市场主要参与者 - 深度求索和阿里云的通义千问是下载量排名靠前的两个中国开源模型 [7]
普元信息:截至目前公司产品已接入Qwen2.5、Qwen3.0、QwQ-32B等开源模型
格隆汇· 2025-11-26 17:41
产品生态合作 - 公司相关产品与阿里云专有云产品通过产品生态集成认证 [1] 技术能力整合 - 截至目前公司产品已接入Qwen2 5、Qwen3 0、QwQ-32B等开源模型 [1]
普元信息:公司产品已接入Qwen2.5、Qwen3.0、QwQ-32B等开源模型
每日经济新闻· 2025-11-26 17:41
业务合作认证 - 公司与阿里云专有云产品通过产品生态集成认证 [2] - 公司产品已接入Qwen2.5、Qwen3.0、QwQ-32B等开源模型 [2]
腾讯混元OCR模型宣布开源 参数仅为1B 多项核心能力达到SOTA效果
智通财经网· 2025-11-25 14:53
公司产品发布 - 腾讯混元于11月25日推出全新开源OCR模型HunyuanOCR,其参数仅为1B [1] - 该模型依托于混元原生多模态架构打造,在多项业界OCR应用榜单获得SOTA成绩 [1] - 模型设计采用“端到端”理念,各项功能仅需单次前向推理即可直达最优结果,较业界级联方案更高效便捷,性价比高 [1] 模型架构与特点 - HunyuanOCR模型主要由原生分辨率视频编码器、自适应视觉适配器和轻量化混元语言模型三大部分构成 [1] - 模型的训练和推理均采用全端到端范式,通过规模化高质量应用导向数据结合在线强化学习,表现出稳健的端到端推理能力 [1] - 模型具有高度易用性,体积小,便于部署 [1] 模型性能表现 - 在复杂文档解析的OmniDocBench测评中,HunyuanOCR获得最高94.1分,效果超过谷歌Gemini3-pro等领先模型 [2] - 在文字检测和识别能力上,于自建覆盖9大应用场景的基准上,大幅度领先同类开源及商业OCR模型 [2] - 在OCRBench榜单上,总得分为860分,以仅1B总参数的配置,取得了总参数3B以下模型的SOTA成绩 [2]
腾讯混元OCR模型宣布开源
新浪财经· 2025-11-25 14:39
公司动态 - 腾讯混元于11月25日推出全新开源模型HunyuanOCR [1] - 该模型参数规模为1B(十亿) [1] - 模型依托于混元原生多模态架构打造 [1] 技术表现 - HunyuanOCR在多项业界OCR应用榜单中获得SOTA(最先进水平)成绩 [1]