开源模型

搜索文档
通义DeepResearch震撼发布!性能比肩OpenAI,模型、框架、方案完全开源
机器之心· 2025-09-18 09:01
模型性能与开源优势 - 通义DeepResearch在Humanity's Last Exam、BrowseComp、GAIA等多项权威基准测试中取得SOTA效果,综合能力对标并超越海外旗舰模型[1] - 30B-A3B轻量级模型在WebWalkerQA、FRAMES等基准测试中表现优于基于基础模型的ReAct Agent和闭源Deep Research Agent[1] - 实现模型、框架、方案全面开源,相比海外旗舰模型昂贵且受限的调用方式具有显著成本优势[1] 技术架构与训练方法 - 提出端到端Agent训练范式,覆盖Agentic CPT(增量预训练)→Agentic SFT(有监督微调)→Agentic RL(强化学习)全流程[3][17][18] - 采用基于GRPO的定制化强化学习算法,通过token级策略梯度损失函数和留一法降低优势估计方差[21] - 使用128K上下文长度支持多轮交互,在ReAct模式(思考-行动-观察)基础上创新开发Heavy深度模式[11][12] 数据策略创新 - 开发全合成数据生成方案,不依赖人工标注即可大规模生成高质量训练数据[5] - 通过知识图谱随机游走和表格数据融合构建开放世界知识记忆,基于实体锚定生成多风格(问题,答案)对[6] - 采用自动化数据引擎生成"博士级"研究问题,通过策略性信息隐藏和集合论建模系统提升问题复杂度[9] 推理模式突破 - Heavy模式采用IterResearch范式,将任务解构为多轮研究,每轮重构精简工作空间保持认知焦点[13][14] - Research-Synthesis框架支持多IterResearch Agent并行探索同一问题,整合报告提升答案准确性[15] - 基础ReAct模式无需提示工程即可释放模型能力,深度模式进一步探索复杂推理与规划上限[3][12] 基础设施与应用落地 - 构建仿真训练环境替代实时Web API,基于离线维基百科数据库和自定义工具套件提升研发效率[27] - 开发统一工具沙盒通过缓存、重试和饱和响应机制确保工具调用稳定性,防止错误响应干扰学习轨迹[27] - 在高德App地图导航+本地生活场景落地应用,基于纯agentic+ReAct技术提供复杂查询体验[28] 行业应用案例 - 通义法睿法律智能体在答案要点质量(88.28分)、法条引用质量(81.01分)、案例引用质量(64.26分)三大维度均超越OpenAI(88.25/75.83/57.56)和Claude(85.30/76.11/40.43)[30][31] - 司法DeepResearch能力支持多步查询与复杂推理,实现类案检索、法条匹配与专业观点融合[30] - 过去六个月每月持续发布技术报告,累计发布五篇,本次同步发布六篇新报告及开源模型[33]
从苹果收购传闻到ASML豪掷13亿成大股东,起底Mistral AI的技术与商业密码
36氪· 2025-09-12 15:35
9 月初,苹果被曝出有意收购法国初创公司 Mistral AI 的消息,而紧随其后,半导体巨头 ASML 又以 13 亿欧元领投其 C 轮融资。目前,该公司估值已飙 升至 140 亿美元,成为了欧洲 AI 赛道最炙手可热的标杆力量。 科技行业的风云变幻,让巨头们的每一个动向都备受瞩目。近期,苹果对 Mistral AI 收购意向的传闻甚嚣尘上,而就在 9 月 9 日,荷兰光刻机巨头 ASML 也官宣以 13 亿欧元领投 Mistral AI 的 C 轮融资,并与其建立战略合作伙伴关系。这一系列动作迅速让 Mistral AI 成为了讨论焦点,不禁让人好奇,Mistral AI 究竟是何方神圣,为何能引得科技巨头们竞相追逐?它究竟拥有怎样的独家优势,能在竞争激烈的 AI 赛道中脱颖而出? 巨头青睐,崭露头角引关注 Mistral AI 于 2023 年 4 月在法国巴黎正式创立,虽然诞生时间不长,却在 AI 领域迅速崭露头角。这家公司由 3 位 90 后天才 —— Arthur Mensch、 Timothée Lacroix 和 Guillaume Lample 联合创办,其团队堪称豪华,核心成员皆来自 De ...
王兴兴,最新发声!“还处在爆发性增长前夜”
中国证券报· 2025-09-11 23:05
9月11日,多位前沿科技人士在2025 Inclusion·外滩大会开幕式暨主论坛上,带来对人工智能时代的最新 思考。 宇树科技创始人兼CEO王兴兴认为,真正让AI干活,这个领域还是一片荒漠,现在还处在大规模爆发 性增长的前夜。 王兴兴:现在是"AI干活" 大规模爆发性增长的前夜 宇树科技创始人兼CEO王兴兴认为,当前具身智能发展在高质量数据以及模型算法层面仍然存在一些挑 战。 阿里云创始人、之江实验室主任王坚表示,2025年,开源成为了AI竞争的关键变量。从代码开源变为 资源开放,是AI时代的革命性变化。开放数据和计算资源是推动AI往前走的必需环节,开源模型与闭 源模型的选择,变成了AI竞争的关键变量。 在太空领域的AI应用方面,王坚表示,在通讯卫星、导航卫星、遥感卫星之后,由于人工智能的出 现,会出现第四种卫星,即"计算卫星"。 5月14日,之江实验室第一次把12颗卫星同时送上了天,在这12颗卫星组成的星座上,第一次把8B参数 模型放到太空中去。王坚解释,这是把一个跟地面上一模一样、完完整整的大模型送上了太空。这12颗 卫星到了太空后,能保证只要卫星到达的地方,就可以完成对所有数据的处理。 王坚说,这个项 ...
图灵奖得主、王坚、韩歆毅、王兴兴等最新发声
中国基金报· 2025-09-11 19:10
人工智能发展趋势 - 人工智能进入以持续学习为核心的"经验时代" 潜力远超以往 [2] - 人类数据红利正逼近极限 超级人工智能将远超人类智力水平 [2] - 开源模型与闭源模型的选择成为AI竞争关键变量 [3][4] - 开放数据和计算资源是推动AI发展的必需环节 [4] 产业化与基础设施 - 大模型"规模定律"仍然有效 智能体与经济结构转型将重塑社会 [6] - AI驱动基础设施大规模扩张 OpenAI的Stargate和Musk的Colossus等项目耗电量巨大 [6] - 100万个GPU耗电量相当于北京市用电量的八分之一 [6] - 2025年美国主要科技公司AI相关资本开支预计超3000亿美元 [6] - IDC产业大规模建设带动电力生态和经济发展 [6] - 模型和GPU算力将成为未来组织的核心资产 [6] 技术突破方向 - 当前AI仅具静态知识存储能力 缺乏自我验证与自我纠错能力 [8] - 需将AI从"黑箱"系统转变为基于数学原理的"白箱"模型 [8] - 具身智能发展面临高质量数据和模型算法对齐的挑战 [14] - 视频生成与机器人控制模态对齐存在技术难题 [14] 行业应用落地 - AI医疗领域坚持人机结合发展路径 致力于解决数据/幻觉/伦理三大核心问题 [10][11] - AI无法替代医生 但可帮助专科医生拓展能力边界 支持MDT多学科会诊 [10] - 让名医专注科研和疑难杂症 基层医生获得AI助手支持 [11] - 创新创业门槛大幅降低 小组织在AI时代爆发力增强 [14] 市场表现数据 - 云计算50ETF(516630)近五日上涨10.13% 市盈率115.35倍 主力资金净流入469.6万元 [20] - 游戏ETF(159869)近五日上涨6.76% 市盈率44.91倍 主力资金净流出8712.1万元 [19] - 科创半导体ETF(588170)近五日上涨5.83% 主力资金净流入1050.9万元 [19] - 食品饮料ETF(515170)近五日上涨2.50% 市盈率21.51倍 主力资金净流出1069.6万元 [19]
把大模型送上天!王坚外滩大会分享:人工智能不能缺席太空
观察者网· 2025-09-11 16:11
AI开源模式变革 - 从代码开源演进为资源开放是AI时代的革命性变化 开放数据和计算资源成为推动AI发展的必需环节[1][3] - 开源模型与闭源模型的选择成为AI竞争关键变量 2025年开源成为行业分水岭[1][3] - 模型权重开放本质是数据与计算资源开放 可避免重复消耗计算资源[3] 太空计算新纪元 - 之江实验室成功发射12颗卫星组成"三体计算星座" 首次将完整8B参数大模型部署至太空[4] - 卫星星座实现太空任意位置数据实时处理 为深空探索奠定技术基础[4] - 人工智能将催生第四类"计算卫星" 太空资源开放共享成为未来方向[3][4] 行业技术突破 - 规模效应带来人工智能原理级进步 数据模型算力千倍万倍增长引发质变[3] - 通义千问与DeepSeek开源推动行业格局变化 改变原由美国公司主导的基础模型竞争态势[1] - 太空计算能力突破使火星探索成为可能 AI陪伴成为深空探索必备要素[4]
阿里云创始人王坚:开源与闭源模型的选择,已成为AI竞争关键变量
新浪科技· 2025-09-11 10:06
AI行业发展趋势 - 开源模型与闭源模型的选择成为AI竞争关键变量 [1] - 当前处于开源开放时代 模型权重的开放等同于数据资源和计算资源的开放 [1] - 仅开放软件的开源模式作用已非常有限 [1]
腾讯混元最新开源成“最强翻译”:国际机器翻译比赛获30个语种第一
量子位· 2025-09-03 13:49
国际翻译比赛表现 - 腾讯混元Hunyuan-MT-7B模型在ACL WMT2025比赛中获得31个语种中的30个第一名 处于绝对领先地位[4] - 该模型以7B总参数量击败了众多参数更大的模型 包括Gemini-2.5-Pro、GPT-4.1、Qwen3-235B等大型模型[4][5] - 比赛要求参数规模≤20B 且只能使用公开数据训练 在严格约束下取得优异成绩[5][29] 技术框架创新 - 采用协同增强策略优化(Shy)框架 包含基础模型开发和集成策略两大组成部分[15][19] - 基础模型开发通过持续预训练、监督微调和GRPO强化学习三阶段构建[16][17] - 集成策略采用学习型集成方法 通过生成多个候选翻译并训练专门模型进行智能选择或组合[18][26][27] 算法突破 - 首次在机器翻译领域应用GRPO(组相对策略优化)算法 采用组内相对优势替代全局基线[21][22] - GRPO算法显著降低梯度方差 提升训练稳定性 并提高样本效率加速模型收敛[23][24] - 采用复合奖励函数r=0.2×BLEU+0.4×XCOMET+0.4×DeepSeek 综合评估准确性、语义质量和流畅性[24] 模型性能优势 - 支持33个语种和5种民汉语言/方言互译 包括中文、英语、日语及捷克语、马拉地语等小语种[1][4] - 在Flores200测评数据集上表现卓越 明显领先同尺寸模型 与超大尺寸模型效果相当[6][8][9] - 在英语-简体中文翻译任务中AutoRank达到满分1.0 得分87.2 领先第二名Gemini-2.5-Pro的85.2分[5] 应用与部署优势 - 计算效率高 7B模型推理速度快 经FP8量化压缩后推理性能提升30%[30] - 部署友好 可在从高端服务器到边缘设备的多样化硬件环境中运行[30] - 已接入腾讯会议、企业微信、QQ浏览器、翻译君等多个业务产品[30] 开源生态建设 - 模型完全开源 基于Hunyuan-7B基础模型构建[2][31] - 使用OPUS Collection、ParaCrawl、UN Parallel Corpus等公开数据集训练[16][31] - 提供GitHub和HuggingFace等多个平台访问渠道 降低技术门槛[35] 行业方法论价值 - 为垂直领域专业化优化提供可借鉴模板 涵盖数据、算法、架构等多维度系统性设计[33][34] - 学习型集成方法实现从启发式到学习型的跃升 为模型融合提供新思路[26][34] - GRPO算法证明强化学习在序列生成任务中的潜力 具有行业推广价值[21][34]
汉王科技:公司AI电纸本上接入了DeepSeek开源模型
每日经济新闻· 2025-09-02 12:21
公司与DeepSeek合作情况 - 公司AI模型技术借鉴DeepSeek等优秀开源模型进行优化 [2] - 公司AI电纸本产品接入DeepSeek开源模型 [2] - 除技术借鉴与产品接入外未听说其他合作形式 [2] 技术合作模式 - 合作限于技术借鉴与开源模型接入层面 [2] - 未涉及商业合作或股权投资等深度合作形式 [2]
任正非、梁文锋、王兴兴、彭军等入选!《时代》最新发布→
证券时报网· 2025-09-01 19:52
中国AI企业全球影响力 - 华为创始人任正非入选《时代》全球AI百大人物 被评价为全球最重要AI巨头之一领导人[1][4] - 深度求索CEO梁文锋入选榜单 其开源模型DeepSeek-R1以600万美元训练成本挑战OpenAI顶级产品[1][3] - 宇树科技CEO王兴兴凭借人形机器人技术入选 公司获世界人形机器人运动会四金且测试速度超5m/s[1][5] - 小马智行CEO彭军作为自动驾驶唯一代表入选 公司目标2025年实现千台Robotaxi落地并获四大一线城市运营牌照[1][3][4] 技术突破与行业趋势 - 深度求索开源模型引发行业对低成本训练路径关注 造成英伟达等科技股短暂1万亿美元市值蒸发[3] - 沙利文研究报告显示国产开源模型与国际闭源模型性能差距接近抹平 预计超80%企业将采用开源大模型[3] - 宇树科技强调AI与机器人融合必要性 认为AI进步使机器人能完成未预先编程任务如打扫陌生房间[5] - 小马智行L4级自动驾驶进入规模化运营阶段 已在上海浦东开展自动驾驶出行服务示范[4] 企业运营与研发投入 - 华为2025上半年营收4270.39亿元同比增长3.95% 净利润371.95亿元同比下降32%[5] - 华为研发投入969.50亿元同比增长9.04% 占营收比例达22.7%[5] - 宇树科技硬件平台G1获得业界认可 基于该平台的独立参赛团队获世界人形机器人运动会1金1银1铜[5]
任正非、梁文锋、王兴兴、彭军等入选!《时代》最新发布→
证券时报· 2025-09-01 19:40
中国AI企业全球影响力 - 华为创始人任正非、深度求索CEO梁文锋、宇树科技CEO王兴兴、小马智行创始人彭军入选《时代》"2025年度全球AI领域100位最具影响力人物"榜单 [1] - 中国AI产业在自动驾驶、大模型、机器人等关键领域跻身全球第一梯队 [1] 深度求索开源模型突破 - 深度求索发布DeepSeek-R1模型 为第一个足以挑战OpenAI最新产品的开源模型 [3] - 模型训练成本仅600万美元 引发市场对OpenAI"星际之门"5000亿美元计划的质疑 [3] - 投资者抛售英伟达及美国科技股 导致1万亿美元市值蒸发 [3] 企业级开源大模型趋势 - 千问Qwen、DeepSeek等国产开源模型与国际顶级闭源模型性能差距几近抹平 [4] - 预计未来超过80%的企业将采用开源大模型 驱动企业级市场新一轮增长 [4] 自动驾驶商业化进展 - 小马智行定下2025年实现千台规模无人出租车(Robotaxi)落地目标 [4] - 公司获得新一批智能网联汽车示范运营牌照 在全国四大一线城市构建自动驾驶商业化网络 [4] - 以上海浦东新区金桥和花木核心区域为起点 逐步向公众开放自动驾驶出行服务 [4] 华为研发投入与业绩表现 - 2025年上半年华为营收4270.39亿元 同比增长3.95% [5] - 净利润371.95亿元 同比下降32% [5] - 研发投入969.50亿元 同比增长9.04% 占营收22.7% [5] 机器人技术突破与应用 - 宇树科技在人形机器人运动会夺得四金 比赛最好速度达4.78m/s(内部测试超5m/s) [6] - 公司认为AI进步将使机器人无需预先编程即可完成任务 如打扫陌生房间 [6] - 强调AI与机器人密不可分 机器人是AI落地解决现实问题的关键载体 [6]