开源模型
搜索文档
腾讯混元最新开源成“最强翻译”:国际机器翻译比赛获30个语种第一
量子位· 2025-09-03 13:49
国际翻译比赛表现 - 腾讯混元Hunyuan-MT-7B模型在ACL WMT2025比赛中获得31个语种中的30个第一名 处于绝对领先地位[4] - 该模型以7B总参数量击败了众多参数更大的模型 包括Gemini-2.5-Pro、GPT-4.1、Qwen3-235B等大型模型[4][5] - 比赛要求参数规模≤20B 且只能使用公开数据训练 在严格约束下取得优异成绩[5][29] 技术框架创新 - 采用协同增强策略优化(Shy)框架 包含基础模型开发和集成策略两大组成部分[15][19] - 基础模型开发通过持续预训练、监督微调和GRPO强化学习三阶段构建[16][17] - 集成策略采用学习型集成方法 通过生成多个候选翻译并训练专门模型进行智能选择或组合[18][26][27] 算法突破 - 首次在机器翻译领域应用GRPO(组相对策略优化)算法 采用组内相对优势替代全局基线[21][22] - GRPO算法显著降低梯度方差 提升训练稳定性 并提高样本效率加速模型收敛[23][24] - 采用复合奖励函数r=0.2×BLEU+0.4×XCOMET+0.4×DeepSeek 综合评估准确性、语义质量和流畅性[24] 模型性能优势 - 支持33个语种和5种民汉语言/方言互译 包括中文、英语、日语及捷克语、马拉地语等小语种[1][4] - 在Flores200测评数据集上表现卓越 明显领先同尺寸模型 与超大尺寸模型效果相当[6][8][9] - 在英语-简体中文翻译任务中AutoRank达到满分1.0 得分87.2 领先第二名Gemini-2.5-Pro的85.2分[5] 应用与部署优势 - 计算效率高 7B模型推理速度快 经FP8量化压缩后推理性能提升30%[30] - 部署友好 可在从高端服务器到边缘设备的多样化硬件环境中运行[30] - 已接入腾讯会议、企业微信、QQ浏览器、翻译君等多个业务产品[30] 开源生态建设 - 模型完全开源 基于Hunyuan-7B基础模型构建[2][31] - 使用OPUS Collection、ParaCrawl、UN Parallel Corpus等公开数据集训练[16][31] - 提供GitHub和HuggingFace等多个平台访问渠道 降低技术门槛[35] 行业方法论价值 - 为垂直领域专业化优化提供可借鉴模板 涵盖数据、算法、架构等多维度系统性设计[33][34] - 学习型集成方法实现从启发式到学习型的跃升 为模型融合提供新思路[26][34] - GRPO算法证明强化学习在序列生成任务中的潜力 具有行业推广价值[21][34]
汉王科技:公司AI电纸本上接入了DeepSeek开源模型
每日经济新闻· 2025-09-02 12:21
公司与DeepSeek合作情况 - 公司AI模型技术借鉴DeepSeek等优秀开源模型进行优化 [2] - 公司AI电纸本产品接入DeepSeek开源模型 [2] - 除技术借鉴与产品接入外未听说其他合作形式 [2] 技术合作模式 - 合作限于技术借鉴与开源模型接入层面 [2] - 未涉及商业合作或股权投资等深度合作形式 [2]
任正非、梁文锋、王兴兴、彭军等入选!《时代》最新发布→
证券时报网· 2025-09-01 19:52
中国AI企业全球影响力 - 华为创始人任正非入选《时代》全球AI百大人物 被评价为全球最重要AI巨头之一领导人[1][4] - 深度求索CEO梁文锋入选榜单 其开源模型DeepSeek-R1以600万美元训练成本挑战OpenAI顶级产品[1][3] - 宇树科技CEO王兴兴凭借人形机器人技术入选 公司获世界人形机器人运动会四金且测试速度超5m/s[1][5] - 小马智行CEO彭军作为自动驾驶唯一代表入选 公司目标2025年实现千台Robotaxi落地并获四大一线城市运营牌照[1][3][4] 技术突破与行业趋势 - 深度求索开源模型引发行业对低成本训练路径关注 造成英伟达等科技股短暂1万亿美元市值蒸发[3] - 沙利文研究报告显示国产开源模型与国际闭源模型性能差距接近抹平 预计超80%企业将采用开源大模型[3] - 宇树科技强调AI与机器人融合必要性 认为AI进步使机器人能完成未预先编程任务如打扫陌生房间[5] - 小马智行L4级自动驾驶进入规模化运营阶段 已在上海浦东开展自动驾驶出行服务示范[4] 企业运营与研发投入 - 华为2025上半年营收4270.39亿元同比增长3.95% 净利润371.95亿元同比下降32%[5] - 华为研发投入969.50亿元同比增长9.04% 占营收比例达22.7%[5] - 宇树科技硬件平台G1获得业界认可 基于该平台的独立参赛团队获世界人形机器人运动会1金1银1铜[5]
任正非、梁文锋、王兴兴、彭军等入选!《时代》最新发布→
证券时报· 2025-09-01 19:40
中国AI企业全球影响力 - 华为创始人任正非、深度求索CEO梁文锋、宇树科技CEO王兴兴、小马智行创始人彭军入选《时代》"2025年度全球AI领域100位最具影响力人物"榜单 [1] - 中国AI产业在自动驾驶、大模型、机器人等关键领域跻身全球第一梯队 [1] 深度求索开源模型突破 - 深度求索发布DeepSeek-R1模型 为第一个足以挑战OpenAI最新产品的开源模型 [3] - 模型训练成本仅600万美元 引发市场对OpenAI"星际之门"5000亿美元计划的质疑 [3] - 投资者抛售英伟达及美国科技股 导致1万亿美元市值蒸发 [3] 企业级开源大模型趋势 - 千问Qwen、DeepSeek等国产开源模型与国际顶级闭源模型性能差距几近抹平 [4] - 预计未来超过80%的企业将采用开源大模型 驱动企业级市场新一轮增长 [4] 自动驾驶商业化进展 - 小马智行定下2025年实现千台规模无人出租车(Robotaxi)落地目标 [4] - 公司获得新一批智能网联汽车示范运营牌照 在全国四大一线城市构建自动驾驶商业化网络 [4] - 以上海浦东新区金桥和花木核心区域为起点 逐步向公众开放自动驾驶出行服务 [4] 华为研发投入与业绩表现 - 2025年上半年华为营收4270.39亿元 同比增长3.95% [5] - 净利润371.95亿元 同比下降32% [5] - 研发投入969.50亿元 同比增长9.04% 占营收22.7% [5] 机器人技术突破与应用 - 宇树科技在人形机器人运动会夺得四金 比赛最好速度达4.78m/s(内部测试超5m/s) [6] - 公司认为AI进步将使机器人无需预先编程即可完成任务 如打扫陌生房间 [6] - 强调AI与机器人密不可分 机器人是AI落地解决现实问题的关键载体 [6]
中国企业调用大模型日均超10万亿Tokens 阿里通义份额第一
证券日报网· 2025-09-01 14:11
中国企业级大模型调用增长态势 - 2025年上半年日均调用量较2024年底增长363% [1] - 当前调用量超10万亿Tokens [1] 中国大模型市场竞争格局 - 阿里通义以17.7%的市占率位列市场第一 [1] 开源模型发展趋势 - 千问Qwen和DeepSeek等国产模型持续开源推动技术普及 [1] - 开源模型与国际顶级闭源模型性能差距几近抹平 [1] - 预计超过80%企业将采用开源大模型 [1] - 开源模型将驱动企业级市场新一轮增长 [1]
企业级大模型报告:阿里通义第一
扬子晚报网· 2025-09-01 12:59
中国企业级大模型市场增长态势 - 2025年上半年中国企业级市场大模型日均总消耗量达10.2万亿Tokens 较2024年下半年暴增363% [1] - 阿里通义以17.7%市占率位列第一 字节豆包占14.1% DeepSeek占10.3% 前三名合计占比超40% [1] - 生成式AI加速渗透中国企业级市场 调研覆盖金融、制造、互联网、消费电子、汽车等700家企业 [1] 公有云与开源模型发展趋势 - 70%企业选择公有云部署或调用大模型 71%企业计划增加公有云形态生成式AI服务 [2] - 开源模型成为关键增长动力 千问Qwen和DeepSeek等国产模型与国际闭源模型性能差距几近抹平 [2] - 未来超80%企业将采用开源大模型 因企业可完全掌握自主权并根据业务特点定制应用 [2] 阿里通义开源生态与全球影响力 - 阿里通义开源千问3指令微调模型、推理模型及多模态模型 含AI编程模型Qwen3-Coder和文生图模型Qwen-Image [3] - 千问模型全球市场份额最高达12.3% 超越OpenAI和Llama系列居全球第四 Qwen3-Coder调用量一周暴增1474% [3] - 阿里巴巴累计开源300多个模型 全球开发者基于千问衍生开发超14万个模型 成为全球第一开源模型 [3]
路线图出炉!未来十年,AI改变中国
华夏时报· 2025-08-30 17:44
国家人工智能战略部署 - 国务院发布《关于深入实施"人工智能+"行动的意见》 系统规划人工智能赋能产业升级的实施路径 围绕六大重点行动和八大基础支撑能力作出详细部署 [1] - 发展目标分三阶段:2027年实现与6大重点领域广泛深度融合 智能终端和智能体应用普及率超70%;2030年普及率超90% 智能经济成为重要增长极;2035年全面步入智能经济和智能社会发展新阶段 [2] 智能体发展重点 - 智能体与新一代智能终端成为赋能各行业转型的重要载体 全球人工智能厂商正竞相布局智能体 [2] - MiniMax推出首款全栈通用智能体 提供企业版本服务 覆盖建站编程、小程序制作、SaaS服务及复杂程序编制等场景 [3] - 阶跃星辰重点布局汽车、手机、具身、IoT四大场景 多模态能力已落地OPPO、荣耀等多品牌量产旗舰机型 与吉利汽车、千里科技达成深度合作推动"AI+车"融合 [3] 行业应用落地 - 百川智能专注AI医疗 发展理念与《意见》中"人工智能+"民生福祉高度契合 通过开源医疗模型提升辅助诊疗、健康管理、医保服务等场景能力 [5] - 零一万物CEO李开复表示中国开源模型性能比肩顶尖闭源模型 开源优势在于规模化、定制化和社区活力 有望在产业渗透深度和应用生态多样性上反超闭源模型 [5] 发展挑战与解决方案 - 面临三大核心挑战:构建国产算力平台上自主可控大模型及产业生态、解决数据治理问题、解决场景问题 [6] - 360集团通过"安全+AI"打造安全智能体 利用专业安全数据、知识、工具和工作流应对"智能体黑客"攻击 实现安全能力质的突破 [7] - 《意见》高度关注安全可控 12处提到"安全" 明确提出打造安全治理多元共治新格局和提升安全能力水平等要求 [6]
OpenAI之后,xAI也开源了!马斯克:中国公司将是最强大对手
每日经济新闻· 2025-08-25 06:20
xAI与Grok模型开源进展 - xAI公司宣布Grok-2.5(实际为Grok-2)正式开源,Grok-3预计在6个月内开源 [1] - 开源权限限制商业用途:仅允许年收入低于100万美元的关联公司免费商用,超过该门槛需获得xAI单独许可 [1] - 禁止使用Grok-2材料训练或改进其他基础/大型语言模型,除非协议允许修改或微调 [1] Grok App功能升级 - 推出v1.1.58版本更新,Imagine图像生成速度提升,Companions功能更生动有趣 [1] - Vision模式全面开放给所有Android用户,使用体验升级 [1] 行业竞争格局动态 - 马斯克宣称xAI将很快超越除谷歌外的所有公司,并最终超越谷歌 [1] - 中国公司被视为最强劲竞争对手,因其电力资源远超美国且硬件建设实力超强 [1] - OpenAI因中国开源模型竞争(如DeepSeek)推出两款开放权重模型GPT-oss-120b和GPT-oss-20b [2] DeepSeek技术升级 - 发布DeepSeek-V3.1版本,采用混合推理架构,支持思考模式与非思考模式自由切换 [3][4] - 思考效率提升:相比DeepSeek-R1-0528,新模型能在更短时间内给出答案 [3] - Agent能力增强:通过Post-Training优化,工具使用与智能体任务表现显著提升 [3] 产品与接口更新 - 官方App及网页端同步升级至DeepSeek-V3.1,支持128K上下文长度 [4] - API分为deepseek-chat(非思考模式)和deepseek-reasoner(思考模式) [4] - 新增strict模式Function Calling,确保输出符合schema定义 [4] - 支持Anthropic API格式,可接入Claude Code框架 [5] 技术细节与硬件适配 - DeepSeek-V3.1采用UE8M0 FP8 Scale参数精度 [5] - UE8M0 FP8专为下一代国产芯片设计 [5]
马斯克终于开源Grok-2,称“中国公司将是最强大的对手”
第一财经· 2025-08-24 18:09
xAI模型开源 - xAI于北京时间8月24日正式开源Grok-2模型 同时宣布Grok-3将在约6个月内开源[3] - 开源Grok-2是兑现去年承诺 即每当创建新版本时就开源前一个版本[5] - 模型需要8个GPU(每个超过40GB显存)才能运行 总文件42个 大小约500GB[9] 模型性能表现 - Grok-2在AI基准测试中得28分 目前排名第23位 而当前领先的GPT-5/Grok-4/o3分数分别为69/68/67[6] - 官方称Grok-2在编码、复杂问题和数学方面表现出色 性能曾比肩当时的GPT-4o[5] - Grok-4训练量是Grok-2的100倍 计划8月发布编程模型 9月发布多智能体 10月发布视频生成模型[9] 开源协议限制 - 开源协议仅允许年收入低于100万美元的公司进行商业使用 超过需单独许可[9] - 禁止使用开源模型训练其他基础模型[9] - 相比MIT或Apache 2.0许可 该协议限制条件更为严苛[9] 行业竞争格局 - 马斯克认为xAI将很快超越除谷歌外的任何公司 并最终超越谷歌[3] - 中国公司被视为最强劲竞争对手 因电力资源更丰富且硬件建设实力超强[3] - OpenAI推出gpt-oss-120b/20b开源模型 性能堪比o4-mini/o3-mini 可在高端笔记本和手机运行[10][11] 开源战略动因 - OpenAI表示开源是为满足企业及个人在自有硬件运行技术的需求 降低新兴市场和小型组织使用门槛[11] - 中国AI竞争(特别是DeepSeek等开源系统)是OpenAI决定推出开放权重模型的重要原因之一[11]