Workflow
千问3推理模型
icon
搜索文档
赛道Hyper | 追平全球顶级:千问3推理模型开源
华尔街见闻· 2025-08-06 16:06
模型技术特点 - 阿里巴巴开源千问3推理模型采用混合专家MoE架构,总参数达480B(4800亿),原生支持256K token上下文并可扩展至1M长度,显著提升编程任务效率 [1] - MoE架构通过分工协作提升性能并控制计算成本,适用于千亿级以上参数规模模型,实现效率与复杂需求的平衡 [1] - 模型在知识储备、编程能力、数学运算等维度与Gemini-2.5 pro、o4-mini等全球顶级闭源模型水平相当 [1][3] - 支持256K上下文长度,可处理长篇文档和多轮对话,避免关键信息丢失,在复杂问题拆解分析、流畅度和精准度方面较前代明显提升 [3] - Qwen3-235B-A22B-Instruct-2507(非思考版)在GPQA知识测评、AIME25数学测评中成绩超过Claude4等闭源模型 [3] - 训练使用36T tokens数据集覆盖书籍、代码库等多类型数据,通过多轮强化学习整合非思考与思考模型优化综合性能 [9] 性能表现与行业地位 - 在知识测评(SuperGPQA)、编程能力测评(LiveCodeBench v6)中表现接近顶尖闭源模型,在开源模型中处于前列 [3][4] - Qwen3-Coder在多语言SWE-bench测试中超过GPT4.1和Claude4,登顶HuggingFace模型总榜,该榜单综合下载量、使用频率和用户评分排名 [4][5] - 阿里已开源300余款通义大模型,衍生模型数量超过14万个,超过Meta的Llama系列,成为全球最大开源模型家族 [5] - 截至7月25日,千问API调用量在OpenRouter平台突破1000亿Tokens,包揽全球趋势榜前三,反映其受欢迎程度 [6] 实际应用与行业影响 - 程序员借助模型生成基础品牌官网最快仅需5分钟,新入行程序员效率可达到资深程序员一周工作量 [5] - 衍生模型经开发者微调后应用于教育、金融、医疗等行业,例如教育领域生成个性化习题,金融领域进行风险评估 [6] - 模型在法律行业可辅助审查长篇合同并提炼条款风险点,在科研领域快速抓取论文核心内容,节省人工时间 [7] - 开源模型允许中国企业免费商用,降低中小企业AI应用门槛,同时向美国、法国、德国等国家开放,推动技术全球普及 [6] 技术生态与商业协同 - 企业常将模型与阿里云数据库、安全服务打包采购,形成生态闭环,提升云产品使用深度与客户粘性 [6][7] - 模型开源属性降低使用成本,吸引中小开发团队,同时带动对GPU资源和IaaS服务的持续需求 [6][7] - Qwen3-Coder吸引二次开发,开发者添加特定行业代码库(如金融科技)并优化响应速度,适应实时编程场景 [10] - 通义大模型家族推动AI技术从实验室走向实际生产,为各行业提升效率 [10]
阿里通义大模型迎“周年庆”:一周开源4款模型
南方都市报· 2025-07-29 20:23
开源战略进展 - 公司正式发布通义大模型三周年 实现全尺寸和全模态全面开源 打破开源与闭源模型技术壁垒[1] - 近一周内连续发布并开源4款重磅大模型 包括7月28日开源的视频生成模型通义万相Wan2.2[1][3] 模型技术突破 - 通义万相Wan2.2开源三款视频生成模型 支持文生视频 图生视频和统一视频生成 可生成5秒高清视频并支持60多个可控参数[3] - 千问3基础模型获权威机构Artificial Analysis评为全球最智能非思考基础模型[3] - 千问3推理模型比肩顶级闭源模型Gemini2.5 pro和o4-mini 斩获推理模型全球开源冠军[3] - AI编程模型Qwen3-Coder在代码能力和Agent调用能力超越GPT4.1和Claude4 登顶Hugging Face总榜冠军[3] 市场反响与生态建设 - 千问API调用量三天突破1000亿Tokens 热度超越GPT Gemini和Claude等顶级模型 包揽OpenRouter趋势榜前三名[4] - 通义千问全球主要模型社区下载量突破4亿 衍生模型数量超过14万个 超越Meta的Llama系列成为全球第一开源模型家族[5] - 开源推动全球开发者众测反馈 直接获得数据和不良案例 加速模型迭代速度[5] 全栈AI能力展示 - 在世界人工智能大会全面展示从AI基础设施到大模型再到平台及应用的完整AI技术栈[4] - 开源战略使公司明确全球市场竞争中的生态位 获得直接技术反馈[5]
(经济观察)中国模型开源“接二连三” 开辟全球AI发展新路径
中国新闻网· 2025-07-26 20:41
中国科技公司模型开源动态 - 阿里巴巴在7月21日至25日期间连续开源三款AI模型:Qwen3-235B-A22B-Instruct-2507(非思考版)在测评中超越Claude4(非思考版)等闭源模型 Qwen3-Coder编程模型性能接近全球最强的Claude4 千问3推理模型扩展了大模型推理极限 [1] - 月之暗面于7月11日推出并开源Kimi K2模型 该模型采用MoE架构 总参数量1万亿 激活参数约320亿 以智能体潜能和编码能力见长 [1] - 阶跃星辰在7月25日发布新一代基础大模型Step3 这是其首个全尺寸 原生多模态推理模型 计划于7月31日面向全球开源 [1] - 自今年1月深度求索推出开源大模型DeepSeek-R1以来 中国科技企业持续推进开源战略 [1] 开源战略的行业影响 - 通义千问衍生模型已突破14万个 超越Meta公司的Llama系列成为全球第一的开源模型家族 [3] - 一汽集团 中国石油 建设银行 平安集团 南方航空 小鹏汽车等行业头部企业已接入千问AI编程模型 [3] - 开源技术的生态赋能效应已覆盖制造 金融 医疗等多个核心领域 形成"技术开源—场景迭代—生态培育—市场验证"的良性循环 [3] 开源模式的国际比较 - 中国科技企业的开源战略标志着中国在人工智能发展路径上走出一条与美国截然不同的道路 通过开源推动全球AI技术普惠化 培育开放包容的产业生态 [2] - 中国倡导"开源生态+闭源核心"混合模式 强调技术共享与商业价值的平衡 通过生态协作做大市场蛋糕 [2] - 当美国科技巨头纠结于"开源还是闭源"的零和博弈时 中国已通过开源构建起"技术共享 生态共建 价值共创"的新范式 [3]
早报 (07.26)| 纳指、标普又创新高!大规模裁员,芯片巨头股价下挫;证监会再发声
格隆汇· 2025-07-26 08:23
特朗普关税政策 - 将发出近200封关税信函 部分税率10%或15% [2] - 美欧达成降关税协议概率50% 多数协议预计8月前完成 [2] - 考虑对俄罗斯实施次级制裁 [2] 美股市场表现 - 三大指数全线上涨 纳指涨0.24% 标普500涨0.4% 道指涨0.47% [3] - 科技股多数上涨 特斯拉涨3.52% 微软涨0.55%创历史新高 英特尔跌超8% [3] - 中概股多数下跌 纳斯达克中国金龙指数跌0.89% [4] 公司动态 - 英特尔Q2净亏损恶化 启动重组计划 裁员15% 取消欧洲数百亿美元建厂计划 [2] - 大众汽车Q2营业利润38.3亿欧元 同比下降29% [14] - 特斯拉人形机器人Optimus今年产量仅数百台 远低于2025年5000台目标 [15] 中国政策与市场 - 证监会部署下半年工作 推动中长期资金入市 推进公募基金改革 [8] - 上半年个人所得税7945亿元 同比增长8% [21][22] - 第三批690亿元支持消费品以旧换新资金已下达 [22] 科技与创新 - 阿里开源千问3推理模型 连续开源3款重磅模型 获三项全球开源冠军 [12] - 宇树发布双足机器人Unitree R1 售价3.99万元起 重量约25Kg [10] - 英伟达获准恢复向中国销售H20 GPU 传追加投片 [19] 大宗商品与外汇 - WTI原油跌1.35%至65.16美元/桶 布伦特原油跌1.07%至68.44美元/桶 [5] - 美元指数涨0.28%至97.6450 离岸人民币涨0.19%至7.1677 [7] - 黄金下挫近1% 三连跌 [5] 房地产与土地市场 - 上海徐汇宅地成交楼面价20.03万元/㎡ 刷新全国单价地王纪录 [26] - 多地出现"1元起拍"房产 6月共278套 主要来自山东威海 [27] 影视与文化产业 - 2025年电影票房突破320亿 [25] - 深圳扶持微短剧产业 单剧最高可获300万资助 [24]
陆家嘴财经早餐2025年7月26日星期六
Wind万得· 2025-07-26 06:31
政策动态 - 国务院常务会议部署逐步推行免费学前教育,要求各地细化工作方案并安排补助资金[2] - 证监会部署七大重点任务,包括巩固市场回稳态势、深化创业板改革、防控房企债券风险等[2] - 证监会拟修订《上市公司治理准则》,完善董事高管监管和激励约束机制[4] - 深交所表示将支持人工智能、量子信息等领域企业适用创业板第二套、第三套上市标准[6] - 国家数据要素综合试验区落地10个省市,加快探索数据市场化路径[5] 宏观经济 - 上半年全国财政收入11.56万亿元,税收连续3个月同比增长,财政支出14.13万亿元同比增长3.4%[3] - 上海上半年GDP达26222.15亿元,同比增长5.1%[5] - 第三批690亿元以旧换新补贴资金已下达,剩余690亿元将于10月下达[3] - 财政部表示2025年2万亿元置换债券已发行1.8万亿元,占全年额度90%[20] - 上半年国债发行7.88万亿元创历史新高,同比增长35.28%[20] 金融市场 - 周五A股调整,上证跌0.33%,科创50逆势涨2.07%,成交额1.82万亿元[4] - 恒生指数跌1.09%,南向资金净买入超200亿港元,年内累计净买入超8200亿港元[4] - 美股三大股指续创新高,标普500涨0.4%报6388.64点,纳指涨0.24%报21108.32点[18] - 银行理财市场存续规模达30.67万亿元,较年初增加2.38%[10] - 本周基金累计卖出债券超2000亿元,7月24日单日卖债近1000亿元[20] 行业动态 - 上海第六批集中供地成交289.57亿元,徐汇宅地单价突破20万元/平方米[11] - 刚果寻求制定促进国内钴矿加工的价格政策,该国产量占全球四分之三[11] - 36个车型辅助驾驶测试全部未通过15类高危场景[10] - 人身保险产品预定利率研究值为1.99%,多家险企将自9月起调整新备案产品利率[10] - 充电宝及电芯企业8756张CCC证书被暂停,609张被撤销[10] 科技创新 - 宇树科技发布人形机器人"Unitree R1",售价3.99万元起,重量约25Kg[13] - 阿里巴巴开源千问3推理模型,性能比肩Gemini-2.5 pro等顶级闭源模型[14] - 阶跃星辰发布第三代基础大模型Step3,全年收入目标10亿元[14] - 特斯拉Optimus今年产量仅数百台,远低于2025年5000台目标[14] - 三星电子与OpenAI等洽谈合作,计划在Galaxy设备整合更多AI服务[14] 商品市场 - COMEX黄金期货跌1.04%报3338.50美元/盎司,白银期货跌2.29%[23] - 美油跌1.45%报65.07美元/桶,布油跌1.11%报67.60美元/桶[23] - LME期铜跌0.82%,期镍跌1.29%,期锡跌1.4%[23] - 大商所将上线线型低密度聚乙烯等首批现金交割期货[22] - 广期所推进光伏组件期货研发,有望年内上市铂、钯和氢氧化锂期货[22] 公司公告 - 中国中免上半年净利润26亿元同比下降20.81%[8] - 东山精密子公司拟投建10亿美元高端印制电路板项目[8] - 西部黄金拟16.55亿元收购新疆美盛100%股权[8] - 亿田智能拟设立私募基金投向人工智能、算力等领域[8] - 金桥信息拟定增募资6.33亿元用于AI研发项目[9]