千问3推理模型

搜索文档
赛道Hyper | 追平全球顶级:千问3推理模型开源
华尔街见闻· 2025-08-06 16:06
模型技术特点 - 阿里巴巴开源千问3推理模型采用混合专家MoE架构,总参数达480B(4800亿),原生支持256K token上下文并可扩展至1M长度,显著提升编程任务效率 [1] - MoE架构通过分工协作提升性能并控制计算成本,适用于千亿级以上参数规模模型,实现效率与复杂需求的平衡 [1] - 模型在知识储备、编程能力、数学运算等维度与Gemini-2.5 pro、o4-mini等全球顶级闭源模型水平相当 [1][3] - 支持256K上下文长度,可处理长篇文档和多轮对话,避免关键信息丢失,在复杂问题拆解分析、流畅度和精准度方面较前代明显提升 [3] - Qwen3-235B-A22B-Instruct-2507(非思考版)在GPQA知识测评、AIME25数学测评中成绩超过Claude4等闭源模型 [3] - 训练使用36T tokens数据集覆盖书籍、代码库等多类型数据,通过多轮强化学习整合非思考与思考模型优化综合性能 [9] 性能表现与行业地位 - 在知识测评(SuperGPQA)、编程能力测评(LiveCodeBench v6)中表现接近顶尖闭源模型,在开源模型中处于前列 [3][4] - Qwen3-Coder在多语言SWE-bench测试中超过GPT4.1和Claude4,登顶HuggingFace模型总榜,该榜单综合下载量、使用频率和用户评分排名 [4][5] - 阿里已开源300余款通义大模型,衍生模型数量超过14万个,超过Meta的Llama系列,成为全球最大开源模型家族 [5] - 截至7月25日,千问API调用量在OpenRouter平台突破1000亿Tokens,包揽全球趋势榜前三,反映其受欢迎程度 [6] 实际应用与行业影响 - 程序员借助模型生成基础品牌官网最快仅需5分钟,新入行程序员效率可达到资深程序员一周工作量 [5] - 衍生模型经开发者微调后应用于教育、金融、医疗等行业,例如教育领域生成个性化习题,金融领域进行风险评估 [6] - 模型在法律行业可辅助审查长篇合同并提炼条款风险点,在科研领域快速抓取论文核心内容,节省人工时间 [7] - 开源模型允许中国企业免费商用,降低中小企业AI应用门槛,同时向美国、法国、德国等国家开放,推动技术全球普及 [6] 技术生态与商业协同 - 企业常将模型与阿里云数据库、安全服务打包采购,形成生态闭环,提升云产品使用深度与客户粘性 [6][7] - 模型开源属性降低使用成本,吸引中小开发团队,同时带动对GPU资源和IaaS服务的持续需求 [6][7] - Qwen3-Coder吸引二次开发,开发者添加特定行业代码库(如金融科技)并优化响应速度,适应实时编程场景 [10] - 通义大模型家族推动AI技术从实验室走向实际生产,为各行业提升效率 [10]
AI应用概念上扬,易点天下20%涨停,慧博云通等大涨
证券时报网· 2025-07-31 14:07
AI应用概念股表现 - 易点天下20%涨停 [1] - 慧博云通涨超16% [1] - 用友网络涨停 [1] - 南兴股份涨停 [1] - 三六零涨超8% [1] - 值得买涨超8% [1] 国内AI模型技术进展 - 阿里巴巴开源千问3推理模型 支持256K上下文长度 在知识、编程、数学、人类偏好对齐、创意写作、多语言能力等核心能力可比肩Gemini-2.5 pro和o4-mini闭源模型 [1] - 阶跃星辰发布新一代基础大模型Step3 主打多模态推理能力 推理效率创行业新高 计划7月31日向全球开源 [1] - 阿里Qwen模型三连开源 阶跃星辰Step3大幅提升推理效率 国产模型能力持续向上 [2] AI编程工具市场动态 - GitHub Copilot 2024年12月约实现4亿ARR [2] - Cursor已突破5亿ARR [2] - Windsurf在2025年4月突破1亿ARR [2] - 字节TRAE、阿里通义灵码AI IDE、腾讯CodeBuddy IDE等大厂产品入局AI IDE赛道 [2] - 字节7月26日开源Coze 国内AI应用场景有望加速 [2]
阿里通义大模型迎“周年庆”:一周开源4款模型
南方都市报· 2025-07-29 20:23
"三年前,在世界人工智能大会(WAIC)上,我们正式发布了通义大模型,并承诺将核心模型开源开放。 如今,通义千问已实现全尺寸、全模态的全面开源,真正打破了开源与闭源模型之间的技术壁垒。"7月 27日在WAIC期间举办的阿里云Agent应用生态论坛上,阿里云副总裁、大数据和智能实验室负责人叶杰 平这样总结阿里的开源进程。 与此同时,南都N视频记者关注到,近一周,包括7月28日发布并开源的视频生成模型通义万相 Wan2.2,阿里已接连发布和开源4款重磅大模型。 后接受媒体采访时表示,开源让阿里在参与全球市场竞争时清楚地知道自己的生态位在哪里,全球开发 者都会众测然后给到反馈和信息,这些信息无论是数据还是bad case都比商业世界里面来得更直接,也 让模型可以迭代得更快。 数据显示,截至目前,通义千问在全球主要模型社区的下载量已经突破4亿,衍生模型突破14万个,超 越Meta的Llama系列成为全球第一的开源模型家族。 此前一周,阿里一口气发布了3个模型,发布后模型快速斩获基础模型、编程模型和推理模型等主流领 域全球开源冠军。 其中,千问3最新版基础模型(非思考版),被权威AI研究机构Artificial Ana ...
大模型技术呈“指数级跃迁” 概念股成交活跃
证券时报· 2025-07-29 01:59
AI模型技术发展 - AI模型技术正经历从"渐进式创新"到"指数级跃迁"的历史性转变 [1] - OpenAI计划最早在8月初发布新版本旗舰大模型GPT-5,并推出mini和nano版本 [1] - 阿里巴巴开源三款大模型,分别为千问3最新版基础模型、千问3推理模型和AI编程模型Qwen3-Coder [1] - 阶跃星辰发布新一代基础大模型Step 3,将于7月31日面向全球企业和开发者开源 [1] Step 3模型性能 - Step 3在国产芯片上的推理效率最高可达DeepSeek-R1的300% [2] - 在NVIDIA Hopper架构芯片上,Step 3相较于DeepSeek-R1的吞吐量提升超70% [2] AI大模型应用 - 制造业企业利用大模型预测需求波动,有效缩短产品库存周期 [3] - 农业领域大模型结合卫星遥感、气象数据和种植经验,提升农作物产量 [3] - 服务业领域大模型在金融、政务、医疗等行业广泛应用,重构生产力体系 [3] - 中国已经有433款大模型完成备案,上线提供服务 [3] 市场规模 - 2023年中国AI大模型市场规模为141亿元,较上年增长83.92% [3] - 2024年中国AI大模型市场规模达到294亿元,预计到2025年将达到495亿元 [3] 概念股表现 - 今年以来AI大模型概念股平均上涨21%,跑赢同期上证指数 [4] - 7股累计涨幅超50%,包括宏景科技、中科金财、天阳科技等 [4] - 7月以来AI大模型概念股日均成交额为5.17亿元,环比增长16.18% [4] - 11股日均成交额环比翻倍,如三人行、金现代、拓尔思等 [4] 个股动态 - 三人行7月以来日均成交2.78亿元,环比增长319.39% [4] - 金现代7月以来日均成交3.72亿元,环比增长281.09% [5] - 7月以来融资净买入超1000万元的AI大模型概念股有34只,其中6股获融资净买入超1亿元 [5] - 润和软件融资净买入额3.24亿元,排在首位 [5]
阿里云副总裁最新发声!
证券时报网· 2025-07-27 17:03
AI技术发展现状 - AI模型技术正经历从"渐进式创新"到"指数级跃迁"的转变,大模型呈现"周级迭代"爆发态势 [1] - 技术变革由三大核心要素驱动:数据爆炸(互联网时代数据指数级增长)、算力飞跃(CPU→GPU→专用AI芯片)、算法突破(Transformer架构实现性能质变) [1] - 通义千问开源模型家族全球下载量突破4亿,衍生模型达14万个,超越Meta Llama成为全球第一开源模型 [2] 开源生态与产业应用 - 通义大模型已深度赋能金融、制造、教育等行业明星客户 [2] - 开源降低技术门槛,开发者平等参与创新,企业无忧采用前沿成果,形成"开源-反馈-进化"正向循环 [2] - 阿里云AI相关收入连续七个季度保持三位数增长,云计算业务因AI驱动上季度增速达18% [5] AI Agent技术突破 - AI技术范式从语言能力转向任务执行,2025年为Agent落地元年,企业级智能体突破对话层局限 [3] - Agent采用"感知-决策-执行"一体化架构,推动AI从增强搜索向自主服务载体跃迁 [3] - L3智能体将成为产业基座,实现涌现智能与生态自组织驱动的生产力革命 [3] 公司战略与产品进展 - 阿里发布三款冠军大模型:千问3基础模型(全球最智能非思考基础模型)、推理模型(比肩Gemini2 5pro)、Qwen3-Coder编程模型(超越GPT4 1) [5] - 公司宣布未来三年投入超3800亿元建设云和AI硬件基础设施,投资额超过去十年总和 [5]
(经济观察)中国模型开源“接二连三” 开辟全球AI发展新路径
中国新闻网· 2025-07-26 20:41
中国科技公司模型开源动态 - 阿里巴巴在7月21日至25日期间连续开源三款AI模型:Qwen3-235B-A22B-Instruct-2507(非思考版)在测评中超越Claude4(非思考版)等闭源模型 Qwen3-Coder编程模型性能接近全球最强的Claude4 千问3推理模型扩展了大模型推理极限 [1] - 月之暗面于7月11日推出并开源Kimi K2模型 该模型采用MoE架构 总参数量1万亿 激活参数约320亿 以智能体潜能和编码能力见长 [1] - 阶跃星辰在7月25日发布新一代基础大模型Step3 这是其首个全尺寸 原生多模态推理模型 计划于7月31日面向全球开源 [1] - 自今年1月深度求索推出开源大模型DeepSeek-R1以来 中国科技企业持续推进开源战略 [1] 开源战略的行业影响 - 通义千问衍生模型已突破14万个 超越Meta公司的Llama系列成为全球第一的开源模型家族 [3] - 一汽集团 中国石油 建设银行 平安集团 南方航空 小鹏汽车等行业头部企业已接入千问AI编程模型 [3] - 开源技术的生态赋能效应已覆盖制造 金融 医疗等多个核心领域 形成"技术开源—场景迭代—生态培育—市场验证"的良性循环 [3] 开源模式的国际比较 - 中国科技企业的开源战略标志着中国在人工智能发展路径上走出一条与美国截然不同的道路 通过开源推动全球AI技术普惠化 培育开放包容的产业生态 [2] - 中国倡导"开源生态+闭源核心"混合模式 强调技术共享与商业价值的平衡 通过生态协作做大市场蛋糕 [2] - 当美国科技巨头纠结于"开源还是闭源"的零和博弈时 中国已通过开源构建起"技术共享 生态共建 价值共创"的新范式 [3]
早报 (07.26)| 纳指、标普又创新高!大规模裁员,芯片巨头股价下挫;证监会再发声
格隆汇· 2025-07-26 08:23
特朗普关税政策 - 将发出近200封关税信函 部分税率10%或15% [2] - 美欧达成降关税协议概率50% 多数协议预计8月前完成 [2] - 考虑对俄罗斯实施次级制裁 [2] 美股市场表现 - 三大指数全线上涨 纳指涨0.24% 标普500涨0.4% 道指涨0.47% [3] - 科技股多数上涨 特斯拉涨3.52% 微软涨0.55%创历史新高 英特尔跌超8% [3] - 中概股多数下跌 纳斯达克中国金龙指数跌0.89% [4] 公司动态 - 英特尔Q2净亏损恶化 启动重组计划 裁员15% 取消欧洲数百亿美元建厂计划 [2] - 大众汽车Q2营业利润38.3亿欧元 同比下降29% [14] - 特斯拉人形机器人Optimus今年产量仅数百台 远低于2025年5000台目标 [15] 中国政策与市场 - 证监会部署下半年工作 推动中长期资金入市 推进公募基金改革 [8] - 上半年个人所得税7945亿元 同比增长8% [21][22] - 第三批690亿元支持消费品以旧换新资金已下达 [22] 科技与创新 - 阿里开源千问3推理模型 连续开源3款重磅模型 获三项全球开源冠军 [12] - 宇树发布双足机器人Unitree R1 售价3.99万元起 重量约25Kg [10] - 英伟达获准恢复向中国销售H20 GPU 传追加投片 [19] 大宗商品与外汇 - WTI原油跌1.35%至65.16美元/桶 布伦特原油跌1.07%至68.44美元/桶 [5] - 美元指数涨0.28%至97.6450 离岸人民币涨0.19%至7.1677 [7] - 黄金下挫近1% 三连跌 [5] 房地产与土地市场 - 上海徐汇宅地成交楼面价20.03万元/㎡ 刷新全国单价地王纪录 [26] - 多地出现"1元起拍"房产 6月共278套 主要来自山东威海 [27] 影视与文化产业 - 2025年电影票房突破320亿 [25] - 深圳扶持微短剧产业 单剧最高可获300万资助 [24]
陆家嘴财经早餐2025年7月26日星期六
Wind万得· 2025-07-26 06:31
政策动态 - 国务院常务会议部署逐步推行免费学前教育,要求各地细化工作方案并安排补助资金[2] - 证监会部署七大重点任务,包括巩固市场回稳态势、深化创业板改革、防控房企债券风险等[2] - 证监会拟修订《上市公司治理准则》,完善董事高管监管和激励约束机制[4] - 深交所表示将支持人工智能、量子信息等领域企业适用创业板第二套、第三套上市标准[6] - 国家数据要素综合试验区落地10个省市,加快探索数据市场化路径[5] 宏观经济 - 上半年全国财政收入11.56万亿元,税收连续3个月同比增长,财政支出14.13万亿元同比增长3.4%[3] - 上海上半年GDP达26222.15亿元,同比增长5.1%[5] - 第三批690亿元以旧换新补贴资金已下达,剩余690亿元将于10月下达[3] - 财政部表示2025年2万亿元置换债券已发行1.8万亿元,占全年额度90%[20] - 上半年国债发行7.88万亿元创历史新高,同比增长35.28%[20] 金融市场 - 周五A股调整,上证跌0.33%,科创50逆势涨2.07%,成交额1.82万亿元[4] - 恒生指数跌1.09%,南向资金净买入超200亿港元,年内累计净买入超8200亿港元[4] - 美股三大股指续创新高,标普500涨0.4%报6388.64点,纳指涨0.24%报21108.32点[18] - 银行理财市场存续规模达30.67万亿元,较年初增加2.38%[10] - 本周基金累计卖出债券超2000亿元,7月24日单日卖债近1000亿元[20] 行业动态 - 上海第六批集中供地成交289.57亿元,徐汇宅地单价突破20万元/平方米[11] - 刚果寻求制定促进国内钴矿加工的价格政策,该国产量占全球四分之三[11] - 36个车型辅助驾驶测试全部未通过15类高危场景[10] - 人身保险产品预定利率研究值为1.99%,多家险企将自9月起调整新备案产品利率[10] - 充电宝及电芯企业8756张CCC证书被暂停,609张被撤销[10] 科技创新 - 宇树科技发布人形机器人"Unitree R1",售价3.99万元起,重量约25Kg[13] - 阿里巴巴开源千问3推理模型,性能比肩Gemini-2.5 pro等顶级闭源模型[14] - 阶跃星辰发布第三代基础大模型Step3,全年收入目标10亿元[14] - 特斯拉Optimus今年产量仅数百台,远低于2025年5000台目标[14] - 三星电子与OpenAI等洽谈合作,计划在Galaxy设备整合更多AI服务[14] 商品市场 - COMEX黄金期货跌1.04%报3338.50美元/盎司,白银期货跌2.29%[23] - 美油跌1.45%报65.07美元/桶,布油跌1.11%报67.60美元/桶[23] - LME期铜跌0.82%,期镍跌1.29%,期锡跌1.4%[23] - 大商所将上线线型低密度聚乙烯等首批现金交割期货[22] - 广期所推进光伏组件期货研发,有望年内上市铂、钯和氢氧化锂期货[22] 公司公告 - 中国中免上半年净利润26亿元同比下降20.81%[8] - 东山精密子公司拟投建10亿美元高端印制电路板项目[8] - 西部黄金拟16.55亿元收购新疆美盛100%股权[8] - 亿田智能拟设立私募基金投向人工智能、算力等领域[8] - 金桥信息拟定增募资6.33亿元用于AI研发项目[9]