国产大模型

搜索文档
2025年第37周计算机行业周报:Qwen3-Next开源发布有望加速AI应用落地-20250916
长江证券· 2025-09-16 17:46
行业投资评级 - 投资评级为看好 维持[7] 核心观点 - 计算机板块经历大幅回调后反弹 上周上涨3.47% 在长江一级行业中排名第6位 两市成交额占比7.79%[2][4][16] - Qwen3-Next开源发布实现模型架构突破 800亿参数仅激活30亿参数 训练成本大幅降低 推理效率提升7-10倍[6][34][37] - 交通强国建设试点指引发布 涵盖16个申报领域和52个申报方向 重点关注交通信息化和智能化改造机遇[11][21][24][26] - 商务部启动对美国集成电路领域反歧视调查 涵盖2018年以来美对华芯片限制措施 利好国产AI芯片产业发展[11][27][31][32][33] 上周市场表现 - 上证综指报收3870.60点 整体上涨1.52%[4][16] - 计算机板块算力相关标的活跃 淳中科技上涨52.91% 开普云上涨36.96% 杰创智能上涨20.40% 中科曙光上涨18.84%[18][19] - 板块成交额表现:9月8日1651亿元 9月9日1490亿元 9月10日1432亿元 9月11日10259亿元 9月12日9178亿元[17][20] 重点投资方向 - 中国推理算力产业链 重点推荐寒武纪[2][6][33] - 阿里云产业链[2][6] - 云服务厂商[2][6] - IDC领域 重点关注与腾讯 阿里 字节等大厂合作的IDC厂商[2][6] - 交通信息化领域 关注具备技术储备和低空 车路云布局的公司[21][26] - 国产AI芯片全产业链[27][33] 技术突破详情 - Qwen3-Next采用Gated DeltaNet混合注意力机制(75%层使用Gated DeltaNet 25%保留标准注意力)[35] - 采用高稀疏度MoE架构 总参数量800亿 推理仅激活约30亿参数 专家数扩展到512个(10路由专家加1共享专家)[35] - 引入Multi-Token Prediction机制 提升推理效率[35] - 训练成本大幅降低:Base模型训练所需GPU Hours不到Qwen3-30A-3B的80% 仅需Qwen3-32B的9.3%计算资源即取得更优性能[37] - 模型性能表现:MMLU得分84.72 MMLU-Pro得分66.05 BBH得分87.13 MATH得分62.36[41]
AI产业跟踪:Qwen3Next开源发布,大幅降本有望加速AI落地
长江证券· 2025-09-14 22:38
行业投资评级 - 行业评级为看好 并维持该评级 [7] 核心观点 - 阿里于9月12日发布下一代基础模型架构Qwen3-Next 并开源基于该架构的Qwen3-Next-80B-A3B系列模型 [2][4] - Qwen3-Next在模型架构上实现重大突破 展现出国产大模型性能和技术持续向世界领先水平演进 [2][9] - 该模型在性能提升的同时大幅降低训练成本 有望加速国产AI应用落地进程并推动算力需求爆发 [2][9] - 建议关注中国推理算力产业链 阿里云产业链 云服务厂商和IDC等投资方向 [2][9] 模型架构创新 - 采用混合注意力机制:引入Gated DeltaNet并采用3:1混合策略 75%层使用Gated DeltaNet 25%层保留标准注意力 兼顾性能与效率 [9] - 采用高稀疏度MoE结构:总参数量达800亿 但每次推理仅激活约30亿参数 扩展到512个总专家 采用10路由专家加1共享专家组合设计 [9] - 进行稳定性优化:采用Zero-Centered RMSNorm 对norm weight施加weight decay 初始化时归一化MoE router参数 [9] - 引入多token预测机制:采用原生Multi-Token Prediction机制 得到Speculative Decoding接受率较高的MTP模块 [9] 性能提升数据 - Base模型拥有800亿参数仅激活30亿参数 实现与Qwen3-32B dense模型相近甚至略好性能 [9] - 训练所需GPU Hours不到Qwen3-30A-3B的80% 相比Qwen3-32B仅需9.3%的GPU计算资源就能取得更优性能 [9] - 推理效率大幅提升:在4k tokens上下文长度下 吞吐量接近前者的7倍 当上下文长度超过32k时 吞吐提升达到10倍以上 [9] 开源策略影响 - 模型已在魔搭社区和HuggingFace开源 开发者使用门槛显著降低 加速技术传播和应用 [9] - 有助于构建开放协作社区 促进技术持续创新 加速国产大模型在技术和性能上的突破 [9] 投资建议关注领域 - 中国推理算力产业链 重点推荐国内AI芯片领军企业寒武纪 [2][9] - 阿里云产业链 [2][9] - 云服务厂商 [2][9] - IDC 重点关注与腾讯 阿里 字节等大厂合作的IDC [2][9]
Claude不让我们用!国产平替能顶上吗?
机器之心· 2025-09-07 16:21
全球AI代码生成竞争格局变化 - Anthropic市场地位受到挑战 因OpenAI GPT-5系列模型在代码能力方面表现强势 且Anthropic自身出现模型降智和地区服务限制问题[1] 国产大模型技术突破 - 月之暗面Kimi-K2-0905版本将上下文长度扩展到256k 针对前端开发等编程任务优化 提升长代码生成正确性、稳定性和逻辑一致性[2] - 阿里发布超万亿参数Qwen3-Max-Preview模型 提升通用知识、数学推理和编程等多任务表现[2] - Kimi-K2-0905采用MoE架构 总参数1万亿 推理时激活参数320亿 在SWE-bench Verified等编程基准测试中部分表现超过Claude Sonnet 4[6][7] 国产大模型实际应用表现 - Kimi-K2-0905在Hugging Face平台近30天下载量超过39万次[3] - 模型工具调用格式正确率达100% 完全兼容Anthropic API 支持WebSearch Tool实时信息检索[2] - 在"鞭炮连锁爆炸测试"中能生成超一千行代码 前端水平显著提升[15] - 成功生成完整网页游戏代码 实现星空背景、移动拖影、回血道具和爆炸效果等复杂功能[11][13] 国产大模型价格优势 - Kimi-K2-0905 API定价为缓存未命中时每百万输入tokens/4元 缓存命中时每百万输入tokens/1元 每百万输出tokens/16元[17] - 美元计价分别为输入缓存命中0.15美元 缓存未命中0.60美元 输出2.50美元每百万tokens[18] - 相比Anthropic定价更具竞争力 成为Claude Code平替方案[18] 国产AI发展路径分化 - 腾讯和字节等厂商聚焦产品侧更新 如发布CodeBuddy IDE和Trae Solo版本[21] - 月之暗面等AI新势力专注技术创新 通过扩展上下文窗口和优化工具调用等功能提升核心模型能力[22] - 国内模型已接入Cursor、Windsurf等主流AI编程工具 深度融入开发生态[23]
5G通信ETF(515050)连续4日吸金5.51亿元,资金逆市布局光模块+PCB算力方向
每日经济新闻· 2025-09-03 10:37
市场表现 - A股早盘震荡调整 AI算力方向延续回调 5G通信ETF跌0.89% 成交额突破1.6亿元[1] - 部分持仓股逆市走强 包括源杰科技 紫光股份 中科创达 芒果超媒 深南电路[1] - 资金逆市布局光模块CPO+PCB算力方向 5G通信ETF近4个交易日吸金超5.5亿元 规模达90亿元[1] - 创业板人工智能ETF华夏近10日吸金超3亿元 为同类费率最低产品[1] 行业趋势 - 全球AI大模型领域竞争白热化 推动大模型应用落地普及 拉动AI算力市场持续高景气[1] - 英伟达和阿里云营收强劲增长 表明全球AI算力需求持续旺盛[1] - 国产大模型DeepSeek-V3.1等发布 推动国产大模型从"可用"到"好用" 加快应用端落地普及[1] - 促进大模型产业链软硬件协同发展 提高国产AI芯片市场竞争力[1] 企业动态 - 阿里巴巴AI相关收入继续保持三位数增长[2] - 阿里云营收强劲增长[1] - 英伟达营收表现强劲[1] 投资观点 - 持续看好AI产业发展 建议关注AI主题投资机会[1] - 国内外CSP厂商对算力投资保持强劲增长[2] - AI商业化落地路径清晰 打消投资者对AI投资回报担忧[2] - 持续推荐算力板块 包括海外算力链和国产算力链[2]
中芯国际2025H1归母净利润增长约四成!科创人工智能ETF华夏(589010)短线调整吹响“集结号”!
每日经济新闻· 2025-08-29 10:11
ETF表现与交易 - 科创人工智能ETF华夏(589010)盘中下跌2.73% 较盘初最大跌幅3.97%有所收窄 可视为对前期暴涨的合理消化 [1] - 该ETF成交金额超2500万元 市场交投活跃 昨日获资金净流入3240万元 近5个交易日累计净流入1.19亿元 [1] 成分股表现 - 持仓股中航天宏图领涨16.60% 奇安信领跌6.69% 恒玄科技下跌6.31% 寒武纪下跌6.17% 合合信息与安路科技跌幅均超4% [1] 晶圆代工行业 - 中芯国际2025年上半年营业收入323.48亿元 同比增长23.1% 归母净利润23.01亿元 同比增长39.8% [1] - 中芯国际位列全球第二大纯晶圆代工厂 行业头部效应持续强化 呈现"强者恒强"格局 [1] AI产业发展 - AI被认定为新一轮科技革命与产业变革的核心驱动力 国产大模型与芯片协同演进 DeepSeek-V3.1采用专为国产芯片设计的参数精度 [2] - 政策持续支持AI应用落地 国内AI产业有望加速发展 形成从基础设施到大模型再到应用的完整闭环 [2] ETF投资价值 - 科创人工智能ETF紧密跟踪上证科创板人工智能指数 覆盖全产业链优质企业 具备高研发投入特征且受政策红利支持 [2] - ETF设置20%涨跌幅机制 结合中小盘股特性 有助于捕捉AI产业突破性发展机遇 [2]
国产芯片替代加速!芯片ETF上涨4.76%,晶晨股份上涨12.88%
搜狐财经· 2025-08-27 13:27
市场表现 - A股三大指数集体上涨 上证指数盘中上涨0.44% [1] - 通信 电子 计算机板块涨幅靠前 美容护理和煤炭板块跌幅居前 [1] - 芯片科技股大幅走强 芯片ETF(159995 SZ)上涨4.76% [1] - 成分股晶晨股份上涨12.88% 澜起科技上涨11.00% 瑞芯微上涨10.00% 寒武纪上涨7.60% 兆易创新上涨6.87% [1] 行业趋势 - 中国AI服务器市场中外购芯片占比将从2024年63%下降至2025年42% [1] - 国产AI芯片政策支持下 智能芯片市场进入高速增长阶段 [1] - 华为海思和寒武纪等本土供应商市场份额预计2025年提升至40% [1] 技术发展 - DeepSeek-V3 1发布推动国产大模型从可用到好用 [1] - 加快国产大模型在应用端落地普及 [1] - DeepSeek-V3 1与国产AI芯片协同加深 [1] - 推动大模型产业链软硬件协同发展 [1] - 有利于提高国产AI芯片市场竞争力 [1] 产品信息 - 芯片ETF(159995)跟踪国证芯片指数 [2] - 30只成分股覆盖芯片产业材料 设备 设计 制造 封装和测试龙头企业 [2] - 成分股包括中芯国际 寒武纪 长电科技 北方华创等 [2] - 场外联接基金A类008887 C类008888 [2]
芯片股延续近期涨势 国产模型绑定国产芯片 机构看好国产芯片行情持续推进
智通财经· 2025-08-27 13:03
芯片股表现 - 中芯国际股价上涨5.52%至59.3港元 [1] - 晶门半导体股价上涨4%至0.52港元 [1] - 上海复旦股价上涨2.66%至34.7港元 [1] - 华虹半导体股价上涨2.26%至54.4港元 [1] 技术突破 - DeepSeek-V3.1版本采用UE8M0 FP8参数精度 [1] - UE8M0 FP8专为下一代国产芯片设计 [1] - 国产芯片有望实现大规模应用 [1] 国产芯片生态 - 沐曦690、芯原VIP9000、寒武纪690等新一代国产芯片均支持FP8格式 [1] - 摩尔线程MUSA 3.1 GPU与海光深算三号同样支持FP8 [1] 行业前景 - 国产AI芯片设计技术与制造工艺持续提升 [1] - 国产大模型发展推动对国产芯片的适配支持 [1] - 国产算力市占率有望持续增长 [1] - 国产芯片行情预计持续推进 [1]
港股异动 | 芯片股延续近期涨势 国产模型绑定国产芯片 机构看好国产芯片行情持续推进
智通财经网· 2025-08-27 10:39
芯片股市场表现 - 中芯国际股价上涨5.52%至59.3港元 [1] - 晶门半导体股价上涨4%至0.52港元 [1] - 上海复旦股价上涨2.66%至34.7港元 [1] - 华虹半导体股价上涨2.26%至54.4港元 [1] 技术升级与产品发布 - DeepSeek发布V3.1版本采用UE8M0 FP8参数精度 [1] - UE8M0 FP8精度针对下一代国产芯片设计 [1] 国产芯片产业动态 - 新一代国产芯片支持FP8精度包括沐曦690、芯原VIP9000、寒武纪690、摩尔线程MUSA 3.1 GPU及海光深算三号 [1] - 国产AI芯片设计技术及制造工艺持续提升 [1] - 国产大模型发展促进对国产芯片的适配与支持 [1] - 国产算力市占率有望持续提升 [1] - 国产芯片行情有望持续推进 [1]
阿里巴巴再调整集团业务;美团回应“退款未到账”丨新鲜早科技
21世纪经济报道· 2025-08-25 10:10
巨头动向 - 马斯克宣布xAI开源Grok 2.5模型 并计划六个月内开源Grok 3 同时Grok App图像生成速度提升且Vision模式向Android用户开放[2] - 华为云调整组织架构 聚焦"3+2+1"业务体系 涵盖通算、智算、存储、AI PaaS、数据库及安全业务[2] - 阿里巴巴重组业务架构 从六大业务集团收缩为四大类别:中国电商、国际商业、云智能及其他业务 饿了么并入中国电商 高德/菜鸟/文娱划归其他业务[2] 人工智能与自动驾驶 - 华为智能汽车解决方案BU宣布9月推送ADS 4与Harmony Space5 并指出中国汽车辅助驾驶渗透率五年达50%[3] - 周鸿祎称OpenAI开源是因中国大模型厂商逼迫 Deepseek等开源模型使开发成本趋近于零 全球开发者可自主运行AI模型[6][7] - 英伟达推出Spectrum-XGS以太网技术 支持跨区域扩展AI数据中心 解决高延迟与性能不可预测问题 构建十亿瓦级AI超级工厂[9] 企业资本运作 - 景旺电子拟投资50亿元建设珠海金湾基地扩产项目 聚焦AI算力/通讯/汽车智驾领域 税后投资回收期约7.5年[10] - 舜宇光学与歌尔股份签署谅解备忘录 拟通过股权置换持有歌尔光学约33.33%股权[11] - Databricks进行超10亿美元K轮融资 估值超1000亿美元 较八个月前增长超60% 资金用于加速AI战略与全球扩张[12] - 开普云拟现金收购南宁泰克半导体70%股权 新增存储产品业务[13] 企业运营与争议 - 美团回应"退款未到账"问题 成立专项团队修复信息滞后 称多数退款失败订单已转至用户余额[4] - 中兴通讯公告股票交易异常波动 声明生产经营正常且无未公开重大信息[5] - OPPO回应苹果窃密诉讼 称未发现员工存在违规行为 否认侵犯商业秘密并将配合法律程序[8]
科大讯飞上半年营收首破百亿!学习机业务增长翻番
搜狐财经· 2025-08-22 14:01
财务表现 - 2025年上半年营收首次突破百亿达109.11亿元 同比增长17.01% [1] - 销售回款首次突破百亿达103.61亿元 同比多增13.50亿元 [1] - 归母净利润-2.39亿元 同比减亏40.37% [1] - 经营活动现金流量净额增长超7.64亿元 同比提升49.73% [1] 技术研发进展 - 基于国产算力训练的深度推理大模型讯飞星火X1参数量70B 比业界同行少一个数量级 [2] - 多语言能力覆盖超130个语种 提供全栈自主可控大模型底座 [2] - 数学/翻译/推理/文本生成能力持续进步 幻觉治理准确率大幅领先主流模型 [2] - 医疗大模型MedBench综合得分95.4分位列第一 复杂医学推理等核心能力领先 [5] 生态平台建设 - 开放平台已开放813项AI能力 聚集超870万AI开发者团队 [3] - 开发超342万款生产级应用 大模型开发者达152万同比增长162% [3] - 大模型API日均调用量增长430% 保持开发者生态市占率领先 [3] 教育业务发展 - AI+教育收入同比增长23% 毛利同比增长25% [3] - 学习机业务上半年实现营收翻番增长 [3][5] - 学习机在高端领域保持销售额销量双第一 入选2025世界人工智能大会"镇馆之宝" [5] - 星火大模型作文盲测位居首位 数学成绩超140分 [3] 医疗业务拓展 - AI+医疗收入同比增长21% [5] - 智医助理覆盖697个区县超7.5万个基层医疗机构 [5] - 累计提供10.1亿次AI辅诊建议 识别不合理处方1.1亿份 [5] - 讯飞晓医APP完成超1.4亿次AI咨询 用户好评率98% [5] - 慢病管理系统覆盖10余省市120余重点区县 [5] 国际化进展 - 海外AI硬件同比增长超3倍 [6] - AI办公本在日本Makuake平台成为平板类历史销售额Top1 [6] - 韩国Wadiz平台2025年全品类TOP1 [6] - 向全球80多个国家展示AI+教育应用成果 [6] 战略定位 - 坚持在自主可控全国产算力底座上研发训练 综合能力处业界第一梯队 [2] - 构建算法/算力/数据自主可控的AI核心技术研究体系 [6] - 形成AI行业应用/开放平台/消费者产品三大商业化体系 [6]