Workflow
国产大模型
icon
搜索文档
中国人工智能产业快速发展 国产大模型成为“全球顶流”
人民日报海外版· 2025-10-22 10:21
行业规模与全球地位 - 中国人工智能企业数量超过5100家 [1] - 中国已发布大模型数量位居全球首位 [1] - 国产大模型在全球知名AI开源社区HuggingFace榜单前10名中占据9席 [1] - 日均Token消耗量从2024年初的1000亿增长至2025年6月底的30万亿,1年半时间增长300多倍 [1] 技术创新与性能突破 - 快手视觉生成大模型“可灵AI”上线一年用户规模突破2200万,其视频生成模型占据全球约30%用户份额 [2] - 阿里通义共开源300多个模型,全球下载量突破6亿次,衍生模型超17万个 [3] - 阿里云AI基础设施在全球29个地域设有91个可用区 [3] - Qwen3系列模型以不到1/3的参数量实现同等顶尖性能 [3] - 国产大模型技术在语言、视觉、多模态等领域持续突破,实现多模态统一 [3][4] 应用场景与效率提升 - 京东物流大模型赋能全球超500个仓库,机器人决策从“被动响应”升级到“主动预测” [5] - 百度文心大模型支持国家电网推出“光明电力大模型”,推广无人机巡检年巡检杆塔500万基,减少人工登塔次数40% [6] - 中国移动九天大模型具备工业领域高阶视觉能力,满足工业生产需求 [6] - 腾讯混元原生多模态生图模型“混元图像3.0”在国际大模型竞技场LMArena最新文生图榜单中位居第一 [9] - 腾讯混元3D模型获得拓竹科技、创想三维等头部3D打印厂商青睐 [9] 产品生态与市场拓展 - 腾讯形成覆盖通用大语言模型和多模态生成及理解模型的丰富产品体系 [9] - 中国移动成功打造数万卡智算集群、数万亿Tokens高质量数据集和万亿参数AI大模型 [10] - 百度飞桨文心生态服务企业超过76万家,向化工、医疗、农业、物流等产业纵深渗透 [11] - 360智能体工厂支持通过自然语言定义智能体,满足政府和企业数字化转型需求 [11] 数据资源与发展趋势 - 国内多数模型训练使用的中文数据占比已超过60%,部分模型达到80% [7] - 大模型行业未来呈现推理能力提升、推理算力成本降低、应用转向开源生态等趋势 [11]
第六届1024资管科技开发者大会在上海临港新片区举办
新浪财经· 2025-10-18 23:18
大会概况 - 第六届1024资管科技开发者大会于10月17日在上海临港中心举办 [1] - 大会是全球资产管理中心上海国际活动周2025系列重要活动之一 [1] 报告发布 - 《上海全球金融科技中心建设资产管理垂直领域大模型开发与应用报告2025》在大会上正式发布 [1] - 报告包含国产大模型在资产管理领域的应用实践 兼具技术深度与行业实践视角 [1] - 报告内容汇集从技术解析到场景落地等方面 [1] 产业活动启动 - “滴水智汇”智能投研&人工智能+产业发展系列活动同步启动 [1] - 活动将围绕智能汽车、高端装备、集成电路、民用航空和数字经济“4+1”临港主导产业重点场景展开 [1] - 活动旨在搭建“产业研究+场景路演+闭门研讨+联合倡议”的常设平台 [1] 闭门研讨 - 会前60余位专家参加了“临港新片区金融科技集聚区发展座谈会” [2] - 座谈会聚焦“打造标杆性金融科技集聚区”核心目标 [2] - 座谈会围绕产业协同、融资发展、跨境数据流动、算力基建、离岸金融场景等关键议题展开深入交流 [2] - 座谈会旨在推动金融科技资源集聚、技术创新与产业落地 助力上海全球金融科技中心建设 [2]
A股盘前播报 | 金银疯涨齐新高!黄金首次突破4300美元 美地区银行爆雷引发抛售
智通财经网· 2025-10-17 08:47
贵金属市场 - 黄金价格连续第四个交易日创盘中新高,首次突破4300美元大关 [1] - COMEX 12月白银期货盘中曾涨破53.60美元,日内涨幅超过4% [1] - 美国政府关门、贸易紧张形势、美联储降息预期是近期贵金属价格上涨的主要推动因素 [1] 银行业动态 - 美国多家中型银行曝出贷款欺诈事件,引发市场对信贷质量和资产透明度的担忧 [2] - 美国地区性银行板块遭遇重挫,74家最大银行市值单日蒸发超过1000亿美元 [2] 科技与算力产业 - 工信部组织开展城域"毫秒用算"专项行动,旨在构建高速大容量、低时延、广覆盖的城域算力网络 [3] - 中信证券认为国产大模型加速迭代,建议重视国产算力的投资机遇 [3] - 2024年全球VR与MR头戴设备出货量约为960万台,同比增长8.8% [11] 地缘政治与贸易 - 美国总统特朗普与俄罗斯总统普京进行了长时间通话,主要讨论结束俄乌冲突及俄美贸易议题 [4] - 特朗普表示可能会在未来两周内与普京会面,并称会谈取得很大进展 [4] 机构观点汇总 - 招商证券认为市场短期调整不可避免但仍有韧性,建议关注军工、新消费等低位赛道 [6] - 德邦证券指出市场缩量反映避险情绪,短期以红利为代表的价值板块表现可能持续占优 [7] - 东方证券维持科技股是市场主线的判断,认为短期调整不会改变市场盘升趋势 [8] 新能源与前沿技术 - 我国科学家攻破固态电池关键难题,助力续航里程实现翻倍 [9] - 兴业证券预计2025年固态电池商业化落地进程加速,有望开拓低空、机器人和数据中心等新兴市场 [9] - 国家能源局公示41个氢能试点项目,推动氢能技术创新和产业布局 [10] 公司业绩与公告 - 容知日新前三季度净利润同比预增871.3%至908.09% [12] - 福耀玻璃前三季度净利润同比增长28.93% [14] - 广晟有色因稀土市场行情整体上涨,预计前三季度净利润同比扭亏为盈 [14] - 今创集团股东中国轨道拟减持不超过3%公司股份 [14] - 行动教育股东拟合计减持不超过230万股公司股票 [14]
大模型加速迭代 国产算力迎机遇
证券时报网· 2025-10-09 09:29
国产AI算力生态进展 - 2025年国庆期间,工商银行与中国联通公布合计百亿规模的服务器招标结果,国产算力供应商中标占比超过90% [1] - 阿里发布大模型Qwen3-VL-30B-A3B并获得华为昇腾0 day支持,腾讯混元最新视觉模型在LMArena榜单中位列全球第三 [1] 国产AI技术与生态闭环 - 国产大模型正加速迭代,国产算力芯片实现无缝适配,形成生态闭环,推动国产AI持续发展 [1] - 2025年第二季度,尽管海外AI芯片因地缘政治受限,阿里等云厂商资本支出仍保持高速增长 [1] 行业前景与增长动力 - 国产AI芯片持续迭代,自主可控进展顺利,保障了算力基础设施的持续扩张 [1] - 国内云厂商展现出加速追赶北美AI厂商的决心,预计更多云厂商将跟进投入,带动国内算力重回高速增长轨道 [1]
港股概念追踪 | DeepSeek线上模型升级至V3.1-Terminus!算力与应用板块或迎价值重估(附概念股)
智通财经网· 2025-09-23 07:27
DeepSeek-V3.1-Terminus版本升级 - 深度求索正式升级DeepSeek-V3.1至DeepSeek-V3.1-Terminus版本 优化语言一致性与Agent能力 缓解中英文混杂及异常字符问题 提升Code Agent与Search Agent表现 [1] - 新模型各领域测评结果如下:MMLU-Pro从84.8提升至85.0 GPQA-Diamond从80.1提升至80.7 Humanity's Last Exam从15.9提升至21.7 LiveCodeBench从74.8提升至74.9 Codeforces从2091降至2046 Aider-Polyglot从76.3降至76.1 [1] - Agent测评表现提升:BrowseComp从30.0提升至38.5 BrowseComp-zh从49.2降至45.0 SimpleQA从93.4提升至96.8 SWE Verified从66.0提升至68.4 SWE-bench Multilingual从54.5提升至57.8 Terminal-bench从31.3提升至36.7 [1] - 官方App、网页端、小程序与API模型均已同步更新为DeepSeek-V3.1-Terminus [1] 学术研究与国际认可 - DeepSeek团队研究论文登上《自然》期刊封面 打破主流大模型未经独立同行评审的空白 [2] - 8月21日发布的DeepSeek-V3.1实现混合推理架构 同时支持思考模式与非思考模式 具有更高思考效率和更强Agent能力 [2] 国产算力生态与产业链影响 - DeepSeek V3.1采用UE8M0 FP8格式 专为下一代国产芯片设计 解决与英伟达FP8标准兼容性问题 推动国产算力生态自主化 [2] - 英伟达H20芯片停产使国内算力替代需求迫切 国产算力板块获推荐 [2] - DeepSeek V3.1发布带动国产算力产业链标的大幅上涨 未来训练与推理有望更多应用国产AI芯片 加速国产算力生态建设 [3] - 大模型训推带动AI算力需求增长 GB300、Vera Rubin等新一代算力架构将推出 AI芯片、服务器整机、铜连接、HBM、液冷、光模块、IDC等环节持续受益 [4] 开源模式与行业趋势 - DeepSeek成功推动国产大模型走向分水岭 更多中国公司转向开源路线 重点重新转向模型优化与更新迭代 [3] - 7月底国产大模型迎来开源"井喷潮":阿里连续发布4款开源模型 腾讯开源混元3D世界模型1.0 智谱发布GLM-4.5 阶跃星辰开源Step-3 [3] 相关企业动态与产品进展 - 百度文心大模型X1.1正式发布 事实性提升34.8% 指令遵循提升12.5% 智能体提升9.6% 在多个基准评测中超越DeepSeek R1-0528 与GPT-5和Gemini 2.5 Pro效果持平 [6] - 阿里巴巴通义千问推出Qwen3-Max-Preview模型 成为系列最强大语言模型 国产大模型企业进入全球第一梯队 [6] - 商汤"日日新"大模型接入小米AI眼镜 实现全双工实时音视频交互能力 推动智能硬件交互范式发展 [7] - 中兴通讯推出多款AI一体机产品:AiCube训推一体机助力企业部署DeepSeek大模型 5G UniEngine算网一体机支撑行业应用 智海AI教育一体机实现国产算力与DeepSeek适配 Common Edge一体机用于5G边缘计算 [7] 半导体与ETF投资机会 - 亚太精选ETF(159687)包含亚太优质红利资产和半导体龙头企业 丰田汽车、腾讯控股、阿里巴巴、三菱集团等提供稳健收益 台积电、三星、东京电子、联发科等半导体企业占比显著 亚太地区半导体产业收入占全球57.6% [5]
2025年第37周计算机行业周报:Qwen3-Next开源发布有望加速AI应用落地-20250916
长江证券· 2025-09-16 17:46
行业投资评级 - 投资评级为看好 维持[7] 核心观点 - 计算机板块经历大幅回调后反弹 上周上涨3.47% 在长江一级行业中排名第6位 两市成交额占比7.79%[2][4][16] - Qwen3-Next开源发布实现模型架构突破 800亿参数仅激活30亿参数 训练成本大幅降低 推理效率提升7-10倍[6][34][37] - 交通强国建设试点指引发布 涵盖16个申报领域和52个申报方向 重点关注交通信息化和智能化改造机遇[11][21][24][26] - 商务部启动对美国集成电路领域反歧视调查 涵盖2018年以来美对华芯片限制措施 利好国产AI芯片产业发展[11][27][31][32][33] 上周市场表现 - 上证综指报收3870.60点 整体上涨1.52%[4][16] - 计算机板块算力相关标的活跃 淳中科技上涨52.91% 开普云上涨36.96% 杰创智能上涨20.40% 中科曙光上涨18.84%[18][19] - 板块成交额表现:9月8日1651亿元 9月9日1490亿元 9月10日1432亿元 9月11日10259亿元 9月12日9178亿元[17][20] 重点投资方向 - 中国推理算力产业链 重点推荐寒武纪[2][6][33] - 阿里云产业链[2][6] - 云服务厂商[2][6] - IDC领域 重点关注与腾讯 阿里 字节等大厂合作的IDC厂商[2][6] - 交通信息化领域 关注具备技术储备和低空 车路云布局的公司[21][26] - 国产AI芯片全产业链[27][33] 技术突破详情 - Qwen3-Next采用Gated DeltaNet混合注意力机制(75%层使用Gated DeltaNet 25%保留标准注意力)[35] - 采用高稀疏度MoE架构 总参数量800亿 推理仅激活约30亿参数 专家数扩展到512个(10路由专家加1共享专家)[35] - 引入Multi-Token Prediction机制 提升推理效率[35] - 训练成本大幅降低:Base模型训练所需GPU Hours不到Qwen3-30A-3B的80% 仅需Qwen3-32B的9.3%计算资源即取得更优性能[37] - 模型性能表现:MMLU得分84.72 MMLU-Pro得分66.05 BBH得分87.13 MATH得分62.36[41]
AI产业跟踪:Qwen3Next开源发布,大幅降本有望加速AI落地
长江证券· 2025-09-14 22:38
行业投资评级 - 行业评级为看好 并维持该评级 [7] 核心观点 - 阿里于9月12日发布下一代基础模型架构Qwen3-Next 并开源基于该架构的Qwen3-Next-80B-A3B系列模型 [2][4] - Qwen3-Next在模型架构上实现重大突破 展现出国产大模型性能和技术持续向世界领先水平演进 [2][9] - 该模型在性能提升的同时大幅降低训练成本 有望加速国产AI应用落地进程并推动算力需求爆发 [2][9] - 建议关注中国推理算力产业链 阿里云产业链 云服务厂商和IDC等投资方向 [2][9] 模型架构创新 - 采用混合注意力机制:引入Gated DeltaNet并采用3:1混合策略 75%层使用Gated DeltaNet 25%层保留标准注意力 兼顾性能与效率 [9] - 采用高稀疏度MoE结构:总参数量达800亿 但每次推理仅激活约30亿参数 扩展到512个总专家 采用10路由专家加1共享专家组合设计 [9] - 进行稳定性优化:采用Zero-Centered RMSNorm 对norm weight施加weight decay 初始化时归一化MoE router参数 [9] - 引入多token预测机制:采用原生Multi-Token Prediction机制 得到Speculative Decoding接受率较高的MTP模块 [9] 性能提升数据 - Base模型拥有800亿参数仅激活30亿参数 实现与Qwen3-32B dense模型相近甚至略好性能 [9] - 训练所需GPU Hours不到Qwen3-30A-3B的80% 相比Qwen3-32B仅需9.3%的GPU计算资源就能取得更优性能 [9] - 推理效率大幅提升:在4k tokens上下文长度下 吞吐量接近前者的7倍 当上下文长度超过32k时 吞吐提升达到10倍以上 [9] 开源策略影响 - 模型已在魔搭社区和HuggingFace开源 开发者使用门槛显著降低 加速技术传播和应用 [9] - 有助于构建开放协作社区 促进技术持续创新 加速国产大模型在技术和性能上的突破 [9] 投资建议关注领域 - 中国推理算力产业链 重点推荐国内AI芯片领军企业寒武纪 [2][9] - 阿里云产业链 [2][9] - 云服务厂商 [2][9] - IDC 重点关注与腾讯 阿里 字节等大厂合作的IDC [2][9]
Claude不让我们用!国产平替能顶上吗?
机器之心· 2025-09-07 16:21
全球AI代码生成竞争格局变化 - Anthropic市场地位受到挑战 因OpenAI GPT-5系列模型在代码能力方面表现强势 且Anthropic自身出现模型降智和地区服务限制问题[1] 国产大模型技术突破 - 月之暗面Kimi-K2-0905版本将上下文长度扩展到256k 针对前端开发等编程任务优化 提升长代码生成正确性、稳定性和逻辑一致性[2] - 阿里发布超万亿参数Qwen3-Max-Preview模型 提升通用知识、数学推理和编程等多任务表现[2] - Kimi-K2-0905采用MoE架构 总参数1万亿 推理时激活参数320亿 在SWE-bench Verified等编程基准测试中部分表现超过Claude Sonnet 4[6][7] 国产大模型实际应用表现 - Kimi-K2-0905在Hugging Face平台近30天下载量超过39万次[3] - 模型工具调用格式正确率达100% 完全兼容Anthropic API 支持WebSearch Tool实时信息检索[2] - 在"鞭炮连锁爆炸测试"中能生成超一千行代码 前端水平显著提升[15] - 成功生成完整网页游戏代码 实现星空背景、移动拖影、回血道具和爆炸效果等复杂功能[11][13] 国产大模型价格优势 - Kimi-K2-0905 API定价为缓存未命中时每百万输入tokens/4元 缓存命中时每百万输入tokens/1元 每百万输出tokens/16元[17] - 美元计价分别为输入缓存命中0.15美元 缓存未命中0.60美元 输出2.50美元每百万tokens[18] - 相比Anthropic定价更具竞争力 成为Claude Code平替方案[18] 国产AI发展路径分化 - 腾讯和字节等厂商聚焦产品侧更新 如发布CodeBuddy IDE和Trae Solo版本[21] - 月之暗面等AI新势力专注技术创新 通过扩展上下文窗口和优化工具调用等功能提升核心模型能力[22] - 国内模型已接入Cursor、Windsurf等主流AI编程工具 深度融入开发生态[23]
5G通信ETF(515050)连续4日吸金5.51亿元,资金逆市布局光模块+PCB算力方向
每日经济新闻· 2025-09-03 10:37
市场表现 - A股早盘震荡调整 AI算力方向延续回调 5G通信ETF跌0.89% 成交额突破1.6亿元[1] - 部分持仓股逆市走强 包括源杰科技 紫光股份 中科创达 芒果超媒 深南电路[1] - 资金逆市布局光模块CPO+PCB算力方向 5G通信ETF近4个交易日吸金超5.5亿元 规模达90亿元[1] - 创业板人工智能ETF华夏近10日吸金超3亿元 为同类费率最低产品[1] 行业趋势 - 全球AI大模型领域竞争白热化 推动大模型应用落地普及 拉动AI算力市场持续高景气[1] - 英伟达和阿里云营收强劲增长 表明全球AI算力需求持续旺盛[1] - 国产大模型DeepSeek-V3.1等发布 推动国产大模型从"可用"到"好用" 加快应用端落地普及[1] - 促进大模型产业链软硬件协同发展 提高国产AI芯片市场竞争力[1] 企业动态 - 阿里巴巴AI相关收入继续保持三位数增长[2] - 阿里云营收强劲增长[1] - 英伟达营收表现强劲[1] 投资观点 - 持续看好AI产业发展 建议关注AI主题投资机会[1] - 国内外CSP厂商对算力投资保持强劲增长[2] - AI商业化落地路径清晰 打消投资者对AI投资回报担忧[2] - 持续推荐算力板块 包括海外算力链和国产算力链[2]
中芯国际2025H1归母净利润增长约四成!科创人工智能ETF华夏(589010)短线调整吹响“集结号”!
每日经济新闻· 2025-08-29 10:11
ETF表现与交易 - 科创人工智能ETF华夏(589010)盘中下跌2.73% 较盘初最大跌幅3.97%有所收窄 可视为对前期暴涨的合理消化 [1] - 该ETF成交金额超2500万元 市场交投活跃 昨日获资金净流入3240万元 近5个交易日累计净流入1.19亿元 [1] 成分股表现 - 持仓股中航天宏图领涨16.60% 奇安信领跌6.69% 恒玄科技下跌6.31% 寒武纪下跌6.17% 合合信息与安路科技跌幅均超4% [1] 晶圆代工行业 - 中芯国际2025年上半年营业收入323.48亿元 同比增长23.1% 归母净利润23.01亿元 同比增长39.8% [1] - 中芯国际位列全球第二大纯晶圆代工厂 行业头部效应持续强化 呈现"强者恒强"格局 [1] AI产业发展 - AI被认定为新一轮科技革命与产业变革的核心驱动力 国产大模型与芯片协同演进 DeepSeek-V3.1采用专为国产芯片设计的参数精度 [2] - 政策持续支持AI应用落地 国内AI产业有望加速发展 形成从基础设施到大模型再到应用的完整闭环 [2] ETF投资价值 - 科创人工智能ETF紧密跟踪上证科创板人工智能指数 覆盖全产业链优质企业 具备高研发投入特征且受政策红利支持 [2] - ETF设置20%涨跌幅机制 结合中小盘股特性 有助于捕捉AI产业突破性发展机遇 [2]