国产大模型
搜索文档
国金证券:AI算力仍然紧缺 国产大模型亦有突破
智通财经· 2025-12-01 14:40
海外算力产业链动态 - 海外算力产业链本周呈现市值修复态势,光通信板块涨幅显著[1] - 谷歌云AI基础设施负责人表示未来每6个月计算能力翻倍,并预计未来4-5年内实现1000倍算力增长[2] - AWS宣布在美国政府区域追加约1.3GW算力建设,谷歌与Meta洽谈大规模采购并探索TPU本地化方案,OpenAI预计2030年转化2.2亿付费订阅用户以支撑算力扩张[2] - 第三季度微软/谷歌/Meta/亚马逊资本支出分别为167亿/240亿/196亿/351亿美元,同比增幅达53%/83%/133%/55%[7] 国内AI与算力发展 - 阿里确认算力需求持续扩大,未来三年3800亿元资本开支可能上修,云业务增长34%,前几代GPU已全部跑满[3] - 通义千问App公测一周下载量突破1000万,新加坡AISG放弃Meta模型转向阿里Qwen架构[3] - 国产大模型DeepSeekMath-V2模拟IMO达到金牌水平,开源模型在严谨推理中逼近闭源实验室性能[4] - 字节跳动与中兴通讯合作的AI手机将于12月初发布,备货量约3万台,主打高权限Agent能力[5] 细分板块表现与驱动因素 - 服务器指数本周上涨4.60%,AWS政府区新增1.3GW数据中心建设,OpenAI预期2.2亿付费用户推动长期训练与推理需求[6] - 光模块指数本周大幅上涨16.46%,本月累计上涨13.56%,谷歌计算能力扩张计划推动TPU集群规模持续增长[6] - IDC指数本周上涨5.58%,阿里资本开支可能上修及通义千问流量爆发倒逼算力扩建,大模型迭代驱动国内IDC建设加速[6] - 2025年前10月电信业务收入累计完成14670亿元同比增长0.9%,10月光模块出口金额环比下降11%同比降低27.6%[7]
沪指跌超2%,AI应用概念逆势走强,易点天下20cm涨停
21世纪经济报道· 2025-11-21 17:49
市场整体表现 - A股市场全天震荡调整,上证综合指数下跌超过2%,创业板指数下跌超过4% [2] - 全市场近5100只个股下跌 [2] AI应用概念板块表现 - AI应用概念股逆势走强,易点天下实现20%幅度涨停,视觉中国涨停 [2] - 传音控股、万兴科技、因赛集团、中文在线等个股跟涨 [2] 行业分析与前景 - 国产大模型与国产加速计算芯片的适配性不断优化,形成算法与硬件的协同优势 [2] - 算法与硬件的协同为千行百业的AI规模化落地奠定坚实基础 [2] - 全球AI产业基础设施建设保持强劲增长态势 [2] - 英伟达2026财年第三季度业绩表现亮眼,为全球AI板块注入持续增长动能 [2] - AI应用向商业化深度演进的核心需求持续看好 [2] - AI应用板块在技术落地提速与场景需求释放的双重驱动下具有增长潜力 [2] - 建议关注应用端具备AI技术落地实力与场景适配优势的头部企业 [2]
新华都(002264.SZ):积极寻求与算力厂商在AI Infra等领域的合作机遇
格隆汇· 2025-11-19 15:21
公司业务定位 - 公司主营互联网营销业务,是一家以数据研究为基础的效果营销及产品开发运营公司 [1] - 公司未涉及包括芯片、服务器、存储设备等硬件设施的算力业务 [1] 算力部署现状与规划 - 公司目前部署算力主要服务于公司内部业务支撑和研发需求 [1] - 预计伴随公司后续研发及运营,算力需求将持续提升 [1] 行业趋势与合作机遇 - 近期国产大模型加速迭代,通过线性注意力机制等技术不断降低算力成本 [1] - 公司密切关注算力产业发展,积极寻求与算力厂商在AI Infra等领域的合作机遇 [1] - 合作旨在加速模型在B端、C端的应用 [1]
Kimi万亿模型“横空出世”,科创AIETF(588790)蓄力调整,AI应用有望加速落地
新浪财经· 2025-11-10 11:12
指数与ETF表现 - 截至2025年11月10日10:51,上证科创板人工智能指数下跌1.20% [2] - 指数成分股星环科技领涨5.47%,中科星图上涨4.14%,奥普特上涨1.76% [2] - 指数成分股寒武纪领跌4.09%,奥比中光下跌3.62%,恒玄科技下跌3.33% [2] - 科创AIETF(588790)下跌1.41%,最新报价0.77元,近3月累计上涨23.97% [2] - 科创AIETF盘中换手率2.19%,成交额1.32亿元,近1月日均成交额4.10亿元,居可比基金第一 [2] 产品规模与资金流向 - 科创AIETF最新规模达60.80亿元,位居可比基金第一名 [4] - 科创AIETF近1周份额增长2.25亿份,新增份额位居可比基金第二名 [4] - 科创AIETF最新资金净流入7524.80万元,近5个交易日有4日资金净流入,合计净流入1.88亿元,日均净流入3767.41万元 [4] 政策与行业动态 - 国务院办公厅发布实施意见,要求加强人工智能关键核心技术攻关和推广应用,加快高价值应用场景培育和开放 [2] - 开源证券指出该政策有助于打通“技术突破—场景验证—产业应用”闭环路径,叠加GPT-5等模型成本下降及AI Agent快速落地,AI应用端将加速发展 [3] - 金蝶、金山办公等企业已推出聚合多个AI Agent的新产品,推动AI从工具向自主决策演进 [3] 技术突破与全球投入 - 月之暗面推出开源大模型Kimi K2Thinking,训练成本仅为460万美元,远低于OpenAI GPT-5的数十亿美元开销 [3] - 国金证券表示该模型反映国产大模型在智能体方向快速迭代,全球科技巨头持续加码AI投入 [3] - 亚马逊与OpenAI达成380亿美元合作,Meta宣布未来七年投资6000亿美元建设AI基础设施,AMD与OpenAI签署潜在收入达千亿美元级别的多年期协议 [3] 指数构成与样本特征 - 上证科创板人工智能指数从科创板市场选取30只为人工智能提供基础资源、技术及应用支持的市值较大上市公司证券作为样本 [5] - 截至2025年10月31日,指数前十大权重股包括澜起科技、金山办公、寒武纪等,合计权重占比70.92% [5]
国产AI杀疯美股赛场!豆包领跑,包揽交易大赛前三
搜狐财经· 2025-11-07 15:01
赛事结果与排名 - 在美股AI交易大赛RockAlpha中,国产模型豆包以7.09%的收益率获得冠军,MiniMax M2与Kimi K2分列第二、三位,实现国产模型包揽前三[1] - 赛事汇集了包括GPT-5、Claude、Gemini在内的12款国内外主流AI模型,最终结果凸显国产模型的强势崛起[1][3] - 此前稳居榜首的DeepSeek排名滑落但仍保持在第一梯队,而谷歌Gemini与阿里Qwen暂时垫底,GPT-5、Claude Sonnet等国际模型表现平平,未能突破收益瓶颈[5] 赛事设计与评估维度 - 大赛在美股三大特色赛场展开实时博弈:Meme股票赛场考验对情绪驱动型资产的判断,AI科技股赛场检验行业趋势研判,经典高流动性资产赛场衡量风险控制能力[3] - 多维度场景设置旨在规避单一市场环境下的运气成分,全面考核AI的交易策略、风险管控与实时决策能力[3] 领先国产模型的差异化策略 - 冠军豆包采用“重仓押注+精准择时”策略,其在IREN股票上的持仓占比超过53%,单日盈利突破7000美元,对中小盘成长股的估值判断与市场情绪捕捉精准[3] - 亚军MiniMax M2与季军Kimi K2走“稳健价值”路线,分别聚焦美光科技、英伟达等AI科技龙头股,凭借对行业基本面的深度研判获得稳定收益[3] 核心技术优势与竞争差异 - 表现突出的国产模型具备三大共性技术:支持10万级以上金融文本上下文处理,能快速整合财报、研报与新闻;采用动态策略调整机制,可根据市场波动率实时优化持仓;内置多因子风险模型以规避黑天鹅风险[5] - 国际模型在通用能力上具优势,但在美股细分场景的适配性上存在短板,尤其在需要快速解读市场热点、散户行为等非结构化信息的Meme股票领域[5] - 国产模型近期强化了金融文本语义理解与实时数据处理能力,形成了在特定垂直场景的竞争优势[5] 行业意义与发展趋势 - 赛事结果印证国产大模型正从“通用能力追赶”转向“场景化超越”,在金融交易等高价值垂直领域,通过针对性技术优化与数据训练,已实现对国际顶尖模型的弯道超车[8] - 国产模型在赛事中展现的场景适配能力,或将成为其抢占金融AI赛道的核心竞争力[8]
对华禁令收紧,字节腾讯旗下AI编程工具移除Claude模型
观察者网· 2025-11-06 18:26
Anthropic对华禁令实施情况 - Claude母公司Anthropic于9月5日发布新版限制政策,禁令范围扩大至“由中国等受限地区直接或间接控制、持股比例超过50%的企业”,无论其实际运营地点在何处[3] - 字节跳动旗下AI编程工具Trae国际版于11月4日通知用户,因服务调整将不再提供Claude模型的访问权限[1] - 腾讯旗下CodeBuddy国际版在10月1日前已移除了Claude相关模型[3][8] 企业应对措施与影响 - Trae国际版上线仅三个月后便下架Claude模型,作为补偿向Pro会员提供额外50%的快速请求额度(每月新增300次请求),有效期至2026年1月31日[4][6] - Trae平台移除Claude后,用户仍可使用内置的GPT-5、Gemini-2.5-Pro、Kimi-K2-0905和DeepSeek-V3.1-Terminus等核心模型[4] - 字节跳动要求内部员工自6月30日起分批禁用Cursor、Windsurf等第三方AI开发软件,全面推广自研的Trae,该工具整体月活已超100万,公司内部超过80%的工程师已在使用[13] 国产大模型发展机遇 - Claude的“断供”客观上加速了国产大模型的补位进程,混元、DeepSeek、智谱等国内大模型在AI编程场景中进展迅速[9] - 智谱推出“Claude API用户特别搬家计划”,开发者仅需替换API URL即可切换至GLM模型,宣称价格仅为Claude的1/7,用量提升3倍,并赠送新用户2000万Tokens[9] - Kimi在9月5日禁令公布当天更新其K2模型,该模型聚焦编程和智能体领域,对标Claude产品,价格仅为Claude的1/10[12] AI编程工具市场竞争格局 - AI原生IDE已成为国内大厂的必争之地,除字节的Trae和腾讯的CodeBuddy外,阿里于8月上线面向全球的Agentic编程平台Qoder,百度也在6月发布“文心快码”(Comate AI IDE)[12][13] - Anthropic现估值达1830亿美元,其Claude系列模型在编程领域享有盛誉,在SWE‑bench Verified评测中Claude 4.5 Sonnet以70.6%的高分位居榜首[9] - 火山引擎、商汤科技、京东云等厂商也纷纷跟进推出了针对Claude用户的迁移服务[12]
中国人工智能产业快速发展 国产大模型成为“全球顶流”
人民日报海外版· 2025-10-22 10:21
行业规模与全球地位 - 中国人工智能企业数量超过5100家 [1] - 中国已发布大模型数量位居全球首位 [1] - 国产大模型在全球知名AI开源社区HuggingFace榜单前10名中占据9席 [1] - 日均Token消耗量从2024年初的1000亿增长至2025年6月底的30万亿,1年半时间增长300多倍 [1] 技术创新与性能突破 - 快手视觉生成大模型“可灵AI”上线一年用户规模突破2200万,其视频生成模型占据全球约30%用户份额 [2] - 阿里通义共开源300多个模型,全球下载量突破6亿次,衍生模型超17万个 [3] - 阿里云AI基础设施在全球29个地域设有91个可用区 [3] - Qwen3系列模型以不到1/3的参数量实现同等顶尖性能 [3] - 国产大模型技术在语言、视觉、多模态等领域持续突破,实现多模态统一 [3][4] 应用场景与效率提升 - 京东物流大模型赋能全球超500个仓库,机器人决策从“被动响应”升级到“主动预测” [5] - 百度文心大模型支持国家电网推出“光明电力大模型”,推广无人机巡检年巡检杆塔500万基,减少人工登塔次数40% [6] - 中国移动九天大模型具备工业领域高阶视觉能力,满足工业生产需求 [6] - 腾讯混元原生多模态生图模型“混元图像3.0”在国际大模型竞技场LMArena最新文生图榜单中位居第一 [9] - 腾讯混元3D模型获得拓竹科技、创想三维等头部3D打印厂商青睐 [9] 产品生态与市场拓展 - 腾讯形成覆盖通用大语言模型和多模态生成及理解模型的丰富产品体系 [9] - 中国移动成功打造数万卡智算集群、数万亿Tokens高质量数据集和万亿参数AI大模型 [10] - 百度飞桨文心生态服务企业超过76万家,向化工、医疗、农业、物流等产业纵深渗透 [11] - 360智能体工厂支持通过自然语言定义智能体,满足政府和企业数字化转型需求 [11] 数据资源与发展趋势 - 国内多数模型训练使用的中文数据占比已超过60%,部分模型达到80% [7] - 大模型行业未来呈现推理能力提升、推理算力成本降低、应用转向开源生态等趋势 [11]
第六届1024资管科技开发者大会在上海临港新片区举办
新浪财经· 2025-10-18 23:18
大会概况 - 第六届1024资管科技开发者大会于10月17日在上海临港中心举办 [1] - 大会是全球资产管理中心上海国际活动周2025系列重要活动之一 [1] 报告发布 - 《上海全球金融科技中心建设资产管理垂直领域大模型开发与应用报告2025》在大会上正式发布 [1] - 报告包含国产大模型在资产管理领域的应用实践 兼具技术深度与行业实践视角 [1] - 报告内容汇集从技术解析到场景落地等方面 [1] 产业活动启动 - “滴水智汇”智能投研&人工智能+产业发展系列活动同步启动 [1] - 活动将围绕智能汽车、高端装备、集成电路、民用航空和数字经济“4+1”临港主导产业重点场景展开 [1] - 活动旨在搭建“产业研究+场景路演+闭门研讨+联合倡议”的常设平台 [1] 闭门研讨 - 会前60余位专家参加了“临港新片区金融科技集聚区发展座谈会” [2] - 座谈会聚焦“打造标杆性金融科技集聚区”核心目标 [2] - 座谈会围绕产业协同、融资发展、跨境数据流动、算力基建、离岸金融场景等关键议题展开深入交流 [2] - 座谈会旨在推动金融科技资源集聚、技术创新与产业落地 助力上海全球金融科技中心建设 [2]
A股盘前播报 | 金银疯涨齐新高!黄金首次突破4300美元 美地区银行爆雷引发抛售
智通财经网· 2025-10-17 08:47
贵金属市场 - 黄金价格连续第四个交易日创盘中新高,首次突破4300美元大关 [1] - COMEX 12月白银期货盘中曾涨破53.60美元,日内涨幅超过4% [1] - 美国政府关门、贸易紧张形势、美联储降息预期是近期贵金属价格上涨的主要推动因素 [1] 银行业动态 - 美国多家中型银行曝出贷款欺诈事件,引发市场对信贷质量和资产透明度的担忧 [2] - 美国地区性银行板块遭遇重挫,74家最大银行市值单日蒸发超过1000亿美元 [2] 科技与算力产业 - 工信部组织开展城域"毫秒用算"专项行动,旨在构建高速大容量、低时延、广覆盖的城域算力网络 [3] - 中信证券认为国产大模型加速迭代,建议重视国产算力的投资机遇 [3] - 2024年全球VR与MR头戴设备出货量约为960万台,同比增长8.8% [11] 地缘政治与贸易 - 美国总统特朗普与俄罗斯总统普京进行了长时间通话,主要讨论结束俄乌冲突及俄美贸易议题 [4] - 特朗普表示可能会在未来两周内与普京会面,并称会谈取得很大进展 [4] 机构观点汇总 - 招商证券认为市场短期调整不可避免但仍有韧性,建议关注军工、新消费等低位赛道 [6] - 德邦证券指出市场缩量反映避险情绪,短期以红利为代表的价值板块表现可能持续占优 [7] - 东方证券维持科技股是市场主线的判断,认为短期调整不会改变市场盘升趋势 [8] 新能源与前沿技术 - 我国科学家攻破固态电池关键难题,助力续航里程实现翻倍 [9] - 兴业证券预计2025年固态电池商业化落地进程加速,有望开拓低空、机器人和数据中心等新兴市场 [9] - 国家能源局公示41个氢能试点项目,推动氢能技术创新和产业布局 [10] 公司业绩与公告 - 容知日新前三季度净利润同比预增871.3%至908.09% [12] - 福耀玻璃前三季度净利润同比增长28.93% [14] - 广晟有色因稀土市场行情整体上涨,预计前三季度净利润同比扭亏为盈 [14] - 今创集团股东中国轨道拟减持不超过3%公司股份 [14] - 行动教育股东拟合计减持不超过230万股公司股票 [14]
港股概念追踪 | DeepSeek线上模型升级至V3.1-Terminus!算力与应用板块或迎价值重估(附概念股)
智通财经网· 2025-09-23 07:27
DeepSeek-V3.1-Terminus版本升级 - 深度求索正式升级DeepSeek-V3.1至DeepSeek-V3.1-Terminus版本 优化语言一致性与Agent能力 缓解中英文混杂及异常字符问题 提升Code Agent与Search Agent表现 [1] - 新模型各领域测评结果如下:MMLU-Pro从84.8提升至85.0 GPQA-Diamond从80.1提升至80.7 Humanity's Last Exam从15.9提升至21.7 LiveCodeBench从74.8提升至74.9 Codeforces从2091降至2046 Aider-Polyglot从76.3降至76.1 [1] - Agent测评表现提升:BrowseComp从30.0提升至38.5 BrowseComp-zh从49.2降至45.0 SimpleQA从93.4提升至96.8 SWE Verified从66.0提升至68.4 SWE-bench Multilingual从54.5提升至57.8 Terminal-bench从31.3提升至36.7 [1] - 官方App、网页端、小程序与API模型均已同步更新为DeepSeek-V3.1-Terminus [1] 学术研究与国际认可 - DeepSeek团队研究论文登上《自然》期刊封面 打破主流大模型未经独立同行评审的空白 [2] - 8月21日发布的DeepSeek-V3.1实现混合推理架构 同时支持思考模式与非思考模式 具有更高思考效率和更强Agent能力 [2] 国产算力生态与产业链影响 - DeepSeek V3.1采用UE8M0 FP8格式 专为下一代国产芯片设计 解决与英伟达FP8标准兼容性问题 推动国产算力生态自主化 [2] - 英伟达H20芯片停产使国内算力替代需求迫切 国产算力板块获推荐 [2] - DeepSeek V3.1发布带动国产算力产业链标的大幅上涨 未来训练与推理有望更多应用国产AI芯片 加速国产算力生态建设 [3] - 大模型训推带动AI算力需求增长 GB300、Vera Rubin等新一代算力架构将推出 AI芯片、服务器整机、铜连接、HBM、液冷、光模块、IDC等环节持续受益 [4] 开源模式与行业趋势 - DeepSeek成功推动国产大模型走向分水岭 更多中国公司转向开源路线 重点重新转向模型优化与更新迭代 [3] - 7月底国产大模型迎来开源"井喷潮":阿里连续发布4款开源模型 腾讯开源混元3D世界模型1.0 智谱发布GLM-4.5 阶跃星辰开源Step-3 [3] 相关企业动态与产品进展 - 百度文心大模型X1.1正式发布 事实性提升34.8% 指令遵循提升12.5% 智能体提升9.6% 在多个基准评测中超越DeepSeek R1-0528 与GPT-5和Gemini 2.5 Pro效果持平 [6] - 阿里巴巴通义千问推出Qwen3-Max-Preview模型 成为系列最强大语言模型 国产大模型企业进入全球第一梯队 [6] - 商汤"日日新"大模型接入小米AI眼镜 实现全双工实时音视频交互能力 推动智能硬件交互范式发展 [7] - 中兴通讯推出多款AI一体机产品:AiCube训推一体机助力企业部署DeepSeek大模型 5G UniEngine算网一体机支撑行业应用 智海AI教育一体机实现国产算力与DeepSeek适配 Common Edge一体机用于5G边缘计算 [7] 半导体与ETF投资机会 - 亚太精选ETF(159687)包含亚太优质红利资产和半导体龙头企业 丰田汽车、腾讯控股、阿里巴巴、三菱集团等提供稳健收益 台积电、三星、东京电子、联发科等半导体企业占比显著 亚太地区半导体产业收入占全球57.6% [5]