Workflow
混元模型
icon
搜索文档
TMT行业周报(3月第3周):英伟达召开GTC大会
世纪证券· 2026-03-23 11:24
报告行业投资评级 * 报告未明确给出TMT行业的整体投资评级 [1] 报告核心观点 * 英伟达GTC 2026大会发布的全新Vera Rubin机柜架构及对算力需求的乐观指引,进一步增强了全球算力产业链的确定性,并有望拉动CPU、存储、铜缆、CPO及PCB等细分产业链需求 [4] * 当前以OpenClaw为代表的推理需求爆发对算力需求形成有效拉动,叠加海外龙头公司清晰的未来收入指引,全球算力产业链确定性增强 [4] 市场周度回顾 * **板块表现**:上周(3月16日-3月20日)TMT板块内一级行业涨跌互现,通信上涨2.10%,电子下跌2.84%,传媒下跌3.78%,计算机下跌4.74% [4] * **子行业表现**:三级子行业中,通信网络设备及器件涨幅最大(7.38%),分立器件(5.17%)和通信应用增值服务(1.06%)紧随其后;通信线缆及配套(-11.25%)、横向通用软件(-7.94%)和LED(-7.04%)跌幅居前 [4] * **个股表现**: * 电子周涨幅前三:深华发A(61.01%)、源杰科技(26.80%)、国科微(21.34%)[4] * 计算机周涨幅前三:朗科科技(37.05%)、同有科技(26.43%)、铜牛信息(25.23%)[4] * 传媒周涨幅前三:天地在线(15.90%)、贵广网络(14.51%)、出版传媒(8.67%)[4] * 通信周涨幅前三:新易盛(21.07%)、中际旭创(12.91%)、鼎通科技(12.70%)[4] 行业重要事件 * **AI模型侧**: * 阿里巴巴百炼MaaS平台过去三个月公共模型服务市场的Token消耗规模提升6倍,预计商业化MaaS收入将成为阿里云最大收入产品 [17] * 腾讯混元HY3.0计划4月对外推出,相比HY2.0效果进步明显 [17] * OpenAI筹备2026年底前IPO,2030年总收入目标2800亿美元,计算支出目标约6000亿美元 [17] * **AI应用侧**: * 英伟达公布下一代Feynman芯片架构,采用台积电1.6纳米制程,预计2028年上市 [20] * 智谱发布GLM-5-Turbo大模型并同步上调API价格20% [20] * 腾讯QClaw开启全量公测,新版本打通企业微信、QQ等多平台远控通道 [20] * 华为云MaaS Tokens服务接入超过160个业界主流模型,预计下半年发布一系列“龙虾”智能体 [20] * 阿里云2026财年截至2月底的外部商业化收入突破1000亿元人民币,未来五年云和AI商业化年收入目标突破1000亿美元 [21] * 亚马逊AWS年销售额到2036年有望从当前约3000亿美元翻倍至6000亿美元 [21] * **AI算力侧**: * 英伟达CEO黄仁勋预计2025-2027年数据中心累计收入将超过1万亿美元,并对实现“1万亿美元以上”收入具备强烈“能见度” [4][25] * 英特尔计划将CPU价格上调10% [24] * 小米集团计划未来三年在AI领域至少投入600亿元 [24] * 阿里平头哥AI芯片累计出货47万片 [25] * 台积电和三星电子已对5/4nm等先进制程涨价 [25] * TrendForce预计2026年全球晶圆代工产业产值有望年增24.8%,约2188亿美元,其中台积电产值将年增32% [25] * 华为预计2026年行业智能化升级将给ICT产业带来超过8000亿元市场机会,到2030年中国AI相关产业规模将突破10万亿元 [25] * 腾讯2025年全年资本开支达792亿元,研发投入857.5亿元,均创历史新高 [25] * 德国计划到2030年将通用数据中心算力至少翻一番,AI专用算力至少增至2025年的4倍 [26] * SK集团会长预计全球存储芯片短缺可能持续至2030年 [26] * 村田针对AI服务器和高端车规级MLCC产品涨价15%-35% [26] * AI云公司Nebius与Meta签署协议,将在2027年前提供价值120亿美元的专属AI计算能力,合同总价值最高可达270亿美元 [26] * 美国银行预测人形机器人年出货量将从2026年的9万台增至2030年的120万台,复合年增长率达86% [27] 重点公司公告 * **投资与收购**: * 和顺石油拟5.4亿元收购奎芯科技51.11%表决权 [28] * 大胜达拟以5.5亿元投资芯瞳半导体22.9831%股权 [28] * 鹏鼎控股全资子公司拟110亿元投建高端PCB项目生产基地 [28] * 一彬科技拟1.6亿元投资上海传芯半导体有限公司,取得9.4088%股权 [29] * **业务进展**: * 世运电路对英伟达服务器相关PCB产品的供货量实现快速增长 [28] * 鼎龙股份年产300吨KrF/ArF光刻胶产业化项目建成投产 [28] * 胜宏科技深度参与核心客户正交背板项目合作研发 [28] * **资本运作**: * 宏和科技筹划发行H股并在香港联交所上市 [28] * 天孚通信拟在境外发行H股并在香港联交所主板挂牌上市 [29] * 纳思达证券简称拟变更为“奔图科技” [28]
腾讯不担心在AI赛道上“迟到”
经济观察报· 2026-03-19 13:33
公司AI战略与投入 - 公司管理层对AI的态度从2025年的“仍处于早期阶段”、“现在谈论为时过早”转变为2026年的“非常好”、“非常有意思” [2] - 公司2026年在AI上的投入金额同比翻倍,2025年在新AI产品上的投入为180亿元 [2] - 公司2025年资本开支为792亿元,同比增加24.4亿元,增长3.2%,主要用于支持AI业务发展,包括AI基础设施和数据中心 [4] - 管理层解释2025年资本支出不及预期主要源于GPU的不可抗力,即“希望买更多卡,但有段时间买不到”,并希望2026年资本开支有更大提升 [4] AI产品与市场表现 - 公司在春节大厂AI红包混战中第一个出手,并在“龙虾”火爆后,至少有3个事业群推出了8个“龙虾”及配套产品,是大厂中产品数量最多的 [2] - 公司正在打造一款可直接内嵌进微信的AI智能体,微信内已具备完善的商业环境,智能体能为用户和小程序带来交易和流量,从而自然融入现有商业模式 [2][3] - 管理层将“龙虾”视为一个好机会,认为其与普通AI聊天产品的最大不同在于有活人感,像个性和记忆,更像模拟助理,并可以整合公司PC端与云智能产品能力,发挥产品矩阵和生态优势 [3] 内部组织与研发进展 - 公司在2025年1月对AI业务复盘时发现大模型底模能力有限、关键模块缺失、数据不够轻等问题,并同期对AI研发团队进行了调整 [3] - 调整包括引入新负责人姚顺雨,并成立了负责大模型训练和推理的AI Infra部、负责大模型数据获取及评测的AI Data部,以及数据计算平台部 [3] - 新的研发团队正在进行混元3.0版模型的训练,目前已经明确看到混元能力显著提升,高于过去任何一个版本 [3] 市场评价与公司回应 - 公司在AI的布局和投入节奏一向被评价为“慢”,管理层也承认比友商慢了9个月到1年时间,但近期在AI人才、产品等多个维度可以用“抢跑”来形容 [1][2] - 截至3月19日午间,公司股价为518港元,今年以来处于下滑走势,反映了市场对其未来增长及AI业务不如竞对的担忧 [4] - 管理层认为AI竞争是包含多场景、多阶段的全新机会,是多种不同游戏的叠加,不担心目前的迟到,认为可以通过重组团队、以产品为导向进行创新来应对 [4]
万联晨会-20260317
万联证券· 2026-03-17 09:04
核心市场与宏观数据 - **市场回顾**:2026年3月16日周一,A股三大指数涨跌不一,沪指收跌0.26%至4084.79点,深成指收涨0.19%至14307.58点,创业板指收涨1.41%至3357.02点,两市成交额23251.22亿元[1][4][7] - **行业与概念表现**:申万一级行业中,食品饮料、电子、商贸零售领涨,钢铁、有色金属、基础化工领跌;概念板块中,转基因、存储芯片、国家大基金持股概念涨幅居前,特钢概念、金属铅、金属锌概念跌幅居前[1][7] - **宏观经济开局良好**:2026年1-2月,全国规模以上工业增加值同比增长6.3%,服务业生产指数同比增长5.2%,社会消费品零售总额86079亿元同比增长2.8%,服务零售额同比增长5.6%,全国固定资产投资52721亿元同比增长1.8%,CPI同比上涨0.8%,城镇调查失业率平均值5.3%,经济运行起步有力[2][8] 计算机行业 - **行业表现与核心观点**:上周(截至2026年3月13日)申万计算机行业指数下跌0.92%,分别跑输沪深300和创业板指1.11和3.42个百分点,排名申万一级行业第17位[9] - **AI应用与安全布局**:海内外大厂正围绕OpenClaw等多维度合作部署,积极抢占AI应用入口,同时加码布局AI安全领域,腾讯云宣布混元模型Token涨价最高超5倍[3][9] - **产业动态**:OpenAI宣布收购AI安全平台Promptfoo;谷歌母公司Alphabet以320亿美元(约合2200.49亿元人民币)全现金收购网络安全公司Wiz,为谷歌成立26年来最大收购;联想AI服务“想帮帮”推出OpenClaw免费部署服务;AMD发布技术指南支持在Windows本地运行OpenClaw[9][11] - **行业估值**:截至2026年3月13日,申万计算机行业PE-TTM为200.69倍,高于2023-2025年历史均值158.13倍[11] 通信行业 - **行业表现与核心观点**:上周申万通信行业指数下跌0.12%,分别跑输沪深300和创业板指0.30和2.63个百分点,排名第11位[13] - **算电协同与光通信**:阿里云加码布局智算中心,聚焦打造自主绿色算力中心标杆;博通发布3nm工艺单通道400G PAM-4 DSP,助力1.6T光模块解决方案优化;广东电信重启光缆集采,最高限价上浮100%[13][14] - **卫星互联网进展**:2026年3月13日,我国在海南商业航天发射场使用长征八号甲运载火箭,成功将卫星互联网低轨20组卫星发射升空,组网进程稳步推进[13][14] - **行业估值**:截至2026年3月13日,申万通信行业PE-TTM为28.30倍,高于2023-2025年历史均值22.00倍[15] 传媒行业 - **行业表现与核心观点**:上周申万传媒行业指数下跌3.23%,跑输沪深300指数3.42个百分点,跑输创业板指数5.74个百分点,年初至今累计涨幅0.91%[16] - **苹果佣金率调整**:苹果宣布自2026年3月15日起,下调中国区Apple Store佣金率,标准佣金率由30%降至25%,小型开发者计划及订阅优惠费率由15%降至12%,利好iOS渠道占比高、用户付费能力强的内容端公司盈利改善[16][17] - **产业动态**:Sensor Tower数据显示2026年2月《Last War: Survival Game》为全球手游收入榜首;腾讯《洛克王国:世界》全平台预约量近5000万,首发包含400多只精灵;2026中国电视剧制作产业大会明确AI将作为核心新质生产力重塑影视生态[17] - **行业估值**:上周申万传媒行业PE-TTM从27.68倍震荡跌至27.10倍,但仍高于2018-2025年均值26.24倍[18] 银行行业 - **金融数据概览**:2026年2月社会融资规模增量为2.38万亿元,同比多增0.15万亿元;2月末社融存量规模451.4万亿元,同比增长8.2%,增速环比持平[20] - **信贷结构分析**:2月人民币贷款增加0.9万亿元,同比少增0.11万亿元,其中企业端贷款新增1.49万亿元(短期0.6万亿元,中长期0.89万亿元),同比多增;居民端贷款减少0.65万亿元,同比多减[20] - **货币供应量**:2月M2同比增长9%,增速环比持平;M1同比增长5.9%,增速环比回升1个百分点[21] - **投资策略观点**:企业端融资支撑社融和信贷,M1同比增速继续回升,预计上市银行营收与净利润增速将延续企稳态势,板块股息率具备吸引力[21] 电子行业 - **行业表现与核心观点**:上周申万电子指数下跌1.22%,跑输沪深300指数1.41个百分点,跑输创业板指数3.73个百分点,排名第20位[22] - **AI算力与前沿机遇**:英伟达GTC 2026大会于3月16日至19日举行,举办超1000场会议,探讨AI工厂、机器人、数字孪生、量子计算等热点议题,AI算力建设方兴未艾,建议关注PCB、存储等高景气细分赛道及AI工业化、智能驾驶等前沿应用[22][23] - **产业动态**:2025年全球AI眼镜出货量达870万台,同比增长322%,Meta市场份额85.2%;中国大陆成为全球增长最快的AI眼镜市场,份额占全球10.9%,出货量近100万台,为全球第二大市场,中国厂商Rokid和小米分别位列全球第二、第三[24] - **行业估值**:截至2026年3月15日,申万电子板块PE-TTM为81.98倍,高于2019年至2026年3月15日的历史均值54.13倍[24]
行业周报:周观点:政府工作报告首提“算电协同”,关注产业链投资机会-20260315
开源证券· 2026-03-15 22:02
报告行业投资评级 - 投资评级:看好(维持)[2] 报告核心观点 - 政府工作报告首次提及“算电协同”,将其列为新基建工程,核心内涵包括“电支撑算”与“算优化电”两个层面,旨在推动AI基础设施绿色低碳转型[5][12] - 数据中心对电力供给的连续性和稳定性有极端苛刻的要求,绿电供应需解决可再生能源的间歇性和波动性问题[6][13] - 通过融合气象、负荷、电价数据的AI模型,可实现从预测走向决策,形成电算协同自动化调度策略,实现效益最大化[7][14] - 报告建议关注“算电协同”带来的产业链投资机会,包括电力信息化及虚拟电厂、算网协同、算力一体化监测调度等细分领域[8][15] 根据相关目录分别总结 1、 周观点:政府工作报告首提“算电协同”,关注产业链投资机会 - **政策与内涵**:2026年3月5日政府工作报告首次提出“算电协同”,并计划实施超大规模智算集群等新基建工程[5][12]。其内涵包括:1)“电支撑算”:通过绿电直供、源网荷储一体化提供稳定、低成本、零碳电力;2)“算优化电”:利用AI算法使数据中心成为电力系统的“柔性调节资源”,参与电网调峰调频[5][12] - **政策背景**:2025年7月,国家发改委等部门已发文,首次将数据中心纳入绿色电力消费监测范围,并要求国家枢纽节点新建数据中心绿电占比达到80%[5][12] - **技术要求**:数据中心负载具有毫秒级波动特性,对供电可靠性要求极端苛刻,任何中断都可能造成重大损失[6][13] - **技术路径**:通过融合气象、负荷、电价数据的AI模型预测新能源出力和算力需求,并利用强化学习自动生成调度策略,实现电算协同效益最大化[7][14] - **投资建议**: - **电力信息化及虚拟电厂**:受益标的包括国能日新、南网数字、南网科技、国网信通、远光软件[8][15] - **算网协同**:受益标的包括豫能控股、金开新能、协鑫能科[8][15] - **算力一体化监测调度**:推荐中科曙光,受益标的包括东方国信、并行科技、优刻得、青云科技、首都在线、铜牛信息[8][15] 2、 公司动态 - **股权激励**:恒拓开源发布2026年员工持股计划草案,持股规模不超过1,056,289股,占总股本不超过0.7517%,购买价格为8.15元/股(为回购均价的206.85%),参与员工不超过28人[17] - **投资和并购**: - 国能日新拟出资5,000万元人民币,与专业机构共同设立产业基金,该基金首次认缴总额为20,000万元人民币,公司占25%[18] - 新国都拟出资1,620万元人民币设立控股子公司深圳市新国都极算科技有限公司,交易完成后持有其54%股权[18] - **其他公告**:涉及多家公司高管股份变动,包括萤石网络董事长兼总经理蒋海青增持156,226股,以及道通科技、神州数码、东方中科、高伟达等公司董事或股东的减持计划[19][20] 3、 行业动态 - **国内要闻**: - **大模型发布**:DeepSeek V4和腾讯新混元模型均预计于2026年4月发布,DeepSeek-V4将在Coding能力和长期记忆上取得突破[21] - **人才流动**:原阿里通义实验室千问大模型后训练负责人郁博文已加入字节跳动[22] - **模型涨价**:腾讯云宣布混元模型Token涨价,其中Tencent HY2.0 Instruct模型输入价格从0.0008元/千tokens涨至0.004505元/千tokens,输出价格从0.002元/千tokens涨至0.01113元/千tokens,涨幅均超5倍[23] - **AI智能体**:腾讯正为微信秘密开发一款“绝密级”AI智能体,计划年中启动灰测,能操控全平台数百万小程序[24] - **海外要闻**: - **英伟达计划**:英伟达计划在未来5年投入260亿美元打造开源AI模型[25] - **苹果调整**:苹果公司宣布自2026年3月15日起,降低中国App Store佣金率,标准佣金率由30%降至25%,小型企业计划等项下的佣金率由15%降至12%[26][27] - **GTC大会**:NVIDIA GTC 2026大会将于3月16日至19日举行,主题涵盖物理AI、AI工厂、代理AI与推论[28] 市场回顾 - 本周(2026年3月9日至3月13日),沪深300指数上涨0.19%,计算机指数下跌0.92%[4][16]
剑指阿里字节!报道:腾讯秘密布局微信AI智能体,年内或向全用户开放
硬AI· 2026-03-10 23:43
微信AI智能体开发计划 - 公司正为微信秘密开发一款高优先级AI智能体,计划于2024年年中启动灰盒测试,并在第三季度向全体用户推出 [2][3] - 该智能体将嵌入微信,以对话形式呈现,旨在接入平台内数百万小程序,替代用户完成打车、外卖等任务 [2][3] - 此举旨在拓展AI智能体在国内的应用场景,并直接挑战阿里巴巴与字节跳动在该领域的先发优势 [2][3] AI智能体战略布局 - 公司近期加速AI Agent布局,在一天内密集推出三款产品,分别切入个人、协作与办公场景:QClaw(微信远程操控电脑)、企业微信机器人和WorkBuddy(多平台办公助手)[6] - 战略核心是放弃推广独立应用,将AI能力直接嵌入微信、企业微信、QQ等高频应用,依托现有生态完成能力注入 [6] - 目标是将AI从“需要专门打开的工具”转化为“对话流中原生存在的服务”,通过自然语言调用抢占下一代人机交互的核心入口 [6] 微信生态的优势与挑战 - 公司将AI智能体嵌入微信的核心逻辑在于其无可替代的生态规模,微信拥有14亿月活用户和八年积累的数百万小程序生态 [3][8][13] - 然而,公司面临两难处境:不能冒险以不成熟的技术破坏微信庞大的用户体验 [8] - 公司此前推出的独立AI应用“元宝”市场反响平平,截至2024年2月月活用户约1.09亿,远低于字节跳动豆包的3.15亿和阿里巴巴通义的2.02亿 [8] 底层模型与研发能力 - 在底层模型选型上,微信团队尚未确定采用公司自研的混元模型,因混元模型在行业内尚未跻身顶尖水平 [11] - 微信团队已测试智谱、阿里巴巴及DeepSeek等多家外部模型,同时也在评估自研的小型模型,采用外部模型可能拉长整合验证周期 [11] - 公司从OpenAI引入姚顺雨担任首席AI科学家主导混元研发,微信团队也由张小龙领衔推进独立AI模型研发,并已发布相关技术论文 [11] 行业竞争与战略意义 - 全球科技巨头正竞相推出能自主完成复杂任务的AI助手,争夺下一代人机交互的制高点,公司在此竞逐中既有筹码也有压力 [13] - 竞争焦点正从“功能”转向“入口”,主战场从独立应用迁移到用户原本活跃的通讯与办公工具中,离用户更近的入口更具价值 [15] - 公司的核心命题是如何在不动摇微信既有用户体验的前提下,将小程序生态优势有效转化为AI竞争力,进而实现反超 [13]
腾讯混元AI Infra核心技术开源:推理吞吐提升30%
第一财经· 2026-02-04 18:46
公司技术发布 - 腾讯混元AI Infra团队正式推出开源生产级高性能大语言模型推理核心算子库HPC-Ops [1] - 在真实场景下,基于HPC-Ops,混元模型推理每秒查询量提升30% [1] - 在真实场景下,基于HPC-Ops,DeepSeek模型推理每秒查询量提升17% [1] 单算子性能表现 - HPC-Ops实现的Attention算子性能相比FlashInfer/FlashAttention最高提升2.22倍 [1] - HPC-Ops实现的GroupGEMM算子性能相比DeepGEMM最高提升1.88倍 [1] - HPC-Ops实现的FusedMoE算子性能相比TensorRT-LLM最高提升1.49倍 [1]
新BAT十年战争
36氪· 2026-01-28 19:39
字节跳动估值与市场地位 - 字节跳动最新公允估值约为4800亿美元,风投女王徐新按此估值从早期投资方处购入部分股权 [1] - 该估值意味着在资本眼中,字节跳动已彻底超越阿里巴巴,并在各赛道对阿里和腾讯构成冲击 [2] - 按市值计算,一个字节跳动约等于10个百度,标志着旧“BAT”格局被以字节跳动为引力中心的“新BAT”格局取代 [3][4] 新BAT十年战争阶段演变 - 战争本质是互联网核心稀缺资源的转移:从2016年争夺用户注意力的流量战争,到2020年争夺用户钱包份额的交易战争,再到2024年随生成式AI爆发的智能战争 [4] - 十年战争是巨头们在抢时间、抢钱包与抢“大脑”的战役中攻守易形的过程 [7] 流量战争 (2016-2019) - 2016年智能手机出货量见顶,移动互联网进入存量博弈时代 [9] - 腾讯凭借微信和QQ坐拥10亿级用户,阿里在电商领域领先,百度因移动端转型迟缓显露疲态 [10] - 字节跳动以“信息找人”的哲学,构建基于机器学习的推荐引擎,区别于腾讯的社交分发和百度的搜索意图 [12] - 抖音于2016年9月上线,采用“中心化”算法分发和全屏沉浸式体验,形成“时间黑洞” [12][13] - 到2019年,短视频用户时长占比迅速攀升,侵蚀即时通讯和长视频时长 [15] - 2019年,字节跳动数字广告收入首次超越百度,宣告旧BAT时代终结 [17] - 2018年“头腾大战”爆发,腾讯在微信和QQ限制抖音分享,双方爆发超900次诉讼,字节跳动曾起诉腾讯要求赔偿9000万元 [19][20][21] - 腾讯复活“微视”并投入数十亿补贴阻击抖音,但最终失败 [21][22][23] - 抖音在2018-2019年通过激进运营(如赞助2019年央视春晚)实现对快手的反超 [25] - 字节跳动赢得了“时间”,腾讯守住了社交底盘但在短视频战场失败,百度告别第一梯队 [26][27] 交易战争 (2020-2023) - 战争焦点从“抢眼球”转移到“抢钱包”,直播电商兴起 [30] - 2020年抖音成立电商一级部门,提出“兴趣电商”(货找人)概念,区别于阿里京东的“货架电商”(人找货) [31] - 抖音电商GMV从2020年的约5000亿元飙升至2023年的2.6万亿元 [32] - 字节跳动不仅抢夺阿里广告费,还切断外链建立电商闭环 [32] - 2020-2023年阿里面临抖音和拼多多夹击,市场份额被侵蚀 [33] - 阿里遭遇蚂蚁IPO暂停、反垄断罚款,股价腰斩 [34] - 2023年3月阿里进行“1+6+N”组织变革,拆分为六大业务集团独立运营 [35] - 逍遥子卸任后,蔡崇信和吴泳铭接掌,确立“用户为先、AI驱动”战略,聚焦主业 [35][36] - 腾讯在2020年找到短视频正确解法——微信视频号,作为微信生态原子化组件连接私域流量 [37][38][39] - 到2024-2025年,视频号成为腾讯增长新引擎,推动广告收入双位数增长 [41] - 战局出现融合:抖音补课货架发展“抖音商城”,目标货架GMV占比达50%;淘宝补课内容,App全面视频化 [44] - 字节跳动成功成为中国第三或第四大电商平台,腾讯通过视频号和小程序在电商地带建立“影子公司” [44] 智能战争 (2024-2026) - 战争焦点是抢夺未来入口“大脑”,交互方式从GUI向LUI进化 [45][46] - 2024-2025年中国AI行业洗牌,DeepSeek异军突起引发价格战,迫使百度、阿里、字节跟进 [48][49] - 字节跳动CEO梁汝波反思公司在AI大模型上反应“太慢了” [50] - 字节跳动迅速推出AI对话助手“豆包”,到2025年其DAU突破1亿,成为增长最快、获客成本最低的国民级应用 [53][54] - 字节跳动将豆包打造为“超级智能体”,并于2024年底推出Ola Friend智能耳机等硬件 [55][56][57] - 腾讯AI大模型起步较晚,混元模型至2023年才立项,处于行业第二梯队 [58] - 2025年腾讯采取攻击性追赶策略,高薪挖角(如从字节跳动挖人薪资可翻倍)并进行组织变革,成立AI Infra、AI Data等部门 [58] - 腾讯引进前OpenAI研究员姚顺雨,由其主导修正技术路线,重点强化后训练,目标指向具备更强推理与行动能力的Agent模型 [58][59][60] - 腾讯启动了春节期间的红包投放,但属于防御性策略 [61] - 阿里确立“AI驱动”核心战略,打法是“云+开源”与“Agent电商” [64] - 阿里将通义千问打造成全球最受欢迎的开源模型之一,带动阿里云算力销售,2025年阿里云营收同比增长26% [65][66] - 阿里将AI植入淘宝推出“淘宝问问”,2026年1月将淘宝、支付宝、飞猪整合进千问App,实现从“咨询”到“执行”的跨越 [67] 关键数据与公司基因对比 - 流量:腾讯微信月活14亿稳居第一,字节拥有抖音与TikTok两个10亿+月活产品且在时长上领先 [71] - 电商:阿里GMV约8万亿仍是老大,但抖音电商约3万亿+和拼多多已切分半壁江山 [71] - AI:字节豆包DAU过亿在C端领先;阿里Qwen在开发者和B端领先;腾讯混元试图在社交生态内深度渗透 [71] - 公司基因对比:腾讯核心哲学是产品主义,组织形态为联邦制,最强武器是社交关系链,AI策略是辅助/连接;字节跳动核心哲学是算法主义,组织形态为中台制,最强武器是推荐引擎,AI策略是颠覆/入口;阿里巴巴核心哲学是商战/运营主义,组织形态由中央集权转向强执行力,最强武器是供应链,AI策略是基建/云 [72]
大模型Infra新突破!腾讯混元开源LLM推理算子库,推理吞吐提升30%
量子位· 2026-01-22 19:13
文章核心观点 - 在大模型竞赛中,计算效率是关键瓶颈,单纯堆叠算力(显卡)已不足够,提升效率成为新的竞争焦点 [1] - 针对当前主流算子库在H20等推理卡上性能不佳、开发门槛高等痛点,腾讯混元AI Infra团队开源了生产级高性能LLM推理核心算子库HPC-Ops [2][4] - HPC-Ops通过底层架构优化,显著提升了核心算子性能,并在真实场景中验证了其能大幅提升模型推理效率 [5][6][47] 行业背景与痛点 - 大模型时代,计算效率是AI应用及发展的关键瓶颈 [7] - 现有主流算子库(如FlashInfer、DeepGEMM)主要针对NVIDIA H800等高配训练卡优化,与国内主流线上推理服务采用的H20等推理卡不匹配,难以发挥硬件峰值性能 [7][8][13] - 业务侧对极致吞吐、低延迟及复杂量化策略(如Blockwise FP8)的需求日益迫切,亟需更适配的底层支持 [9] - 现有主流算子库存在两大痛点:1) 设计复杂,修改适配成本高,阻碍了量化算法等加速研究的创新落地 [11][12];2) 目标硬件不匹配,导致在国内主流推理卡上无法发挥全部性能 [13][14] HPC-Ops解决方案概述 - 腾讯混元使用CUDA和CuTe从零构建了一套轻量、高效的LLM核心算子库HPC-Ops [4][15] - 该库包含FusedMoE、Attention、通信、Norm、Sampler及各类融合算子等核心模块 [16] - 其设计目标是通过抽象化工程架构、微架构深度适配及指令级极致优化,降低开发门槛并将核心算子性能逼近硬件峰值 [4] 核心技术细节 - **任务特性与硬件能力对齐**:针对访存瓶颈算子,通过调整指令发射顺序进行数据预取优化,确保高数据传输利用率;针对不同问题规格做细致指令对齐,去除冗余指令,使访存带宽可达硬件峰值能力的80%以上 [19][20] - **精细的任务调度和数据重排**:重新思考任务数据划分调度策略,保证任务均衡与cache连续性;采用persistent kernel隐藏开销;通过数据重排减少额外操作和显存占用,如在FP8 Attention Kernel中采用Interleave重排技术提升性能 [22][23][24] - **聚焦计算逻辑本身**:基于CuTe扩展开发vec抽象层统一负责高效数据搬运,利用Layout代数抽象隔离复杂的Tiling与计算逻辑,让开发者能聚焦于算法本身,降低维护门槛 [26] 性能提升数据 - **端到端推理性能**:在真实场景下,基于HPC-Ops,混元模型推理QPM(每秒查询数)提升30%,DeepSeek模型QPM提升17% [5][27] - **单算子性能对比**: - Attention算子相比FlashInfer/FlashAttention最高提升2.22倍 [6][44] - GroupGEMM算子相比DeepGEMM最高提升1.88倍 [6][31] - FusedMoE算子相比TensorRT-LLM最高提升1.49倍 [6][36] - **具体场景性能**: - **GroupGEMM**:在Batch<=64的低延迟场景下优势显著,较DeepGEMM最佳表现最高提升1.88倍 [31] - **FusedMoE**:在TP(张量并行)场景下相比TensorRT-LLM最大性能提升达1.49倍;在EP(专家并行)模拟均衡场景下最大提升1.09倍 [36] - **Attention**: - Prefill场景(输入长度128~64K):batch较小时,BF16精度下相比SOTA实现提升1.3倍;大batch时与SOTA对齐 [42][43] - Decode场景:BF16精度下提升1.35倍~2.22倍;FP8精度下,当Sequence Length较大时相比SOTA提升1.09倍~2.0倍 [44] 当前能力与集成 - HPC-Ops已在腾讯大规模生产环境中完成验证 [47] - 提供简洁易用的API,可无缝对接vLLM、SGLang等主流推理框架 [48] - 原生支持BF16、FP8等多精度量化方案 [48] - 以CuTe、CUTLASS为基础,提供数百行代码即可构建SOTA算子的实践范例,降低高性能CUDA内核开发门槛 [49] 未来发展方向 - 重点研发稀疏Attention算子,以解决长上下文大模型的内存与算力瓶颈 [51] - 拓展更丰富的量化策略,覆盖4bit/8bit混合精度等更多量化方案,进一步平衡推理速度与模型精度 [51] - 布局计算-通信协同优化的内核,通过融合多GPU间的计算与通信流程,大幅降低分布式推理场景下的通信开销,支撑超大规模模型高效部署 [51] 开源与社区 - HPC-Ops已在GitHub开放源码供开发者下载使用 [52] - 腾讯混元Infra团队欢迎行业技术实践者提交高价值PR,参与算子边缘场景优化、教程案例打磨等贡献,共同推动技术发展 [52]
计算机行业周报:AI应用行情演绎,关注场景变革和大厂链
东方财富· 2026-01-21 08:30
报告行业投资评级 - 强于大市(维持)[4] 报告的核心观点 - AI应用行情正在演绎,投资应关注由大厂引领的场景变革及其产业链机会[1][7] 行情回顾总结 - 计算机行业整体表现强势:本周(2026年1月12日至1月16日)申万计算机指数上涨3.82%,在31个申万一级行业中涨幅排名第一[13][14] - 年初至今表现领先:2026年以来,申万计算机指数累计上涨12.64%,在31个行业中排名第三[13][17] - 板块估值处于历史中位:截至2026年1月16日,申万计算机板块整体动态市盈率(PE-TTM)为96.40倍[1][20] - 个股表现分化:本周申万计算机行业249家公司上涨,105家公司下跌,涨幅前五名分别为通达海(39.73%)、浩瀚深度(30.57%)、杰创智能(28.95%)、石基信息(28.69%)和光云科技(28.43%)[1][18][20] - 业绩预告显示改善趋势:本周有10家公司发布2025年全年业绩预告,整体仍以亏损为主,但同比改善趋势明显,其中四维图新预告归母净利润为9009.25万元至11712.03万元,同比增长108.23%至110.7%[21][22] 行业重点动态总结 大厂产品迭代与资本开支 - **阿里巴巴**:以“千问App”为核心推进AI战略,将其升级为“办事型入口”[7] - 千问App已全面接入淘宝、支付宝、飞猪、高德等阿里核心生态,上线超400项AI办事功能[26] - 2025年12月,千问App月度访问量达2718万,环比增长323.13%,在国内AI WEB产品中排名第六[27][28] - 阿里巴巴通过生态闭环为模型提供真实任务数据,并推动季度大版本迭代,旨在抢占AI时代超级入口,重构流量分发[29][30] - 阿里巴巴CEO吴泳铭透露,AI服务器上架速度跟不上客户订单增长,不排除进一步增投AI基建的可能[36] - **字节跳动**:通过模型与平台协同加速AI产品化[7] - 随着豆包大模型1.8与Seedance 1.5 Pro发布,模型能力向多模态与智能体场景延伸[7][33] - 火山引擎通过MaaS(模型即服务)形式推动模型能力规模化落地[7][33] - 2025年11月,字节跳动旗下有4款应用进入中国Top 20 AI APP,月活用户数达34800.9万,环比增长13.40%[31][32] - **腾讯**:通过“自研+开源”策略强化AI能力[7] - 2025年12月5日发布自研大模型混元2.0,同时DeepSeek V3.2也在腾讯生态内逐步接入[33] - 腾讯从组织架构层面成立AI Infra部、AI Data部等,全面强化大模型研发体系[34] - 混元大模型已在腾讯内部超过900个场景和应用落地,尤其在广告、游戏等核心业务场景增效明显[34] - **全球资本开支指引强劲**:海外AI资本开支持续抬升,为全球算力产业链提供明确需求指引[35] - 台积电预计2026年资本支出将提升至520–560亿美元,创历史新高,明显高于2025年的409亿美元水平,管理层认为AI需求具有真实性与可持续性[35] 细分领域AI应用落地 - **AI医疗**:海内外企业共同加速,推动大模型嵌入医疗流程[7][37] - **海外进展**:Anthropic推出符合HIPAA标准的医疗大模型Claude for Health;英伟达与礼来计划五年内投资10亿美元共建AI生物医药实验室;OpenAI以约1亿美元收购医疗科技初创公司Torch;谷歌发布开源医疗模型MedGemma 1.5[41] - **国内进展**:更侧重基层医疗、健康管理等可落地场景,强调临床验证;百川智能开源医疗大模型Baichuan-M3在部分评测中超越GPT-5.2[37][40][41] - **技术展望**:预计到2030年,AI Agent将全面接管病历质控等非核心医疗流程,多智能体协同系统将基本覆盖常见病种的个性化诊疗[41][42] - **AI营销**:生成式AI正在改变营销行业的商业模式[7] - **商业化探索**:OpenAI于2026年1月宣布将在美区测试广告计划;谷歌在其Gemini模型驱动的AI购物工具中引入个性化广告功能,推出“通用商务协议”[42][44][45] - **范式变革**:用户信息交互方式从传统搜索转向生成式AI提问,催生了生成式引擎优化(GEO)新范式,其核心是争夺AI模型的“信源”认可[46] - **市场预测**:Gartner预测到2026年传统搜索引擎流量将下滑25%,到2028年50%的搜索引擎流量将被AI搜索蚕食[48] - 全球GEO市场规模预计将从2025年的112亿美元增长至2030年的1007亿美元[49][52] - 中国GEO市场规模预计将从2025年的29亿美元增长至2030年的240亿美元[53][54] 配置建议总结 - **AI医疗**:建议关注晶泰控股、英矽智能、美年健康、润达医疗、卫宁健康、迪安诊断等[7][58] - **AI营销**:建议关注迈富时、焦点科技、光云科技、明略科技等[7][58] - **大厂产业链**:资本开支是判断产业周期的“风向标”[58] - **阿里链**:建议关注光云科技、石基信息、捷顺科技、数据港、万国数据、宝信软件等[7][58] - **字节链**:建议关注汉得信息、润泽科技等[7][58] - **腾讯链**:建议关注泛微网络、星环科技、新点软件等[7][58]
计算机行业周报:AI应用行情演绎,关注场景变革和大厂链-20260120
东方财富证券· 2026-01-20 21:07
报告行业投资评级 - 强于大市(维持)[4] 报告的核心观点 - AI应用行情正在演绎,投资应关注由大厂引领的场景变革及其产业链机会[1][7] - AI应用正从能力验证走向高频使用阶段,大厂在模型与产品两端同步加速迭代,并推动资本开支进一步向算力及基础设施集中[7] - AI正在医疗与营销等细分领域率先实现落地,推动应用范式与商业逻辑发生根本性变化[7] 根据相关目录分别进行总结 1. 本周行情回顾 - 计算机行业整体表现强势:本周(2026年1月12日至1月16日)申万计算机指数上涨3.82%,在31个申万一级行业中涨幅排名第一[1][13] - 年初至今表现领先:2026年以来,申万计算机指数累计上涨12.64%,排名第3/31[13][17] - 板块估值处于历史中位:截至2026年1月16日,计算机行业整体动态市盈率(PE-TTM)为96.40倍[1][20] - 个股表现分化:本周申万计算机行业249家公司上涨,105家下跌,涨幅前五为通达海(39.73%)、浩瀚深度(30.57%)、杰创智能(28.95%)、石基信息(28.69%)、光云科技(28.43%)[1][18][20] - 业绩预告以改善为主:本周有10家公司发布2025年全年业绩预告,整体仍以亏损为主,但同比改善趋势明显,其中四维图新预告盈利且同比增长108.23%至110.7%[21][22] 2. 行业重点动态 2.1. 大厂产品侧迭代加速,关注新一轮资本开支进展 - **阿里巴巴**:以“千问App”为核心推进AI与核心生态深度融合,将其从“聊天工具”升级为“办事型入口”[7][26] - 2026年1月15日,千问App全面接入淘宝、支付宝、飞猪、高德等生态,上线超400项AI办事功能[26] - 2025年12月,千问App月度访问量达2718万,环比增长323.13%,在国内AI WEB产品中排名第6[27][28] - 阿里巴巴在2025年11月中国Top 20 AI APP所属公司中,月活用户数达13975.2万,环比增长29.60%[31][32] - 公司CEO吴泳铭强调AI to B和AI to C两大战略方向,并指出AI服务器上架速度跟不上订单增长,不排除进一步增投[36] - **字节跳动**:通过模型与平台协同推进AI能力产品化[7] - 随着豆包大模型1.8与Seedance 1.5 Pro发布,模型能力加速向多模态与智能体场景延伸[7][33] - 火山引擎通过MaaS实现模型能力规模化落地[7][33] - 公司在2025年11月中国Top 20 AI APP所属公司中,月活用户数达34800.9万,环比增长13.40%,拥有4款应用进入Top 20[31][32] - **腾讯**:通过混元模型与应用端协同落地,并从组织和算力底座层面强化AI能力[7] - 2025年12月5日发布自研大模型混元2.0,同时DeepSeek V3.2也在腾讯生态内逐步接入[33] - 2025年12月17日,公司升级大模型研发架构,成立AI Infra部、AI Data部等,强化研发体系[34] - 混元大模型已在内部超过900个场景和应用落地,尤其在广告、游戏等核心业务场景增效明显[34] - **全球资本开支指引强劲**:台积电预计2026年资本支出将提升至520–560亿美元,创历史新高,明显高于2025年的409亿美元水平,管理层认为AI需求具有真实性与可持续性[35] 2.2. 细分领域开启AI革命,关注场景技术变革 - **AI医疗**:海内外企业共同加速,产业进入分场景推进、产业化节奏加快的阶段[37][40] - **海外进展**:Anthropic推出符合HIPAA标准的医疗大模型Claude for Health;英伟达与礼来计划五年内投资10亿美元共建AI生物医药实验室;OpenAI以约1亿美元收购医疗科技初创公司Torch;谷歌发布新一代开源医疗模型MedGemma 1.5[41] - **国内进展**:更侧重基层医疗、健康管理等可落地场景并强调临床验证;百川智能开源医疗大模型Baichuan-M3在医疗评测中超越GPT-5.2;迪安诊断指出AI在基层医疗潜力显著但复杂病症仍依赖高质量多模态数据[7][41] - **技术展望**:随着基模能力发展,AI Agent预计将全面接管病历质控、排班系统等非核心医疗流程;多智能体协同系统将基本覆盖常见病种的个性化诊疗及跨科室复杂病例会诊[41][42] - **AI营销**:生成式AI正改变用户获取信息与决策的方式,推动行业由传统搜索向生成式引擎优化(GEO)新范式演进[7][46] - **商业化探索**:OpenAI宣布将在美区测试广告计划;谷歌在其Gemini模型驱动的AI购物工具中引入个性化广告功能,推出“通用商务协议”[42][44][45] - **范式变迁**:用户习惯于直接向AI提问获得答案,导致传统搜索引擎流量下滑,品牌需从搜索引擎优化(SEO)转向提升在AI输出结果中的“可见性与知名度”(GEO)[46] - **市场预测**:Gartner预测到2026年传统搜索引擎流量将下滑25%;到2028年,50%的搜索引擎流量将被AI搜索蚕食[48] - 全球GEO市场规模预计将从2025年的112亿美元增长至2030年的1007亿美元[49][52] - 中国GEO市场规模预计将从2025年的29亿美元增长至2030年的240亿美元[53][54] 3. 配置建议 - **AI医疗**:建议关注晶泰控股、英矽智能、美年健康、润达医疗、卫宁健康、迪安诊断等[7][58] - **AI营销**:建议关注迈富时、焦点科技、光云科技、明略科技等[7][58] - **大厂产业链**: - 阿里链:建议关注光云科技、石基信息、捷顺科技、数据港、万国数据、宝信软件等[7][58] - 字节链:建议关注汉得信息、润泽科技等[7][58] - 腾讯链:建议关注泛微网络、星环科技、新点软件等[7][58]