Workflow
GLM5
icon
搜索文档
发 token 当工资?工程师不只拿现金和期权,开始按 token 分身价了
AI前线· 2026-03-21 13:33
AI算力与Token成为新型薪酬与生产力核心要素 - 硅谷出现以Token作为吸引人才新筹码的趋势 英伟达CEO黄仁勋提出可为工程师配置相当于年薪一半价值的Token预算 以提升其10倍效率[2] - 社交媒体信息显示 阿里内部已开始向员工发放Token额度 允许免费使用悟空、Qoder等内部AI工具 并可报销外部AI开发工具费用[2] - Levelsfyi数据显示 “Copilot订阅”已被列入软件工程师薪酬申报的福利项 AI访问权限正成为继工资、奖金和期权后的第四项标准化福利[2] AI使用成本激增并影响企业人力成本结构 - Theory Ventures的Tomasz Tunguz个人AI推理成本年化已达10万美元 其使用量在六个月内从每月200美元攀升至每天92美元[5] - 通过迁移至开源模型并调优 Tunguz将成本降至原方案的12%[6] - Levelsfyi数据显示 收入前25%的软件工程师年薪约37.5万美元 叠加10万美元推理成本后 工程师完全成本升至47.5万美元 未来AI使用成本可能占工程师总成本20%以上[6] - AI开支正从“软件订阅费”转变为需单独追踪的新型人力成本 直接影响公司整体现金消耗[6] AI支出回报率与Token预算制度化趋势 - 衡量AI支出回报的核心指标是“每一美元推理成本换来的有效产出”[7] - Tunguz认为 年化1.2万美元的推理成本可换来每天完成31个任务的能力提升 若工程师年消耗10万美元算力 其生产力需提升8倍以上才合理[8] - 行业人士预测 到2026年 工程师薪酬谈判将包含Token预算 Token可能成为工资的一部分[8] - 模型评估公司Arena负责人提议 OpenAI和Anthropic应建立招聘网站 让岗位标注对应的Token预算[8] 算力资源稀缺性引发组织内部争夺与分配问题 - Token重要性提升背后是底层算力资源的争夺 模型运行成本已成为生产力分配问题[9] - 硅谷开发者认为 公司Token消耗量是关键指标 代表员工在积极尝试新AI工作流[9] - 为鼓励使用 领英每月提供2000美元AI补贴 昆仑万维每月提供100美元支持[10] - 面试中 求职者开始主动询问能获得的专属AI算力预算[10] - Meta、Google等公司内部曾因算力资源分配发生冲突 Google甚至设立专门委员会进行协调[10] - OpenAI总裁Greg Brockman指出 获得多少推理算力直接决定整体软件生产力[11] 算力资源分配不均可能导致新的职业不平等 - 工程师之间的差距正从经验、能力等 转向谁能获得更优的AI资源(如更高token上限、更低延迟、更少限制)[12] - “会不会用AI”转变为“有没有资格多用AI” 这成为组织资源配置问题 推理预算和模型访问权将体现员工或项目的核心程度[13] Token消耗激增推动模型服务商涨价 - OpenRouter平台数据显示 OpenClaw的token消耗量从2026年2月3日的806亿 在一个月内飙升至3月4日的3580亿 增长约4.4倍[14] - 截至3月2日当周 OpenRouter平台周度token调用量达14.8万亿 两个月内增长约160% OpenClaw贡献了绝大部分增量[14] - Anthropic数据显示 AI Agent的token消耗量最高可达普通聊天的15倍[14] - 腾讯云自2026年3月13日起调整部分模型计费 结束GLM5等模型的免费公测 Tencent HY2.0Instruct模型的输入、输出价格涨幅超过450%[15] - 智谱在两个月内两次提价 GLM-5模型平均涨价约50% GLM-5-Turbo在此基础上又提价20% 相对GLM-4.7的平均涨幅达83%[16] - 阿里云于3月18日宣布AI算力、存储等产品最高涨价34%[19] - 网友指出 token消耗量呈指数型放大 “睡后token”(持续自动消耗)是AI投资中重要且易被低估的变量[19] 行业巨头推动Token成为AI时代新价值单位 - 英伟达CEO黄仁勋的逻辑是:算力即营收 因为算力生成token token带来收入增长[22] - 算力被视作“印”token的机器 而token正被塑造成AI时代的货币[23] - OpenAI CEO Sam Altman提出设想:未来分配方式或是“全民基础算力” 每个人拥有GPT-7的算力份额 并可交易或捐赠[24] - Altman进一步描绘蓝图:将全球生成的天文数字级别token的一部分平均分给全球80亿人 使其成为“全球版全民基本财富”[24] - 有观点质疑 用AI token作为报酬是“company scrip”(公司代币)的数字化翻版 历史上曾被用作剥削工具并在美国被认定为违法[25] - 阿里已成立Alibaba Token Hub事业群 旨在建立以“创造、输送、应用Token”为核心的统一调度中心[25] - 摩根士丹利指出 ATH事业群的财务驱动逻辑与纯模型公司相似 未来可能成为阿里独立的估值组成部分[25] - 阿里认为 token是驱动数百亿AI Agent运转的基础燃料 也是人机交互的重要载体[26] - 国内外大厂正围绕token改写生产力关系并套上金融逻辑[26]
申万宏源证券晨会报告-20260311
申万宏源证券· 2026-03-11 08:29
市场表现概览 - 上证指数收盘4123点,单日上涨0.65%,近一月微涨0.01% [1] - 深证综指收盘2730点,单日上涨1.84%,近一月上涨2.79% [1] - 近6个月,中盘指数表现最佳,上涨20.27%,小盘指数上涨16.77%,大盘指数上涨4.06% [1] - 单日涨幅居前的行业包括非金属材料(上涨6.83%)、元件Ⅱ(上涨5.66%)、通信设备(上涨5.14%) [1] - 近6个月涨幅居前的行业包括非金属材料(上涨42.59%)、电子化学品(上涨37.66%)、通信设备(上涨36.86%) [1] - 单日跌幅居前的行业包括油服工程(下跌7.12%)、炼化及贸易(下跌4.35%)、化学原料(下跌3.27%) [1] - 近6个月,油服工程行业涨幅仍高达51.73%,炼化及贸易上涨28.87%,化学原料上涨31.56% [1] 宏观经济与市场前瞻 - “春节错位”效应或推高2026年1-2月经济数据,同时压低3月经济数据 [2][9] - 春节对供给侧(如工业增加值)影响大于需求侧,影响周期长达1个月以上,对出口影响周期长达45天 [9] - 今年春节呈现“更早返乡”现象,测算或推高1-2月出口增速8.4个百分点,压低3月出口增速18.6个百分点,对工业增加值增速影响在0.7-0.8个百分点之间 [9] - 剔除春节影响后,实际生产与出口出现改善,1-2月监测港口完成货物吞吐量同比上行7.4个百分点至9.3% [9] - 内需表现分化,消费高频数据积极修复,但投资高频指标如水泥出货率、玻璃消费同比出现不同程度下行 [9] - 综合判断,预计1-2月工业增加值同比为6%,出口同比上升至21.9%,社会消费品零售总额同比回升至3%左右 [9] - 投资方面,化债“挤出效应”缓和或推动固定投资增速好于2025年12月,但反弹幅度或相对有限 [9][11] 外贸数据深度解读 - 2026年1-2月出口(美元计价)同比21.8%,远超市场预期的7.3% [22] - 出口高增长主因是“春节错位”推升增速8.4个百分点,次因是外需改善推升增速6.8个百分点 [22] - 从商品结构看,纺织服装、塑料家具等劳动密集型行业出口反弹幅度更大,部分受益于“春节错位” [22] - 集成电路、自动数据处理设备及零部件、汽车零部件等资本品出口也明显反弹,或反映新兴经济体工业化提速 [22] - 从国别结构看,对美国出口(春节调整后)回升13.4个百分点至-16.7%,对非洲出口回升18.3个百分点至40.1%,对东盟出口回升9.2个百分点至20.3% [22] - 1-2月进口(美元计价)同比19.8%,其中加工贸易进口同比上行19.1个百分点至37.9%,机电产品进口同比上行14.9个百分点至23.7% [22] - 展望后续,“春节错位”或令3月出口读数下降,但全年出口仍有望保持较高增长 [22] 未来产业估值体系 - 针对未盈利、不确定性高、处于发展早期的未来产业公司,传统DCF估值模型失效 [11] - 报告构建了“未来产业定价体系”,包含七个估值子模型:实物期权法、风险调整净现值法(rNPV)、里程碑法、用户价值法、生态位估值法、要素成本法及相对估值法(如P/S) [11] - 该体系的应用分为三步:第一步为拟估值公司选定保守、中性、乐观情景下的估值子模型;第二步设定各子模型的定价权重;第三步加权计算最终估值并动态调整 [3][11] - 以SpaceX为例,其估值需分层进行:具备高额经常性收入的Starlink业务采用可比估值法,估值4291亿美元;太空算力业务通过实物期权法量化期权价值,约3121亿美元;火星愿景以要素成本法划定底线 [15] - 以OpenAI为例,采用保守(可比估值法,4000亿美元)、中性(用户价值法,5015亿美元)、乐观(生态位估值法,1-1.28万亿美元)三档模型估值,结合市场情绪权重(0%,50%,50%)计算,最终估值达7808亿美元,与一级市场估值(约7500亿美元)接近 [15] - 股价波动反映了不同风险偏好投资者(如产业资本、机构投资者、愿景型资本)采用不同估值模型并相继掌握定价权的结果 [11] 交通运输与油运行业 - 中东局势导致霍尔木兹海峡原油通行受阻,3月2-6日通行量均为0,推高风险溢价 [16] - 本周VLCC加权平均运价环比大幅上涨89%至390,970美元/天,其中中东湾-中国航线运价跳涨108%至480,557美元/天 [16] - 成品油运输同样受益,LR2(TC1航线)运价环比上涨205%至154,669美元/天,MR平均运价环比上涨95%至61,568美元/天 [16][17] - 报告测算,货主可接受的油轮运费理论上限约为93美元/桶(对应TCE约366万美元/天),而无保险时船东理论可承受下限约为40-87.5美元/桶(对应TCE 155万-343万美元/天) [16] - 油运高景气度正加速向造船业传导,油轮已连续2个月成为新签订单主力 [19] - ST松发2025年营业收入216.4亿元,同比增长275%,归母净利润26.5亿元,同比增长1083% [19] - 恒力重工成为油轮订单爆发最直接受益者,2026年以来已新签超40艘VLCC,手持订单金额自年初195亿美元快速增至260亿美元 [19] - 二手船价已连续13个月上行,部分船型二手船价超越新造船价,油轮新造船价率先进入回升趋势 [19] 人工智能与科技行业 - 国产大模型在推理、编程、多模态等领域迭代迅速,性能接近海外顶尖水平,在Arena Code排行榜逼近海外顶尖 [22] - 大模型技术范式高度收敛至Decoder-Only+MoE架构,竞争从“找路径”转向“卷效率” [22] - 以智谱为例,其最新发布的GLM5在代码和Agent能力上出圈,位列Arena Code排行榜国内第一,尽管GLM5涨价,但调用量大幅提升 [23] - 智谱以ToB场景为主,构建了全场景覆盖的国产模型矩阵,MaaS平台赋能金融、公共服务等领域 [23] - 投资机遇关注:1)原生大模型公司,如智谱、Minimax;2)AI编程,如卓易信息;3)Agent应用,如税友股份、鼎捷数智等;4)多模态应用,如虹软科技、万兴科技等 [25] 互联网与消费行业 - 京东2025年第四季度营收3523亿元,同比增长1.5%,其中服务收入793亿元,同比增长20.1% [25] - 季度内,带电品类收入受高基数影响同比下滑12.0%至1533亿元,但日百品类收入同比增长12.1%至1197亿元,连续5个季度双位数增长 [25] - 京东外卖业务亏损环比收窄,订单量保持稳定,市场份额超15%,公司目标2026年市场份额达30% [25] - 京东年度活跃用户数超7亿,季度活跃用户数与购物频次同比增长超30% [25] - 公司宣布2025年年度股利为每股普通股0.5美元,总额约14亿美元,并于2025年回购约30亿美元股票 [25]
计算机行业周报:OpenClaw引爆智能体浪潮,Token消耗迎来指数级跃升
国盛证券· 2026-03-09 09:24
报告行业投资评级 - 增持(维持)[5] 报告的核心观点 - AI Agent(特别是OpenClaw)正从试点进入规模化落地阶段,其渗透率和任务复杂度的提升正驱动Token消耗量迎来指数级增长,并催生刚性算力需求[1][2][4] - Token消耗激增导致主流模型厂商出现算力缺口,算力供需错配加剧,正从技术和经济层面驱动算力产业链(芯片、架构、系统)的全面升级[3][4] - 随着国内市场Token消耗量爆发,国产算力有望凭借成本优势及生态完善,在基础设施层逐步占据主导地位[4] 根据相关目录分别进行总结 1. Agent泛化:Agent进入实际落地阶段,OpenClaw引领渗透加速 - **OpenClaw成为重要催化剂**:2026年初推出的OpenClaw是一款可在用户自有设备上运行的个人AI助手,一经推出便全球爆火,成为AI Agent普及化加速的重要催化[1][11] - **用户数据验证火爆程度**:在OpenRouter平台上,OpenClaw是2026年2月5日至3月5日期间Token消耗量最多的应用,高达7.63T tokens,远超第二名[13][15] - **Token消耗量飙升**:以OpenRouter平台数据为例,OpenClaw的Token消耗量从2026年2月3日的80.6B飙升至3月4日的358B,一个月间翻了约4.4倍[1][15] - **厂商积极布局**:各大模型厂商纷纷加大Agent布局,例如Minimax Agent已能处理复杂任务,如为HR自动整合20所名校的校招信息,或自动分类整理500张电商图片,AI Agent已进入实际落地阶段[19][20][23] 2. 需求爆发:任务密度与复杂度提升,Token消耗迎来指数级跃升 - **Agent特性导致高消耗**:由于AI Agent天然具备多工具调用、长上下文、多流程工作特性,其Token消耗量增长速度极快[2][24] - **算力需求呈指数增长**:以单次对话机器人为基准,图像生成、推理、视频生成、深度研究的算力需求分别为10倍、100倍、3000倍、1000000倍[24][26] - **中国市场消耗量激增**:中国整体日均Token消耗从2024年初的1000亿,增长至2025年中的30万亿,再到2026年2月主流大模型合计日均Token消耗已达180万亿级别[2][30] - **市场规模与渗透率预测**:预计中国AI Agent市场规模将从2023年的574亿元飙升至2028年的33009亿元,年复合增长率达125%[30][34]。KA(大客户)及SMB(中小企业)企业Agent渗透率预计从2023年的3%/0.5%提升至2028年的25%/10%[30][34] - **长期增长动力强劲**:根据IDC预测,中国活跃智能体数量将在2031年突破3.5亿,年复合增长率超135%,伴随任务复杂度提升,智能体Token消耗将迎来年均超30倍的指数级跃升[2][32] 3. 供给缺口:推理算力缺口显现,成本体验权衡驱动产业升级 - **算力需求转向推理**:智能体核心开销集中在推理阶段,推理负载占比预计从2024年的65%提升至2028年的73%[3][36][40] - **推理市场规模扩大**:中国推理算力市场规模预计从2024年的175.2亿元增长至2028年的2931.2亿元,2024-2028年复合增长率约102%[37][39] - **厂商出现算力缺口**:Token消耗骤增导致主流模型厂商算力缺口显现,例如月之暗面公开表示缺卡并寻求算力支持,智谱因GLM5过于火爆对coding plan采取每日限售措施[3][42][44] - **需平衡延迟、吞吐与成本**:Token消耗和算力需求非简单线性关系,需权衡延迟和吞吐以平衡经济性和用户体验[3][43] - **产业化三要素**:AI Agent产业化的核心要素是模型能力、交互速度和Token成本,三者共同决定了应用的经济性与广泛性[47][48] - **产业链升级路径**:为达成三元平衡,需从三方面协同发力: - **算力芯片端**:提升性能与能效比,例如英伟达新架构实现推理吞吐量提升约10倍,成本降低10倍;亚马逊Trainium芯片在推理任务中比英伟达H100 GPU便宜约30%至40%[50][52] - **架构设计端**:通过注意力机制革新(如PagedAttention、RadixAttention)、动态批处理演进、内存调度优化等技术降低单Token算力消耗[54] - **系统协同端**:依托超节点协同技术优化资源利用率与整体能效,实现规模化部署下的综合成本下降[54] 4. 投资建议 - **关注国产算力**:建议关注海光信息、寒武纪、摩尔线程、沐曦股份等国产算力公司[4][55] - **关注超节点**:建议关注中科曙光、浪潮信息等超节点公司[4][55]
开工第一天,我发现同事变成了龙虾
36氪· 2026-03-07 17:09
文章核心观点 - AI智能体(以OpenClaw为代表)正经历快速发展阶段,其核心演变逻辑是越来越像人,能够操作本地文件和环境,成为能处理实际任务的“私人助理”,这标志着AI应用可能已进入一个新的“杀手级应用”阶段 [6][7][17] - OpenClaw的爆火(如GitHub星数超25万,成为软件类第一)及其催生的庞大生态(如ClawHub技能社区),吸引了主流云厂商和大模型公司全面入局,预示着其可能成为AI时代的基础设施 [8][10][47][48] - 尽管潜力巨大,但当前阶段的OpenClaw面临严峻的安全、隐私和成本挑战,包括操作风险、权责不对等、网络安全漏洞和高昂的token消耗,这些问题制约了其当前的实用价值 [49][54][57][58] AI智能体的演进阶段与OpenClaw的定位 - **第一阶段(2023年)**:以早期ChatGPT为代表,AI实现了听懂和说人话,开始“像人” [18] - **第二阶段(截至2025年初)**:模型发展出多模态能力(看图、视频、听语音)和合理的推理能力,进一步“像人” [18] - **第三阶段(2025年)**:以Manus为代表的智能体,被配置了云空间、虚拟电脑等工具和环境,使其“像人”一样拥有工位,能处理更多事务 [18] - **第四阶段(当前)**:以OpenClaw为代表,智能体不仅能操作云端工具,还能直接处理使用者本地终端文件,环境与人对齐,理论上能完成人在电脑上的所有操作 [18][19] OpenClaw的功能、部署与生态 - **核心功能**:被定义为“真正能做事的AI”,可作为私人助理在聊天应用中完成清理邮件、管理日历、办理航班手续等任务 [15] - **部署方式**:主要有两种,一是部署在云端虚拟服务器(VPS),二是部署在本地终端(如个人电脑)。本地部署被视为“完全体”,能实现与本地文件和应用的深度交互,而云端部署体验更接近前代智能体Manus [21][22][23] - **技能社区(ClawHub)**:一个集中提供“技能包”(skills)的社区,用户可为OpenClaw加载特定技能以扩展其能力。该社区已有接近2000个skills,覆盖从特定领域知识到可重复工作流的各种功能,降低了使用门槛并形成了生态正向循环 [31][32][38][40][43][44] 市场反响与行业参与 - **市场热度**:OpenClaw在代码托管平台GitHub上热度呈指数上升,曾单日狂刷2万星,截至3月3日星数超过25万,成为GitHub上星数第一的软件项目 [8] - **行业入局**:阿里云、腾讯云、字节的火山引擎、智谱、Minimax等主流云厂商和大模型公司均已入局,从提供云服务器、轻量化部署方案到推出自家“claw”应用,全方位争夺市场 [10] - **历史意义**:其取代Linux和React成为GitHub软件类“榜一”,被外界期待成为AI时代的“基础设施”及象征 [47][48] 现存挑战与风险 - **安全问题突出**:OpenClaw因权限过高导致多起操作事故,例如未经确认删除用户邮件、胡乱删除本地文件、搞坏代码项目等。一项安全审计显示,在34个标准案例中,整体安全通过率仅为58.9%,尤其在意图误解与不安全假设维度表现最差 [51][52][53][54] - **权责不对等**:AI助手拥有高权限却无需承担责任,与用户期望的“能力越大,责任越大”形成悖论 [57] - **网络安全与成本**:存在端口暴露、权限密钥泄露等网络安全风险。同时,token消耗巨大导致使用成本高昂 [57][58]
国产大模型及Agent动态更新
2026-03-04 22:17
国产大模型及Agent动态更新20260304 - 关键要点总结 一、 行业与公司 * 涉及行业为人工智能大模型与AI Agent行业,具体包括国产大模型厂商、海外模型厂商及算力产业链[1] * 涉及的公司包括国产模型厂商Kimi、Minimax、深度求索(Deepseek)、智谱AI(GLM),以及海外模型厂商Anthropic、OpenAI[2][3][4][5] * 产业链关注点包括算力租赁、小云厂、IDC等A股相关公司[14] 二、 市场表现与增长信号 * 2026年初,国内外模型年度经常性收入(AR)与Token消耗进入爆发期[1][2] * **海外侧**:Anthropic的AR从2025年12月的约90亿美元,跃升至2026年1月的约140亿美元,并在2026年2月进一步提升至约200亿美元,核心驱动来自Claude Code等产品[2] * **国内侧**:Kimi在2026年1月前20天的营收已超过其2025年全年总和[1][2];Minimax披露其2026年2月AR超过1.5亿美元[1][2] 三、 国产模型竞争力与市场份额跃迁 * 国产模型在OpenRouter平台的流量占比出现两次关键跃迁[3] * 第一次在2025年12月,伴随Deepseek V3.2发布,其DSA架构使长文本输出的token价格降至原来的1/7,国产模型占比提升至约10%-20%[3] * 第二次在2026年1月,伴随GLM 5发布,国产模型token消耗占比从约15%-20%提升至约25%[3] * 市场预期Deepseek V4的发布有望将国产模型在相关平台的占比从约25%推升至30%甚至40%以上[4] 四、 模型技术架构与“价格最优解”趋势 * 在有限算力供给约束下,国内模型架构呈现向“价格最优解”收敛的趋势,市场逐步找到1万亿参数规模以下的最优组合[4] * 模型能力提升节奏:未来两个月,1万亿参数规模以下的国内模型能力预计进入密集提升周期,尤其在coding领域正逐步逼近最优性价比组合[4] 五、 国产Coding模型能力评估与演进路径 * **全球相对位置**:从2026年1月的SWE Revenge测试集观察,国产模型大多得分在40分以上,海外领先模型如Claude 4.6、GPT 5.3在50分以上,国产模型整体大致相当于海外2025年10月左右的水平[5] * **差距来源**:主要来自两到三倍的参数规模差异以及数据质量差异[6] * **当前分工**:现实工作流中,常使用海外模型完成较大的代码框架编写,再由国产模型完成具体模块的编译,以获得更高性价比[6] * **演进路径**:随着国产模型参数规模从1万亿向1.4-1.5万亿、再向2万亿演进,其抽象构思能力增强,有望逐步参与到更高价值量的“大框架编写”环节[6] * **市场空间**:海外Coding模型(如Anthropic)到2022年年底可能达到约500亿美元AR的层级,这被视为国产模型市场空间的上限参考[7] 六、 AI Agent体验跃升的核心驱动 * **训练数据结构变化**:2025年开始,训练数据中混入更多“符合人类偏好”的数据(如报告结构、PPT审美数据),使模型输出更拟人化,目标可达人类输出的80%甚至90%[8][9] * **工具调用工程化跃迁**:这是2025年至2026年Agent体验发生“翻天覆地”变化的核心驱动[8] * **2025年痛点**:工具定义与说明挤占大量上下文。以128K上下文为例,工具调用可能占用60-80K,仅剩30-40K用于文本输出,导致Agent通常只能执行3-5个任务,且调用失败率高[10] * **工程化改进**:2025年11月,Anthropic推出scale机制,将工具库内容迁移到本地文件,仅向模型保留简洁描述。这使有效上下文从约30-40K提升到100K以上,调用成功率显著提升[11] * **能力量化变化**:Agent从过去跑3-5步就失败,提升到可运行10步以上,甚至支持执行持续约20分钟的任务[11] 七、 Agent技术发展方向 * **记忆系统**:OmniCloth采用本地两层记忆系统实现“千人千面”,第一层记录每日对话记忆,第二层对历史记录进行统一摘要,用较简单的机制实现个性化效果[12] * **Multi-Agent/Agent集群**:2026年的核心价值是通过对不同Agent分工,确保每个Agent上下文足够纯净,避免多任务导致的上下文污染,让每个子系统更稳定地发挥接近人类80%-90%的输出质量[13] 八、 2026年产业趋势总判断与投资关注点 * **总判断**:2026年被定义为算力投入与模型收入产出循环“第一次真正转起来”的一年,国内外模型厂收入有望继续极高速增长,且增速可能显著超出市场预期[14] * **A股关注点**:主要集中在国产算力链条,包括算力租赁、具备H100/H20等服务器现货的小云厂、以及服务器上线后存在大量放置需求的IDC等环节[14] * **海外循环与出海机会**:海外侧的“算力投入-产出”循环可能比国内更明显、兑现更早。2026年存在一些从0到1的出海方向,整体判断偏积极[15] * **ROI担忧缓解**:资本市场此前对投资回报率(ROI)的担忧,预计在2026年得到较好解决,2026年上半年将看到AI Agent与模型性能提升及变现落地的进一步发展[15]
AI行业主线开年布局展望:智谱&MiniMax
2026-02-25 12:12
电话会议纪要关键要点 一、 涉及的行业与公司 * 行业:**通用人工智能 (AGI) / 大模型** 行业,具体涉及**模型能力、AI Agent、AI Coding、多模态生成**等细分领域 [2][16][29][34] * 公司:**智普 (Zhipu)** 和 **MiniMax**,被描述为全球前两家也是仅有的两家上市大模型公司 [2] 二、 关于智普 (Zhipu) 的核心观点与论据 1. 公司定位与核心价值 * 公司是**非常纯粹的基模公司**,其核心价值与后盾是**研发能力** [3][4] * 公司背景为**清华系、国家队**,拥有豪华且稳定的股东结构,包括创始人、互联网巨头(美团、蚂蚁、阿里)及中央/地方国资 [3][8][9] 2. 模型能力与战略路线 * 公司确立了以 **“中国最领先的coding模型”和“coding-agentic-tree”** 为主要方向的战略路线 [4] * 模型能力处于**国内领先、全球前列**:GLM5在综合跑分(Artificial Analysis Index)中位列**全球第四、国内第一**,在单体表现上可对标Anthropic Claude 4.5 [11][22] * GLM5实现了参数规模的大幅提升,从GLM4.7的**3500多亿**参数量提升至**7400多亿**,接近翻倍 [25] * 公司持续在模型架构、强化学习框架(STEM)、注意力机制优化(降低计算复杂度)等方面进行打磨,以提升效率和降低成本 [25][26] * 公司创始人看好并致力于在**知识学习、自主学习**方向取得突破,以解决更复杂的现实问题 [12] 3. 商业化路径与增长驱动 * **商业化处于早期阶段**,收入高速增长(三倍增长)但亏损持续,因需持续投入算力与研发以保持领先地位 [10] * **增长引擎正从本地化部署转向云端和API**:2024年本地化部署收入占比**80%以上**,预计到2026年云端部署将占**50%以上**,长期看API有望占比**50%以上**,成为最核心收入来源 [14] * **Token消耗量高速增长**是API收入的先行指标:2024年Token消耗量约**0.2T**,2025年上半年达**4.6T**,预计2025年底在**6T以上** [15] * **目标市场**:本地企业客户是基本盘,**全球开发者及科技企业**是增量核心市场 [13] * **对标Anthropic**,认为其以Coding为抓手的商业化路径(收入从十几亿翻至四十五亿,再预期翻至一百八十亿)具有参考意义,智普的收入结构更接近Anthropic [5][18] 4. 竞争策略与市场机遇 * 凭借**领先的模型能力结合高性价比**(GLM5 Coding Plan价格不到Anthropic的50%)来抓住海内外中长尾市场需求 [23] * 模型能力提升后敢于**提价**,GLM5发布后平均涨价幅度在**30%以上** [23] * 专注于Coding领域,并以此为抓手向**企业级市场渗透**,与国产芯片(摩尔线程、含光等)深度适配,实现“国产芯+国产模型”双向赋能 [4][24][26] * **AI Coding是核心市场机遇**:2025年AI生成代码已占全球代码产量的**40%**,中美AI Coding市场测算规模在**2000多亿美金(万亿人民币)** [19][20] * 在竞争格局中,**独立模型厂商凭借技术趋势仍有立身之地**,行业已收敛至少数头部厂商 [17][19] 5. 产品与生态布局 * 发布**GLM Office**能力,对标Claude Desktop,渗透办公场景,实现表格自动化等操作 [26] * 在AI应用层面有**AutoGLM**(AI Agent产品)等作为商业储备,但尚处商业化早期 [27] * 公司**70%多**的员工为研发人员,构筑了人才与研发壁垒 [28] 三、 关于MiniMax的核心观点与论据 1. 公司定位与核心优势 * 公司是**AI native(人工智能原生)** 公司,组织、流程、产品均围绕大模型设计,旨在实现**AGI**愿景 [29][32] * 核心竞争力概括为四点: 1. **早期押注全模态融合**,在文本、语音、视频、音乐等多模态同步研发,积累先发经验 [31] 2. **全球化与可规模化**的市场策略 [29] 3. **“前店后厂”技术即产品路线**,研发与产品高度协同,加速迭代并降低技术转化摩擦 [32] 4. **高效扁平化的AI原生组织**,据称效率可能比90% AI赋能组织高十倍,实现高人效 [32][36] 2. 模型能力与多模态布局 * 模型能力处于**全球前列**,在文本、视频、语音等多个模态均达到世界领先水平 [30][34] * **文本模型(M系列)**:支持极长上下文(100万tokens),通过“交错思维链”等方式提升Agent任务处理与泛化能力,M2曾登顶全球榜单前五,M2.5在编程、工具调用等场景迅速达到使用量第一 [39][40][41] * **视频模型(海螺系列)**:通过自研NCR架构,确立全球视频生成第一梯队地位,注重复杂指令遵循与物理表现 [30][44] * **音频/语音模型**:凭借拟人化情感表达和多语言支持建立竞争壁垒,处于全球领先位置 [30][45] * **音乐与图片模型**:支撑音频生态与AI原生创意设计场景 [30] 3. 商业化与产品矩阵 * 商业化通过**开放平台(Open Platform)** 提供多模态API服务,以及直接面向用户的**产品矩阵**进行 [56] * **产品矩阵主要包括三大类**: 1. **生产力工具(AI Agent)**:桌面端形态,锚定高效生产场景,在长文本理解、复杂指令遵循等方面表现亮眼,处于全球第一梯队 [46][47] 2. **音视频生成产品**:包括“海螺”(视频)和“再次”(音频),用于降低创作门槛和赋能多模态内容消费 [50] 3. **情感陪伴产品**:包括面向海外的“Talking”和国内的“心忆”,以拟人化对话和沉浸式体验获得高用户黏性 [30][54] * **开放平台增长亮眼**,高毛利水平得益于:技术能力带来的训练推理效率、AI用法建设、以及**视频和音频API结构性拉升毛利**(文本API市场竞争更激烈) [56][57] 4. 行业趋势与竞争策略 * 行业处于**模型能力非线性跃升、市场规模快速增长**的阶段:全球生成式AI收入规模预计从2023年**929亿美元**增至2030年**16000亿美元**,CAGR达**37%** [34] * 竞争已收敛至**头部厂商轮番领跑**的状态 [34] * MiniMax的取胜关键在于:**保持模型智能水平的全球领先** 和 **维持先发优势** [35] * 维持先发优势依赖于 **“workload-model fit”(工作负载与模型匹配)**,即领先模型能更好地嵌入用户工作流,形成迁移成本与习惯粘性 [37][38] * 未来模型发展方向:**统一多模态、Agentic(智能体化)、持续学习** [42] 5. 市场空间与估值 * **AI Agent** 有达到**十万亿美元**市场空间的想象空间 [49] * 音视频产品市场:专业创作(B端)中性假设约**30亿美元**,企业级内容生成(B端)中性假设约**94亿美元**,社交与消费级(C端)想象空间最大,中性假设约**917亿美元** [53] * 公司估值参考OpenAI和Anthropic,给予**2026年75倍PS估值** [59] 四、 其他重要内容 1. 共同面临的行业背景与风险 * **Agent AI需求涌现**,带动API调用量和Token消耗量大幅增长,是当前推动模型公司预期攀升的核心因素 [2][6] * 市场普遍认为大模型趋势可能侵蚀传统SaaS、应用及互联网业务 [2] * 投资大模型公司本质是购买一张 **“通往未来的门票”**(AGI或有利生态位),因此估值需考虑其早期阶段和未来潜力,而非静态对比 [7] * 提及的风险包括:**研发、商业化、知识产权**相关风险 [28] 2. 中国市场的特点 * 中国AI产业在大模型拉动下增速非常快 [16] * 在中国,**B端(企业端)商业化变现能力目前优于C端**,因为企业付费意愿更强,这契合了智普等公司以B端为主的商业模式 [17] * 中国竞争格局与海外类似,能留在牌桌上的模型厂商越来越少 [17]
未知机构:大模型动态更新OpenAI2月15日OpenClaw-20260224
未知机构· 2026-02-24 13:05
纪要涉及的行业或公司 * **行业**:人工智能(AI)行业,特别是大模型领域 [1][2][3] * **公司**: * **OpenAI** [1] * **Anthropic** [2] * **谷歌** [2] * **MiniMax** [3] * **智谱** [3] * **快手万擎、中科曙光** [3] 核心观点和论据 * **OpenAI战略聚焦与融资进展**:公司正将多智能体系统定位为下一个产品阶段的核心,并聘请了相关领域专家领导个人AI代理业务 [1] 公司即将完成超1000亿美元融资,投后估值或将达8500亿美元 [1] 公司大幅上调未来五年营收预期,较之前内部预测高出约27% [1] * **OpenAI成本控制与规划调整**:公司将2030年算力支出目标从约1.4万亿美元大幅下调至约6000亿美元 [1] * **Anthropic推出新安全功能**:公司为Claude AI模型推出可扫描代码库漏洞、建议软件补丁的新安全功能,目前处于有限研究预览阶段 [2] * **谷歌模型性能与成本优势**:谷歌推出Gemini 3.1 Pro,其核心性能指标较前代版本实现翻倍增长 [2] 在ARC-AGI-2评估中,Gemini 3.1 Pro取得77.1%的成绩,超越了GPT-5.2与Claude Opus 4.6 [2] 根据Artificial Analysis评估,Gemini 3.1 Pro已跃居榜首,领先Claude Opus 4.6达4分,且运行成本不到后者的一半 [2] * **中国AI模型表现突出**:在截至2月21日的LLM排行榜中,MiniMax M2.5排名全球第一,Token处理量达3.07万亿 [3] 同期,智谱GLM5排名全球第三,Token处理量达1.03万亿 [3] 其他重要内容 * **开源项目动态**:OpenClaw成为由OpenAI支持的基金会运营的开源项目 [1] * **市场影响**:Anthropic推出AI安全功能引发美股网络安全股集体大跌 [2] * **商业合作**:快手万擎、中科曙光等公司已接入相关AI商业模式,实现跨越式进阶 [3]
未知机构:布局马年强推国产链从应用到算力-20260224
未知机构· 2026-02-24 11:25
纪要涉及的行业或公司 * **行业**:人工智能(AI)行业,特别是大模型、多模态AI应用、AI算力领域 [1][2][3][4] * **公司**: * **AI应用/模型公司**:字节跳动(Seedance2.0)、智谱AI(GLM5)[2][3] * **合作/产业链公司**:兆驰股份、风行(兆驰旗下)、深信服、昆仑万维、阜博集团、卓易信息 [3] * **算力产业链公司**:“双王”(未具体指明)、HW链(华为链)、东阳光、润泽科技、东方国信等 [4] 核心观点和论据 * **核心观点一:国产大模型技术快速进步,与国外差距持续缩小** [2][3] * **论据**:春节期间,字节跳动的多模态模型Seedance2.0和智谱AI的生产力模型GLM5相继发布,展现了国产模型的强劲实力 [2][3] * **论据**:Seedance2.0已达到全球SOTA(State-Of-The-Art)级别 [2][3] * **论据**:技术进步得益于2025年下半年在强化学习(投入从0提升至30%)和高质量数据方面的投入 [2][3] * **核心观点二:国产AI应用,特别是多模态视频生成,市场潜力巨大** [3] * **论据**:Seedance2.0和GLM5已在各自应用场景验证了数倍的效率提升,影响力超过去年的DeepSeek,且能执行长程Agent任务 [3] * **论据**:多模态视频生成被视为中国特色的AI应用,有望驱动千亿级别市场的内容供给持续爆发 [3] * **论据**:工具和分发层是B端入口,得创作者得天下(预计市场格局三七开) [3] * **核心观点三:国产算力需求有望进一步加速** [4] * **论据**:基于“安迪比尔定律”(硬件性能提升被软件需求迅速吞噬),AI应用的爆发将驱动底层算力需求增长 [4] * **论据**:重申看好国产算力链,其长期安全边际已夯实 [4] 其他重要内容 * **投资建议与布局方向**: * **整体策略**:全面布局AI产业链,从应用到算力 [1][2][4] * **应用层**: * 字节链(Seedance2.0)重点关注兆驰股份(旗下风行已官宣合作) [3] * 智谱链(GLM5)重点关注深信服(其Coding产品首批接入) [3] * 多模态应用重点关注兆驰股份、昆仑万维、阜博集团 [3] * AI编程(Coding)重点关注卓易信息和深信服 [3] * **算力层**:重申关注“双王”、HW链(华为链)以及IDC核心龙头如东阳光、润泽科技、东方国信等 [4]
未知机构:广发机械专用设备跟踪半导体设备-20260224
未知机构· 2026-02-24 10:50
**涉及的行业与公司** * **行业**:半导体设备、光伏设备、核聚变/裂变(新能源) * **提及公司**: * **半导体设备**:华峰测控、强一股份、长川科技、精智达、金海通、矽电股份、精测电子、微导纳米、迈为股份、帝尔激光[2] * **光伏设备**:迈为股份、拉普拉斯、连城数控、捷佳伟创、奥特维、晶盛机电、高测股份、帝尔激光、京山轻机、博迁新材、聚和材料、帝科股份[2] * **核聚变/裂变**:永鼎股份、王子新材、联创光电、精达股份、合锻智能、国力电子、旭光电子、国光电气、中国铀业、江苏神通、应流股份[3] **核心观点与论据** **半导体设备** * **行业景气度高涨**:海力士表示所有客户需求都无法满足,目前DRAM及NAND库存仅剩约4周,且2026年HBM产能已全面售罄,存储景气度依旧,价格有望继续上涨[1][2] * **算力需求驱动**:国产大模型(字节的Seedance2.0、智谱的GLM5)的进步以及春节期间的使用体验凸显了算力的紧缺[1][2] * **投资建议**:继续推荐半导体设备,并关注一系列相关公司[2] **光伏设备** * **太空光伏进展**:T启动美国太阳能工厂的选址工作,同时T/S的海外洽谈结束,等待订单进一步明确[2] * **去银化技术推进**:在LJ和JK的带动下,其他龙头包括TH、JA、TW、ZT等也均明确了相关计划,节后有望看到持续进展[2] * **投资建议**:分别关注太空光伏和去银化两个技术方向的相关公司[2] **核聚变/裂变** * **海外技术突破**:Helion取得重大突破,做到1.5亿度的离子温度(比之前的1亿度提高50%),同时测到14MeV中子,证实了聚变反应的发生[3] * **国内关注度提升**:核聚变登上央视春晚合肥分会场,成都、南昌、合肥等项目有望陆续启动,上海超导上市临近[3] * **投资建议**:关注核聚变产业链及传统裂变堆相关公司[3]
算力大利空?OpenAI算力支出被爆腰斩!背后发生了什么?
新浪财经· 2026-02-22 16:50
OpenAI战略调整与财务规划 - 公司将其2030年总算力支出预算从2024年11月提出的约1.4万亿美元大幅下调至约6000亿美元,削减幅度达8000亿美元 [4][26] - 公司同时给出2030年总收入预期将超过2800亿美元,消费者业务与企业业务各占一半,显示出支出与收入挂钩的“量入为出”新策略 [5][27] - 2025年公司营收为131亿美元,超过100亿美元目标,现金消耗为80亿美元,低于90亿美元预期,财务表现超预期 [5][28] - 2025年公司推理成本同比增长三倍,调整后毛利率从2024年的40%下降至33%,反映出模型越聪明、推理越费钱的成本困境 [6][29] - 公司预计到2030年才能实现现金流转正,意味着未来四年仍需依赖外部融资 [10][32] 行业竞争格局与主要参与者动态 - 谷歌母公司Alphabet公布2026年资本支出计划为1750亿至1850亿美元,较2025年增长近一倍,投资旨在满足现有客户需求 [12][35] - 谷歌云2025年第四季度营收达176.6亿美元,同比增长48%,运营利润翻了一倍多,展现出强大的商业化能力 [12][35] - 谷歌的TPU成本被分析师估算仅为英伟达GPU的五分之一左右,在推理成本成为主要开支时可能具备关键成本优势 [12][35] - 中国AI公司春节期间密集发布产品,引发“百模大战”,字节跳动的视频生成模型Seedance 2.0在全球引起广泛关注 [13][36] - 中国科技巨头(如百度、阿里、字节)正致力于打造AI、云计算与芯片三位一体的全栈能力,目标成为AI时代的基础设施 [13][36][37] AI行业发展趋势与路径分化 - 行业正从“混沌期”进入“分化期”,发展路径趋于清晰 [15][39] - 第一条路径:算力需求正从训练侧向推理侧迁移,有基金经理预测未来算力需求可能是现在的10到15倍 [15][39] - 第二条路径:AI应用开始真正落地并产生收入,例如Meta的生成式AI视频工具在2025年第四季度实现了100亿美元的年化收入,增速是公司整体广告收入的三倍 [17][40] - 第三条路径:中美发展路径呈现差异,中国大厂倾向于走类似谷歌的全栈能力路线,而创业公司则更多押注类似Anthropic的垂直场景路线 [19][43] 关键融资与产业链关系 - 英伟达正就最多投资300亿美元入股OpenAI进行磋商,此轮融资战略投资者还包括软银和亚马逊,OpenAI投前估值预计达7300亿美元 [8][31] - 英伟达与OpenAI之间存在潜在的“循环融资”关系,即投资可能用于购买英伟达自身的芯片 [8][31] - OpenAI首席执行官奥特曼强调,公司间相互投资与采购的前提是“必须有新的收入进入这个系统” [9][31] - 公司目前拥有9亿周活跃用户和150万周活的编程产品Codex用户,是重要的用户基础资产 [9][21][45]