Grok 4.20 - 财报，业绩电话会，研报，新闻

Grok 4.20

搜索文档

国信证券晨会纪要-20260319

国信证券· 2026-03-19 09:18

宏观与策略 - 固定收益专题研究显示，2月货币市场量价指标分化，银行间和交易所回购利率走势分化，央行通过公开市场操作合计投放8,295亿元流动性[7] - 五因素超储率测算显示，2月超额存款准备金率回升至1.3%[7] - 展望3月，预计央行公开市场小幅净回笼，但季末财政性存款一般大幅减少，综合来看预计超储率将增加至1.4%[7] 房地产行业 - 专题研究指出，仅关注当期表观租金收益率（当期租金/当期房价）而未纳入租金预期变化，是当前租金收益率指标“不太好用”的原因[7] - 定价模型显示，房价达到均衡的条件是表观租金收益率与租金预期增长率之和等于要求回报率，租金的预期增长率至关重要[8] - 纵向看，2023年至2025年，上海平均租金吸引力为-7.68%（2018-2022年为-0.91%），北京为-5.88%（2018-2022年为-2.43%），租金预期下降解释了房价下跌[8] - 横向看，2018年至2025年，北京与天津租金收益率走势几乎一致，但北京房价累计下跌13.8%，天津累计下跌30.3%，原因在于北京平均租金吸引力为-3.72%，高于天津的-6.52%[8] - 投资建议认为，由于租金预期仍然较低，中期来看房价企稳或许仍需等待，稳住租金才能稳住房价[8] - 2026年1-2月房地产快评数据显示，房地产开发投资9612亿元，同比下降11.1%，降幅比上年全年收窄6.1个百分点[9] - 2026年1-2月房屋新开工面积5084万平方米，下降23.1%；房屋竣工面积6320万平方米，下降27.9%[9] - 2026年1-2月新建商品房销售面积9293万平方米，同比下降13.5%，降幅比上年全年扩大4.8个百分点；销售额8186亿元，下降20.2%[9] - 房企到位资金13047亿元，同比下降16.5%[9] - 国信地产观点认为，2026开年销售规模跌幅相对去年四季度边际收窄，新房和二手房价跌幅同比扩大但环比收窄[10] - 开发投资降幅收窄，但房企到位资金受销售拖累，开竣工同比降幅均扩大[11] - 投资建议指出，短期地产高频数据处于临界点，地产股难现暴涨暴跌；长期看板块估值已充分反应悲观预期，当前是布局优质房企的较好时点，个股推荐招商蛇口、中国金茂、华润置地、我爱我家、贝壳-W[11] 金属行业（银行业） - 快评指出，2026年1-2月实体部门合计获得资金约8.08万亿元，其中银行投放贷款约5.81万亿元，企业债券融资0.65万亿元，财政净支出0.62万亿元，净结汇1.00万亿元[11] - 资金去向显示，居民部门存款新增5.26万亿元，非金融企业存款减少约1829亿元，取现净增加1.02万亿元，金融投资净增约1.99万亿元[11] - 当前实体资金呈现“总量充裕、循环低效”特征，居民存款少增未有效转化为企业存款与实体投资，资金大量滞留在金融体系内部[12] - 核心症结在于居民收入预期仍处低位且未见明确好转，收入结构可能存在“K型”分化[12] - 此轮存款搬家源于高息定期存款集中到期，因存款利率降至低位，居民将部分资金转向资管产品，但在实体投资意愿偏弱下，资金淤积在金融体系内，削弱货币政策传导效率[12] 军工行业 - 快评对两会低空经济相关提案进行了系统梳理，涉及宏观政策、飞行器适航审定、空域管理、基础设施建设、标准化建设、核心技术攻关等方面[13] 传媒行业 - 3月投资策略显示，2026年2月传媒板块（申万传媒指数）下跌4.95%，跑输沪深300指数5.05个百分点，在申万一级31个行业中排名第31位[13] - 当前申万传媒指数对应TTM-PE 48.6倍，处于过去5年94.6%分位数[13] - 2026年2月共有146款国产游戏和6款进口游戏过审，2026年1-2月累计发放游戏版号334个，同比增长34.1%[14] - 2026年1月中国游戏市场实际销售收入325亿元，同比增长4.5%；移动游戏市场实际销售收入226亿元，同比下滑1.5%[14] - 2026年2月总票房77.93亿元人民币，同比下降51.6%；春节档不含服务费的分账票房51.66亿元，同比下滑39.6%[15] - 2月剧集市场正片播放量全网TOP10中，《唐宫奇案之青雾风鸣》以7.77亿播放量居首[15] - 综艺市场方面，爱奇艺《宇宙闪烁请注意》全网正片市占率8.60%排名第一[15] - AI应用正从生成内容走向自主执行任务，OpenClaw智能体具有自动化执行能力，发布后快速登顶GitHub[16] - 投资观点持续看好AI应用端机会，关注营销、语料、平台方向，推荐昆仑万维、浙数文化、中文在线、哔哩哔哩等标的[17] - 建议把握游戏板块底部布局机会，推荐巨人网络、吉比特、恺英网络、心动公司、三七互娱等标的[17] - IP潮玩方面，建议把握泡泡玛特底部修复机会[17] - 3月投资组合为巨人网络、泡泡玛特、哔哩哔哩、昆仑万维、汇量科技[17] - 传媒互联网周报显示，本周（3.9-3.13）传媒行业下跌3.51%，跑输沪深300（0.19%）[17] - 字节跳动火山引擎上线开箱即用的云端SaaS版OpenClaw平台ArkClaw[18] - 腾讯正式推出全场景AI智能体WorkBuddy，深度兼容OpenClaw所有技能[18] - 2026年政府工作报告首次将“繁荣互联网条件下新大众文艺”写入报告，各地推出文化产业支持政策，如杭州设立10亿元文化产业基金[18] - 本周（3月9日-3月15日）电影票房3.40亿元，《飞驰人生3》以1.18亿元票房占比34.6%排名第一[19] - 2026年2月中国手游收入前三名分别为柠檬微趣《Gossip Harbor：Merge&Story》、点点互动《Whiteout Survival》和点点互动《Kingshot》[19] 公司研究（合合信息） - 合合信息2025年全年实现收入18.10亿元，同比增长25.83%；归母净利润4.54亿元，同比增长13.39%[21] - 单第四季度收入5.07亿元，同比增长30.17%；归母净利润1.03亿元，同比增长9.59%[21] - 2025年四个季度收入增速分别为20.94%、23.93%、27.49%、30.33%，呈加速趋势[21] - C端收入达到15.44亿元，同比增长28.11%，其中文字识别C端收入14.86亿元，增长30.27%[22] - 截至2025年底，公司主要C端产品月活达到1.90亿，同比增长11.11%；累计付费用户数987.76万，同比增长32.78%[22] - B端收入达到2.57亿元，同比增长14.56%，其中文字识别B端收入0.87亿元，增长16.17%，毛利率增加9.21个百分点[22] - 2025年公司研发投入5.28亿元，同比增长19.64%；销售费用5.92亿元，同比增长37.88%[23] - 2025年海外收入6.24亿元，同比增长34.11%[23] - 2025年底公司合同负债达到5.94亿元，同比增长14%，环比第三季度增长6.6%[23] - 投资建议上调盈利预测，预计2026-2028年归母净利润为6.03亿元、7.57亿元、9.58亿元，同比增速分别为33%、26%、27%[23] 金融工程与市场数据 - 2026年3月17日，非银、银行、食品饮料、房地产、医药行业表现较好，通信、电子、基础化工、国防军工、计算机行业表现较差[24] - 截至2026年3月16日，两融余额为26614亿元，占流通市值比重为2.6%[24] - 2026年3月16日，大宗交易成交金额为23亿元，折价率为6.11%[25] - 当日上证50股指期货主力合约年化贴水率为4.44%，处于近一年来29%分位点[25] - 2026年3月18日，通信、计算机、电子、国防军工、机械行业表现较好，石油石化、食品饮料、房地产、钢铁、农林牧渔行业表现较差[26] - 截至2026年3月17日，两融余额为26520亿元，占流通市值比重为2.6%[27] - 2026年3月17日，大宗交易成交金额为15亿元，折价率为2.79%[28] - 商品期货方面，ICE布伦特原油收盘价103.42，涨跌幅3.20%；黄金收盘价1113.68，涨跌幅-0.22%[32] - 全球证券市场，2026年3月19日道琼斯指数收盘46225.15，日涨跌幅-1.63%；纳斯达克指数收盘22152.42，日涨跌幅-1.45%[4] - 日经225指数收盘55239.40，日涨跌幅2.86%；恒生指数收盘26025.42，日涨跌幅0.60%[4] - 沪深300指数收盘4658.33，日涨跌幅0.45%[4] - 近期非流通股解禁明细显示，西部证券将于2026年1月19日解禁36038.70万股，流通股增加100%[34]

传媒互联网周报：政府工作报告首提“繁荣新大众文艺”，大厂加速OpenClaw适配

国信证券· 2026-03-18 13:45

行业投资评级 - 传媒互联网行业评级为“优于大市” [1][4] 核心观点 - AI应用破圈及商业化落地加速，建议把握AI催化下的板块投资机会，重点关注AI应用端、游戏及IP潮玩板块 [3][37] - OpenClaw生态发展加速AI能力与渗透率提升，大厂如字节、腾讯加速产品适配，推动AI智能体向普适化办公生产力工具演进 [1][15][16] - 文化产业支持政策从顶层设计到地方逐步落地，2026年政府工作报告首次写入“繁荣互联网条件下新大众文艺”，各地推出产业支持计划 [1][17] 板块市场表现回顾 - 报告期内（3月9日-3月13日），传媒行业下跌3.51%，跑输沪深300指数（上涨0.19%）和创业板指（上涨2.51%） [1][11] - 传媒板块在所有板块中涨跌幅排名第26位 [1][12][13] - 涨幅靠前的个股包括中国科传（周涨20%）、顺网科技（周涨10%）；跌幅靠前的包括恺英网络（周跌11%）、中信出版（周跌11%） [11][12] 行业重点动态与数据跟踪 AI与科技动态 - **字节跳动**：火山引擎上线云端SaaS版OpenClaw平台“ArkClaw”，旨在解决AI Agent环境配置复杂、Token消耗高等痛点，实现7x24小时在线服务，并深度整合主流大模型 [1][15] - **腾讯**：正式推出全场景AI智能体“WorkBuddy”，深度兼容OpenClaw所有技能，内置超20种Skills技能包，支持与企业微信、QQ、飞书等协作工具打通 [1][16] - **xAI**：发布Grok 4.20模型，推理性能显著提升，非幻觉率达78%，创行业纪录 [1][17] - **OpenAI**：向Sora视频生成API推送更新，新增角色一致性支持等核心能力，提升批量视频生产效率 [33][34] - **奈飞**：宣布收购由本·阿弗莱克创立的AI电影制作公司InterPositive，交易总价值最高可达6亿美元 [35] 文化产业政策 - 国家层面：2026年政府工作报告首次提出“繁荣互联网条件下新大众文艺”（涵盖网络文学、短视频、微短剧、游戏等） [1][17] - 地方层面： - 上海推动出版市场化和数智化转型 [1] - 北京朝阳区发布行动计划，目标到2028年数字视听产业规模突破2000亿元 [1][17] - 杭州设立首期10亿元良渚数字文化产业基金，支持AIGC、影视动漫等项目 [1][17] - 长沙实施“演艺新空间十条”，提供项目及运营补助 [17] 内容市场数据 - **电影票房**：报告当周（3月9日-3月15日）全国电影票房为3.40亿元。票房前三名为：《飞驰人生3》（1.18亿元，占比34.6%）、《镖人：风起大漠》（0.64亿元，占比18.6%）、《惊蛰无声》（0.51亿元，占比15.0%） [2][18][22] - **网络剧**：当周播映指数排名靠前的包括《逐玉》、《太平年》、《我的山与海》等 [24][26] - **综艺节目**：当周排名靠前的包括《周五晚高疯》、《宇宙闪烁请注意》、《你好星期六2026》等 [2][25][27] - **游戏**： - 2026年2月中国手游收入前三名：柠檬微趣《Gossip Harbor：Merge&Story》、点点互动《Whiteout Survival》、点点互动《Kingshot》 [2][28] - 当周iOS畅销榜前列包括《王者荣耀》、《和平精英》；安卓热玩榜前列包括《心动小镇》、《潜水员戴夫》 [29][30][31] - **数字藏品（NFT）**：截至2025年3月15日最近7日，海外成交额前三名为MutantApeYachtClub（成交额183.08 ETH）、Moonbirds（73.44 ETH）、Beanz（7.63 ETH） [31][32] 投资建议与关注方向 - **AI应用与营销**：持续看好AI应用端机会；关注受益于流量入口竞争的营销行业，从营销中介、优质语料到模型平台均有望受益 [3][37] - 大模型方向关注昆仑万维 [3] - 语料方向关注浙数文化、中文在线 [3][37] - 平台端关注哔哩哔哩（受益于AI提升广告投放效率） [3] - 多模态应用看好AI漫剧方向，关注中文在线、昆仑万维、哔哩哔哩 [37] - **游戏板块**：把握业绩与估值兼备的底部布局机会，关注强产品周期及具备AI产品落地的公司 [3][37] - 关注标的包括：巨人网络、吉比特、恺英网络、心动公司、三七互娱等 [3][37] - **IP潮玩板块**：把握泡泡玛特的底部修复机会 [3] - **出版行业**：关注GEO语料库催化可能，关注国有出版方向 [37] 重点公司盈利预测（摘要） - **恺英网络 (002517.SZ)**：投资评级“优于大市”，预测2025年/2026年EPS为1.01元/1.20元，对应PE为22倍/19倍 [4][39] - **吉比特 (603444.SH)**：投资评级“优于大市”，预测2025年/2026年EPS为23.31元/26.40元，对应PE为18倍/16倍 [4][39] - **三七互娱 (002555.SZ)**：投资评级“优于大市”，预测2025年/2026年EPS为1.38元/1.51元，对应PE为18倍/16倍 [4]

传媒互联网周报：政府工作报告首提“繁荣新大众文艺”，大厂加速OpenClaw适配-20260318

国信证券· 2026-03-18 13:05

行业投资评级 - 行业投资评级为“优于大市” [1][4] 核心观点 - AI应用破圈及商业化落地加速，建议把握AI催化下的板块投资机会，重点关注AI应用、游戏、IP潮玩等方向 [3][37] - OpenClaw生态持续发展，大厂加速产品适配，推动AI智能体从极客工具向普适化办公生产力工具演进 [1][15][16] - 文化产业支持政策从顶层设计到地方逐步落地，2026年政府工作报告首次写入“繁荣互联网条件下新大众文艺” [1][17] 市场表现回顾 - 本周（3.9-3.13）传媒行业指数下跌3.51%，跑输沪深300指数（上涨0.19%）和创业板指（上涨2.51%），在所有板块中涨跌幅排名第26位 [1][11][12][13] - 周涨幅靠前的公司包括中国科传（上涨20%）、顺网科技（上涨10%）、ST返利（上涨8%）和友车科技（上涨7%） [11][12] - 周跌幅靠前的公司包括恺英网络（下跌11%）、中信出版（下跌11%）、利欧股份（下跌11%）和蓝色光标（下跌9%） [11][12] 行业动态与技术进步 - **字节跳动**：火山引擎上线云端SaaS版OpenClaw平台“ArkClaw”，旨在解决AI Agent环境配置复杂、Token消耗高、会话状态不稳等痛点，深度整合主流大模型并适配飞书办公套件 [1][15][16] - **腾讯**：正式推出全场景AI智能体“WorkBuddy”，深度兼容OpenClaw所有技能，实现免部署开箱即用，并内测为OpenClaw定制的“一键启动包”QClaw [1][16] - **xAI**：发布Grok 4.20模型，推理性能显著提升，非幻觉率高达78%，创行业纪录 [1][17] - **OpenAI**：向Sora视频生成API推送更新，基于Sora2模型引入角色一致性支持等五项核心能力升级，提升批量视频生产效率 [33][34] - **奈飞**：宣布收购由本·阿弗莱克创立的AI电影制作公司InterPositive，交易总价值最高可达6亿美元 [35] 文化产业政策 - **国家层面**：2026年政府工作报告首次将“繁荣互联网条件下新大众文艺”（包括网络文学、短视频、微短剧、游戏等）写入报告，上升为国家文化战略 [1][17] - **地方层面**： - 上海推动国有文化院团改革及出版市场化与数智化转型 [1][17] - 北京朝阳区发布数字视听产业三年行动计划，目标产业规模突破2000亿元 [1][17] - 杭州设立首期10亿元良渚数字文化产业基金，支持AIGC、影视动漫、游戏电竞等项目 [1][17] - 长沙实施“演艺新空间十条”，提供最高50万元项目补助和30万元运营/创作补助 [17] 本周行业数据跟踪 - **电影票房**：本周（3月9日-3月15日）全国电影票房为3.40亿元 [2][18] - 票房冠军为《飞驰人生3》，收入1.18亿元，占比34.6% [2][18][22] - 第二名《镖人：风起大漠》收入0.64亿元，占比18.6% [2][18][22] - 第三名《惊蛰无声》收入0.51亿元，占比15.0% [2][18][22] - **综艺节目**：热度排名靠前的节目包括《周五晚高疯》、《宇宙闪烁请注意》、《你好星期六2026》等 [2][25][27] - **游戏**： - 2026年2月中国手游收入前三名：柠檬微趣《Gossip Harbor：Merge&Story》、点点互动《Whiteout Survival》、点点互动《Kingshot》 [2][28] - iOS畅销榜前列包括《王者荣耀》、《和平精英》等 [29][30] - 安卓热玩榜前列包括心动公司《心动小镇》、《潜水员戴夫》等 [31] - **数字藏品（NFT）**：截至2025年3月15日，最近7日成交额前三名为MutantApeYachtClub（183.08 ETH）、Moonbirds（73.44 ETH）和Beanz（7.63 ETH） [31][32] 上市公司动态 - **新媒股份**：发布2025年业绩快报，营业收入16.3亿元，同比增长3.1%；归母净利润6.6亿元，同比增长0.23% [36] 投资建议与关注标的 - **AI应用与多模态**：持续看好AI应用端机会，关注受益于流量入口竞争的营销行业、优质语料及大模型平台 [3][37] - 大模型方向关注昆仑万维 [3] - 语料方向关注浙数文化、中文在线 [3][37] - 平台端关注哔哩哔哩 [3][37] - AI漫剧方向关注中文在线、昆仑万维、哔哩哔哩 [37] - **游戏板块**：把握业绩与估值兼备的底部布局机会，关注强新品周期及AI产品落地 [3][37] - 推荐及关注标的包括巨人网络、吉比特、恺英网络、心动公司、三七互娱等 [3][37] - **IP潮玩**：把握泡泡玛特底部修复机会 [3] - **出版行业**：关注GEO语料库催化可能，关注国有出版方向 [37]

腾讯研究院· 2026-03-01 10:33

AI芯片与算力进展 - 英伟达预告新芯片[3] - AMD与Meta在芯片领域达成合作[3] - DeepSeek发布DualPath推理优化技术以提升算力效率[3] AI模型发布与更新 - 谷歌发布Gemini 3.1 Pro模型[3] - xAI发布Grok 4.20模型并进行了后续更新[3][3] - Anthropic发布Sonnet 4.6模型[3] - 阿里发布Qwen3.5-397B大模型及Qwen3.5-Flash模型[3][3] - 智谱发布GLM-5技术报告[3] - DeepSeek更新GitHub并曝光V4 Lite模型[3][3] AI应用与产品动态 - Anthropic发布Claude Code Security应用、COBOL现代化工具、远程遥控功能及更新Cowork插件[3][3][4][3] - xAI的Grok视频模型在应用中表现突出[3] - MiniMax推出MaxClaw模式[3] - Cloudflare利用AI重写Next.js[3] - Perplexity发布Computer产品[3] - 谷歌推出Nano Banana 2应用[3] - 昆仑万维发布SkyReels V4应用[3] 前沿科技突破 - 苹果研发AI可穿戴设备[3] - Isomorphic Labs推出IsoDDE科技[4] - 宇树科技发布Unitree As2[4] - 微软研发玻璃存储技术[4] - 三星研发Galaxy S26[4] - Deep Mind发布AlphaEvolve进化科技[4] 行业事件与人事变动 - 谷歌封禁OpenClaw[4] - 五角大楼向Anthropic施压[4] - 庞若鸣从OpenAI跳槽[4] - Block公司裁员40%[4] 行业观点与趋势 - DeepMind的Hassabis提出“爱因斯坦测试”观点[4] - Anthropic提出人格选择模型观点并面临蒸馏攻击指控[4][4] - OpenAI讨论为模型未来构建[4] - Citrini Research提出2028年智能危机观点[4] - 前特斯拉AI总监Karpathy提出AI编程质变观点[4] - MIT提出AI Agent审计观点[4] - 有观点指出中国模型调用量已超越美国[4] - 关于Claude Code的工具偏好观点[4]

Artificial Intelligence

Gemini 3.1 Pro

Grok 4.20

Qwen3.5-397B

Artificial Intelligence

腾讯研究院· 2026-02-27 00:01

生成式AI模型与产品进展 - DeepSeek新模型“sealion-lite”（V4 Lite）正在积极测试，支持1M上下文窗口和原生多模态推理，其非思考模式性能已超越V3.2的思考模式 [1] - DeepSeek已向华为等国内芯片厂商提供V4提前访问权以优化处理器软件，但英伟达和AMD尚未获得权限 [1] - 首批流出的示例显示V4 Lite代码更简洁、质量更高，市场猜测其参数约2850亿 [1] - xAI的Grok 4.20 Beta采用“4 Agents”架构，内置四个专业智能体（协调者、研究专家、逻辑专家、创意达人）以协作应对复杂查询 [2] - Grok 4.20在3992位用户评测中于Search Arena排名第一，超越了GPT-5.2和Gemini 3.0 Pro，并在Alpha Arena真实股票交易基准中同样登顶 [2] - Grok 4.20的多智能体内部讨论机制可大幅降低幻觉约65%，并提高工程、预测等多步推理的可靠性 [2] - Perplexity发布Computer产品，通过Claude Opus编排多达19个AI模型并行工作，可端到端自主完成研究、设计、编码、部署等全流程任务 [3] - Anthropic收购AI初创公司Vercept，其核心能力将在未来几周内并入Claude [3] - Claude在OSWorld基准测试中的表现已从不足15%飙升至72.5%，逼近人类水平 [3] AI编程与智能体（Agent）发展 - 前特斯拉AI总监Karpathy断言，AI编程能力在2024年12月发生质变，模型具备了更强的长期一致性，使得过去需要一个周末的项目现在30分钟即可完成 [7] - 编程模式正在被重构，从在编辑器输入代码转变为启动AI Agent并用自然语言分配任务、管理多个并行代码实例，顶级智能体工程具有极高的杠杆效应 [7] - MIT、剑桥、斯坦福的联合报告指出，在对30个顶级AI Agent的审计中，发现23个完全闭源，底层模型高度集中于GPT、Claude、Gemini三家，存在生态隐性控制权风险 [8] - 报告显示，浏览器类Agent的实际自主度已达到L4-L5，但企业宣传普遍低报为L1-L2，且仅有4个Agent披露了专属安全文档 [8] - 全球仅有0.04%的人尝试过AI编程，但Claude Code实测显示编程占Agent使用近半，且最长不中断运行时长在三个月内翻倍 [8] 硬件、市场与产业动态 - 三星发布Galaxy S26系列，搭载定制骁龙8至尊版芯片，其AI功能可在后台自主执行打车、外卖、购物等任务 [4] - S26 Ultra首次搭载内置式防窥显示屏，并支持APV专业视频标准，实现多次剪辑接近视觉无损，夜拍和视频防抖能力显著提升 [4] - 三星Galaxy S26标准版起售价为6999元，较上代上涨1000元，S26 Ultra起售价为9999元，上涨300元 [4] - 截至2025年底，支持AI的三星Galaxy设备预计将超过4亿台，公司2026年的目标是达到8亿台 [4] - 硅谷资深华人研究员庞若鸣在加入Meta仅七个月后转投OpenAI，此前Meta为其开出了总额超2亿美元、跨数年的薪酬方案 [5][6] - 该研究员曾在苹果主导了Apple Intelligence及Genmoji、邮件摘要等功能的开发，其离职发生在Meta超级智能实验室完成首批核心AI模型交付的关键时期 [6]

生成式AI

AI Agent

Artificial Intelligence

Artificial Intelligence

sealion - lite

Grok 4.20

Galaxy S26系列

“一人公司”的齿轮开始转动，2026 的 AI 到底发生了哪些变化？

AI科技大本营· 2026-02-26 18:05

行业核心观点 - 2026年AI行业发生根本性变局，焦点从大语言模型的“参数崇拜”和“脑子”的智能，转向了AI智能体（Agent）在现实世界中拥有自主执行、交易和解决纠纷的能力，即长出了“手脚”和“钱包”[4][6] - 单体模型的智力竞赛边际效益递减，真正的竞争和魔法发生在“系统级工程”上，即由成百上千个能够并行工作、相互协同的智能体组成的系统[15] - AI智能体正在构建一个自我闭环的平行社会经济基础设施，包括自动化开发、可编程治理和机器间金融，这将催生“一人公司”成为现实，并可能绕过传统金融监管[22][31][47] 模型竞争与战略分化 - 主要AI公司发布新模型的策略出现显著分化：Anthropic的Claude 4.6采取“加量不加价”策略，在长文本推理和智能体编码能力上大幅提升，并在衡量经济价值的“GDP评测基准”上领先[13]；OpenAI则专注于通过模型蒸馏等技术降低token成本[13] - xAI的Grok 4.20更新重点不在传统聊天，而在于**多智能体推理**能力，预示大模型的终局是大量协同工作的“专员”而非单一全能模型[14] - 行业竞争已从“百模大战”演变为巨头间的“诸神黄昏”，竞争焦点转向实际应用与经济价值创造[10][13] 软件开发范式革命 - 传统编程模式被颠覆，例如Spotify内部代号为HONK的项目已让开发者三个月未手写传统代码，其系统完全由Claude驱动，智能体可直接向App推送代码更新，人类工程师仅做最终审查[19] - OpenAI内部数据显示，目前**95%** 的代码由Codex等模型生成[19] - 工程师角色转变为“智能体经理”或“巫师”，负责管理一支由**10到20个**AI智能体组成的“舰队”并分发任务，将过去需要**15分钟**的拉取请求审查压缩至**2分钟**[20] 智能体平行社会经济系统 - 出现由AI智能体自治的“影子社会基础设施”，包括解决智能体间纠纷的**Moltcourt（智能体法庭）**系统，该平台通过密码学验证和由中立AI组成的陪审团，可在几百毫秒内完成诉讼、辩论到裁决的全过程[27][29] - Coinbase推出了专为AI智能体设计的**Agentic Wallet（智能体钱包）**，基于x402协议支持机器对机器交易，使智能体能够自主租用服务器、购买API额度、雇佣其他智能体并用加密货币结算[31] - 由OpenClaw（本地运行的智能体框架）、Moltcourt和Agentic Wallet构成的系统，使AI智能体成为可绕过传统法币和金融监管的独立经济实体[23][31] 算力需求与能源挑战 - 智能体的普及导致算力需求呈指数级暴涨，因为单个任务可能触发成百上千次后台推理[34] - 到2025年，美国数据中心已消耗全国**7%** 的电力，未来**3到5年**还需新增**80吉瓦**的电力，相当于需要新建**50到60座**标准核电站（每座约1.5吉瓦）[36] - AI算力需求已成为国家战略和地缘政治议题，推动如台积电在美国亚利桑那州投资**1000亿美金**新建四座晶圆厂等重大基础设施投资[38] 物理世界融合与隐私冲击 - AI通过智能眼镜等设备向物理世界延伸，例如Meta计划推出带面部识别功能的智能眼镜，可实时识别陌生人信息并投影，可能彻底终结公共空间隐私[41][42] - 关于该技术的辩论激烈，一方认为这是赋予个体“超级感知”的必然趋势，禁止会导致战略落后；另一方则认为这是隐私的灾难[43] - 当绝大多数人使用该技术获得便利时，选择保护隐私可能成为社交阻碍，赛博朋克式技术平推正在成为现实[43][44] 未来工作形态与个体机遇 - 未来**24个月**内，职场将出现严重两极分化：不懂利用智能体的传统白领工作将被压缩和替代；而能像“巫师”一样驾驭智能体工具链的个人，其产出可媲美过去的百人团队[45] - “一人公司”时代已成为现实，个体可通过智能体获得代码编写、加密货币结算、纠纷解决乃至现实世界感知等全套能力，形成强大的生产力杠杆[47] - 行业的关注点已从AI意识等形而上讨论，转向由商业齿轮驱动的现实应用与基础设施构建[46]

Agent（智能体）

One Person Company（一人公司）

Scaling Law（尺度法则）

Multi - Agent Reasoning（多智能体推理）

Programmable Government（可编程治理）

Artificial Intelligence

Agent（智能体）

One Person Company（一人公司）

Scaling Law（尺度法则）

Multi - Agent Reasoning（多智能体推理）

Programmable Government（可编程治理）

Artificial Intelligence

春节AI大事全梳理

2026-02-24 22:15

行业与公司 * **行业**：人工智能（AI）大模型及应用行业[1][2][4][6][8][9][10][14][15][17] * **涉及公司**： * **国际**：谷歌（Gemini）、OpenTropic（Sunnet, Co-Worker）、XAI（Grok）、Anthropic（欧贝斯/Claude）、OpenAI（GPT）[1][2][3][4][5][6][15] * **中国**：字节跳动（豆包）、阿里巴巴（千问）、智谱科技（GLM）、腾讯（元宝）、百度（文心）、MinMax、Kimi、DPC[2][7][8][9][10][11][12][14][15][17] 核心观点与论据 **1. 国际大模型技术持续迭代，性能与性价比提升** * **谷歌 Gemini 3.1 Pro 性能显著提升**：在AICAGI评分中创历史新高，达77分，能力较谷歌之前的GPT-3模型提升一倍[1][2]；在Agent任务执行评分达70%，优于Anthropic的Sunnet 4.6模型[1][3]；幻觉率从88%降至50%[1][3]；定价与之前版本一致，体现加量不加价策略[1][3] * **OpenTropic Sunnet 4.6 性价比突出**：价格亲民但性能接近高端欧贝斯系列[1][4]；代码自动生成和工具使用能力显著提升[1][4]；支持百万Token上下文管理，在长期运营模拟中表现优异，如在自动贩售机模拟中收益比之前版本翻倍以上[1][4]；在基准打分中从2024年底的15分提升至2025年底的60分，最新版本又有显著提高[4] * **XAI Grok 4.20 引入创新架构**：引入并行代理机制，通过四个代理同时推进、讨论、辩论以提高答案准确性和逻辑性[5][6]；在AI模拟炒股比赛中是唯一盈利的模型，平均回报率10%，最高回报率达47%，归功于其基于X平台舆论及事件分析的市场情绪判断[1][6] **2. 中国AI应用市场活跃，用户增长与商业化并进** * **字节跳动豆包成为国民级应用**：春节期间通过春晚广告等营销活动，互动次数达19亿次，新春头像生成量5,000万张，拜年祝福1亿条[2][7]；高峰期每分钟token消耗量高达633亿，按8点到12点计算总消耗量超过1,015万亿token，超过多家大模型厂商一个月总和[7][8]；1月份月活跃用户数达1.7亿，同比环比增长3%以上[2][8]；全球范围内处于领先地位[8] * **阿里巴巴千问开源策略成效显著**：开源的千问3.5 Plus模型具有397B总参数、17B激活量[2][9]；API定价仅为Gemini 3 Pro的约1/18，推理速度是后者19倍，经济性与效率兼具[2][9]；自2023年以来累计开源模型超400个，总下载量超10亿次，在全球开源生态领先[2][9]；为庆祝春节推出的30亿元免单活动，截至2月17日完成1.3亿次购物交易[9] * **智谱科技市值与需求激增**：市值一度突破3,000亿元人民币，对应2026年收入规模预期达200倍PS水平[2][10]；GLM 5发布后编程能力提升，周调用量环比提高4倍以上[2][10][11]；随即调价，国内版本涨价30%，海外版本涨价100%[2][10][11]；正寻求算力合伙人，已与华为升腾、摩尔线程等七家主流平台合作以确保供应[2][11] * **其他厂商用户数据亮眼**：字节跳动12月月活跃用户数超2亿，2月7日日活跃用户数7,800万[14]；阿里巴巴同一天日活跃用户数7,300万[14]；腾讯元宝2月份月活跃用户数约1.14亿，日活跃用户数突破5,000万[14]；百度APP春节期间整体用户增长8倍以上[14] **3. 行业竞争与资本动态激烈** * **市场竞争白热化**：各大厂商通过积极投放广告及推广活动争夺宽尾客户，以增强影响力和留存率[13] * **融资与资本动作频繁**：OPI（推测为某AI公司）正在推进一笔1,000亿美元融资，其中亚马逊预计增持500亿美元，将成为OpenAI第三大外部股东；英伟达也重新参与投资[15]；Kimi获得阿里及其他大厂7亿美元投资，目前估值约1,000亿美元[17] * **人才流动**：Open Cloud创始人在春节期间加入OpenAI[15] 其他重要内容 **1. 产品与商业进展** * **OpenTropic**：2026年1月发布Co-Worker工具，2月进行多个Agent应用升级；预计2026年收入将比2025年增长四倍以上[4] * **智谱科技**：于2月12日上线GLM并发布Coding Plan，上线即售罄；计划进行灰度测试、用户群推送节奏调整等灵活运营[15] * **Kimi**：最近20天收入超过2025年全年；会员机制设计为注册即需付费，每月起步价199元加调用费；主要面向程序员和企业用户[17] * **DPC**：1月份月活跃用户数约1.2亿，但呈下降趋势，因未能按预期发布DPC V4[14] * **OPI**：明确表示将重点推进A景产品；2026年B端收入占比目标为40%，最新月度ARR接近这一数字；2025年全年B端用户规模从200万增加到700万，实现3倍增长[15] **2. 性能数据对比** * **幻觉率对比**：克劳德4.5 HiCo模型为26%，智谱GLM5为34%，Cloud Sonnet 4.6为38%，GPT-5.2为71%[3] * **调用量增长**：MinMax 2.5模型在Open Router上的调用量环比增长超过5倍[17] **3. 平台合作与生态** * **Open Cloud平台**：优先推荐Autonomous的Sunnet系列模型，预计后续会更多推荐OPI的模型[15]

Artificial Intelligence

Artificial Intelligence

马斯克Grok 4.20突袭上线！4个AI开会互怼，47%实盘暴击GPT-5

搜狐财经· 2026-02-18 20:00

产品发布与核心特性 - 马斯克旗下xAI公司于近期无预警发布了Grok 4.20 Beta版本，其核心创新在于采用了多智能体协作模式，用户提问时会触发四个具有不同角色和专长的AI智能体进行实时“圆桌会议”式辩论，最终由队长“Grok”整合输出答案[2][24][25] - 该产品是xAI被SpaceX以1.25万亿美元估值收购后发布的首个AI产品，具有重要的战略宣示意义[20][21] - Grok 4.20将多智能体协作功能直接集成到普通聊天界面中，并以近乎免费的形式向大众用户开放，实现了技术范式的转变，从传统的单一模型输出转变为多智能体协作[22][35] 智能体角色与协作机制 - 团队由四个分工明确的智能体组成：“Grok”作为队长负责统筹整合，追求“有用、真实、有趣”的答案；“Harper”是研究与深度验证专家，负责事实核查与数据验证；“Benjamin”是深入分析与逻辑推理专家，擅长复杂问题拆解与漏洞检查；“Lucas”是分析与工具执行专家，负责将抽象问题转化为可执行的计算和实证[27][28] - 四个智能体在用户提问后同时启动，从各自专业视角分析问题，并在内部进行实时讨论、互相质疑与纠错，最终形成一份经过内部辩论与验证的综合结论[29][41] - 该协作机制在单次对话的超大上下文窗口内，完成了一套完整的“多人评审”流程[32] 性能表现与实测案例 - 在Alpha Arena举办的AI实盘炒股大赛中，Grok 4.20的早期版本是32个参赛AI实例中唯一盈利的模型，平均回报率为+10.17%，账户价值达到11,017美元，其中最成功的单个实例回报率高达47%[18][19] - 同场比赛中，其他主要竞争对手表现不佳：GPT-5.1回报率为-12.09%，Gemini-3-Pro回报率为-45.06%，Claude-Sonnet-4-5回报率为-50.93%[19] - 在Vending Bench自动售货机运营测试中，Grok 4.20击败了GPT-5，销售额领先1,100美元[20] - 用户实测显示，Grok 4.20能在1分20秒内编写出可玩的俄罗斯方块游戏，并能构建人工生命模拟器[9][12] - 该模型在医疗分析方面表现出色，能够解读血检报告和核磁共振片子，并将专业医学术语翻译成通俗语言[16] 行业趋势与竞争格局 - 多智能体协作已成为2026年AI竞争的核心战场，谷歌、Anthropic、月之暗面等公司均已布局类似技术[33][34] - 与竞争对手相比，Grok 4.20的“圆桌会议”模式更追求透明和共识，而如Kimi的“Agent集群”等方案则更侧重于规模和效率[35][36] - 此次发布标志着AI正从第二代“助手”向第三代“团队”演进，其特点是能够协作、自省和互相纠错，通过内部辩论和验证来提供更接近群体智慧的结论[40][42][45]

多智能体协作

Artificial Intelligence

Artificial Intelligence

Grok 4.20

GPT - 5

Gemini

刚刚，马斯克新模型撞车Claude，口碑崩了

搜狐财经· 2026-02-18 09:14

Anthropic发布Claude Sonnet 4.6模型 - 公司发布Claude Sonnet 4.6，定位为迄今为止最强大的Sonnet模型，在编码、计算机使用、长上下文推理、代理规划、知识工作和设计方面进行全面升级[7] - 模型价格维持不变，为每百万token 3美元输入/15美元输出，但性能逼近Opus级别[34] - 在与Opus 4.5的对比测试中，用户有59%的时间更偏好Sonnet 4.6，因其过度工程化更少、幻觉更少、多步骤任务执行更稳[35] - 对普通用户，Free和Pro方案的默认模型已切换为Sonnet 4.6，claude.ai和Claude Cowork同步更新[38] - 开发者API模型标识为claude-sonnet-4-6，支持自适应思考、扩展思考及上下文压缩功能[38] Sonnet 4.6性能与功能亮点 - 模型具有beta版的1M（100万）令牌上下文窗口，足以容纳完整代码库、数十篇论文或多份合同[8][37] - 计算机操作能力显著提升，在OSWorld基准测试上，Sonnet系列过去16个月持续进步，现处理复杂电子表格、填写多步骤网页表单已接近人类水平[35] - 在Vending-Bench Arena模拟企业运营评估中，Sonnet 4.6展现出长期规划能力，摸索出前期大举投资产能、后期转向盈利导向的策略，最终余额达到约6000美元，显著高于Sonnet 4.5[13][14][37] - Excel中的Claude插件同步升级，新增MCP连接器支持，对金融从业者实用[36] Sonnet 4.6基准测试表现 - 在编码（SWE-bench Verified）方面得分为79.6%，高于Sonnet 4.5的77.2%和Gemini 3 Pro (Flash)的78.0%[11] - 在计算机使用（OSWorld-Verified）方面得分为72.5%，显著高于Sonnet 4.5的61.4%[11] - 在代理工具使用（t2-bench）方面得分为91.7%，高于Sonnet 4.5的86.2%和Gemini 3 Pro的85.3%[11] - 在多学科推理（Humanity's Last Exam，无工具）方面得分为49.0%，显著高于Sonnet 4.5的33.6%[11] - 在代理金融分析（Finance Agent v1.1）方面得分为63.3%，高于Sonnet 4.5的54.5%和Gemini 3 Pro的55.2%[11] - 在办公任务（GDPval-AA Elo）方面得分为1633，显著高于Sonnet 4.5的1276和Gemini 3 Pro的1201[11] - 在视觉推理（MMMU-Pro，无工具）方面得分为75.6%，高于Sonnet 4.5的68.9%[11] xAI发布Grok 4.2版本候选 - 公司发布Grok 4.2版本候选（公开测试版），用户需专门选择使用[21] - 与之前版本不同，Grok 4.2能够快速学习，预计每周都会有改进并发布说明[21] - 公司创始人解释称，Grok 4.20是参数量500B的小型基础模型，处于公测阶段，其底层架构具备每周自我迭代的能力，递归式智能增长空间很大[38] - 公司创始人承诺，公测结束后，Grok 4.20的智能和速度将比Grok 4提升约一个数量级[38] - 公司创始人表示，正在逐步放弃某些基准测试，转而致力于让Grok对实际工程工作最大化地有用[32] Grok 4.2市场反馈与功能 - 整体口碑两极分化严重，部分用户期望落空，差评偏多[38] - 有用户测试后认为其在生物医学问题回答上已有很大改进，对复杂实验结果预测表现惊艳[31] - 支持并行调度4个专业智能体（Grok、Harper、Benjamin、Lucas）协同执行任务[38] - 有批评指出，与大型实验室竞争面临团队规模小和数据缺乏的挑战[30] 行业动态与竞争格局 - Claude Sonnet 4.6与Grok 4.2于同日发布，形成竞争态势[1] - 苹果公司据报正在全面提速AI穿戴设备，计划推出三款全新可穿戴AI产品，公司CEO确认正在研发“由人工智能赋能”的产品[23][24] - 其中一款产品为AI智能眼镜（代号N50，高配版），特点包括无显示屏、轻量设计、配备计算机视觉摄像头、麦克风、扬声器，支持通话、音乐、实时翻译、导航及物体识别等功能，完全依赖iPhone算力及升级版Siri与Apple Intelligence，目标2026年12月投产[26]

Artificial Intelligence

Claude Sonnet 4.6

Grok 4.20

AI智能眼镜

Artificial Intelligence

Claude Sonnet 4.6

Grok 4.20

AI智能眼镜

摩尔线程完成MiniMax M2.5模型极速适配；马斯克：Grok 4.20版本将于下周正式发布丨AIGC日报

创业邦· 2026-02-16 09:15

AI芯片与硬件适配进展 - 摩尔线程在其旗舰级AI训推一体全功能GPU MTT S5000上，成功实现了对MiniMax新一代大模型MiniMax M2.5的Day-0极速适配 [2] AI对软件开发模式的颠覆性影响 - 马斯克预测，到2026年底，AI将彻底绕过传统编程，直接生成二进制程序，其效率可以超过任何编译器所能产出的结果 [2] - Spotify首席执行官表示，公司一些最高级的开发人员从12月起就再没写过一行代码，他们只负责用AI生成代码并对其进行监督 [2] AI大模型产品迭代加速 - 马斯克宣布，Grok 4.20版本将于下周正式发布，与4.1版本相比，此版本将会有显著的改进 [2]

AIGC

AI直接生成二进制程序

Artificial Intelligence

Artificial Intelligence