Workflow
Claude 4.6
icon
搜索文档
计算机行业重大事项点评:AI+应用:MaaS钟摆下的历史性机会
华创证券· 2026-03-09 14:48
行业投资评级 - 计算机行业投资评级为“推荐”(维持)[3] 核心观点 - AI产业正处于“模型能力跃迁”与“应用生态繁荣”螺旋上升期,从“技术验证”向“商业落地”关键转折点,AI-Native应用正重塑全球科技版图 [6] - 2026年被视为AI Agent元年,OpenClaw等现象级个人Agent产品有望涌现,影响力可比肩2025年DeepSeek大模型开源时刻 [6] - 在此轮产业周期中,拥抱AI的企业将成为胜出关键,而AI-Native厂商凭借更具攻击性的组织形态与轻量的历史包袱,胜率更为凸显 [6] 产业趋势与技术发展 - **技术收敛与能力跃迁**:GPT-5.4、Gemini 3.1、Claude 4.6等多模态模型实现文本、图像、音频、视频统一理解与生成;o1/o3类推理模型在数学、代码、科学推理领域近似达到人类专家水平;百万级token上下文窗口成为标配 [6] - **开源与闭源双轮驱动**:DeepSeek以约1/10成本实现GPT-4o级别性能;OpenClaw推动AI Agent能力落地个人端,开源生态催生垂直领域创新,推动AI民主化;闭源模型持续引领能力边界,形成“基础模型-垂直优化-场景落地”良性分工 [6] 市场动态与商业落地 - **海外市场格局**:Anthropic、OpenAI与Google Gemini三足鼎立,企业级服务已成为核心增长引擎 [6] - **商业模式进入价值兑现阶段**:OpenAI年化收入突破250亿美元大关,Anthropic营收预计2026年翻倍至200亿美元 [6] - **市场重估与竞争壁垒迁移**:传统软件巨头(如Salesforce、ServiceNow)的护城河面临AI原生替代威胁;真正的护城河向“场景深度”与“数据闭环”迁移,如工业预测性维护、金融智能风控、医疗辅助诊断、法律合同审查等垂直场景 [6] 投资关注方向 - **大模型**:港股成为全球AI稀缺资产价值发现地,MiniMax与智谱作为全球唯二具备基座大模型能力的厂商,稀缺性溢价持续凸显 [6] - **互联网**:阿里巴巴通义开源生态国内领先,具备全栈赋能能力;腾讯混元大模型深度融入微信生态,AI广告收入高速增长,价值待重估 [6] - **AI+企服**:金蝶国际发布“企业管理AI战略”,向“AI原生企业服务平台”转型,构建企业AI内生闭环;范式智能以“AI Agent + 世界模型”为核心,在金融、能源、交通、制造、医疗等行业累计服务客户 [6] - **AI+工业**:海康威视、中控技术与容知日新分别领跑流程工业智能控制与设备预测性维护,工业现场正成为AI Agent落地的核心场景 [6] - **AI Infra(基础设施)**:达梦数据、星环科技、海量数据等国产数据库厂商加速向量数据库与AI运维功能布局,受益于信创替代与智能化升级双重红利 [6] - **AI for Science**:华兰股份、九安医疗将AI技术注入药物研发与医疗诊断;英矽智能的AI制药管线进入临床阶段,验证颠覆性技术商业化前景 [6] - **端侧陪伴**:会畅通讯针对中国超亿级独居人口的刚性情感需求,开发陪伴机器人,产品已成型发布 [6] - **数据要素**:海天瑞声等高质量数据服务商享受多模态数据需求爆发带来的量价齐升,成为AI时代“卖铲人” [6] 行业基本数据与表现 - 计算机行业股票家数337只,总市值60,008.15亿元,流通市值54,005.61亿元 [3] - 近1个月绝对表现-0.5%,近6个月绝对表现2.6%,近12个月绝对表现5.5% [4] - 近1个月相对沪深300指数表现-0.9%,近6个月相对表现-1.9%,近12个月相对表现-12.3% [4]
国产大模型及Agent动态更新
2026-03-04 22:17
国产大模型及Agent动态更新20260304 - 关键要点总结 一、 行业与公司 * 涉及行业为人工智能大模型与AI Agent行业,具体包括国产大模型厂商、海外模型厂商及算力产业链[1] * 涉及的公司包括国产模型厂商Kimi、Minimax、深度求索(Deepseek)、智谱AI(GLM),以及海外模型厂商Anthropic、OpenAI[2][3][4][5] * 产业链关注点包括算力租赁、小云厂、IDC等A股相关公司[14] 二、 市场表现与增长信号 * 2026年初,国内外模型年度经常性收入(AR)与Token消耗进入爆发期[1][2] * **海外侧**:Anthropic的AR从2025年12月的约90亿美元,跃升至2026年1月的约140亿美元,并在2026年2月进一步提升至约200亿美元,核心驱动来自Claude Code等产品[2] * **国内侧**:Kimi在2026年1月前20天的营收已超过其2025年全年总和[1][2];Minimax披露其2026年2月AR超过1.5亿美元[1][2] 三、 国产模型竞争力与市场份额跃迁 * 国产模型在OpenRouter平台的流量占比出现两次关键跃迁[3] * 第一次在2025年12月,伴随Deepseek V3.2发布,其DSA架构使长文本输出的token价格降至原来的1/7,国产模型占比提升至约10%-20%[3] * 第二次在2026年1月,伴随GLM 5发布,国产模型token消耗占比从约15%-20%提升至约25%[3] * 市场预期Deepseek V4的发布有望将国产模型在相关平台的占比从约25%推升至30%甚至40%以上[4] 四、 模型技术架构与“价格最优解”趋势 * 在有限算力供给约束下,国内模型架构呈现向“价格最优解”收敛的趋势,市场逐步找到1万亿参数规模以下的最优组合[4] * 模型能力提升节奏:未来两个月,1万亿参数规模以下的国内模型能力预计进入密集提升周期,尤其在coding领域正逐步逼近最优性价比组合[4] 五、 国产Coding模型能力评估与演进路径 * **全球相对位置**:从2026年1月的SWE Revenge测试集观察,国产模型大多得分在40分以上,海外领先模型如Claude 4.6、GPT 5.3在50分以上,国产模型整体大致相当于海外2025年10月左右的水平[5] * **差距来源**:主要来自两到三倍的参数规模差异以及数据质量差异[6] * **当前分工**:现实工作流中,常使用海外模型完成较大的代码框架编写,再由国产模型完成具体模块的编译,以获得更高性价比[6] * **演进路径**:随着国产模型参数规模从1万亿向1.4-1.5万亿、再向2万亿演进,其抽象构思能力增强,有望逐步参与到更高价值量的“大框架编写”环节[6] * **市场空间**:海外Coding模型(如Anthropic)到2022年年底可能达到约500亿美元AR的层级,这被视为国产模型市场空间的上限参考[7] 六、 AI Agent体验跃升的核心驱动 * **训练数据结构变化**:2025年开始,训练数据中混入更多“符合人类偏好”的数据(如报告结构、PPT审美数据),使模型输出更拟人化,目标可达人类输出的80%甚至90%[8][9] * **工具调用工程化跃迁**:这是2025年至2026年Agent体验发生“翻天覆地”变化的核心驱动[8] * **2025年痛点**:工具定义与说明挤占大量上下文。以128K上下文为例,工具调用可能占用60-80K,仅剩30-40K用于文本输出,导致Agent通常只能执行3-5个任务,且调用失败率高[10] * **工程化改进**:2025年11月,Anthropic推出scale机制,将工具库内容迁移到本地文件,仅向模型保留简洁描述。这使有效上下文从约30-40K提升到100K以上,调用成功率显著提升[11] * **能力量化变化**:Agent从过去跑3-5步就失败,提升到可运行10步以上,甚至支持执行持续约20分钟的任务[11] 七、 Agent技术发展方向 * **记忆系统**:OmniCloth采用本地两层记忆系统实现“千人千面”,第一层记录每日对话记忆,第二层对历史记录进行统一摘要,用较简单的机制实现个性化效果[12] * **Multi-Agent/Agent集群**:2026年的核心价值是通过对不同Agent分工,确保每个Agent上下文足够纯净,避免多任务导致的上下文污染,让每个子系统更稳定地发挥接近人类80%-90%的输出质量[13] 八、 2026年产业趋势总判断与投资关注点 * **总判断**:2026年被定义为算力投入与模型收入产出循环“第一次真正转起来”的一年,国内外模型厂收入有望继续极高速增长,且增速可能显著超出市场预期[14] * **A股关注点**:主要集中在国产算力链条,包括算力租赁、具备H100/H20等服务器现货的小云厂、以及服务器上线后存在大量放置需求的IDC等环节[14] * **海外循环与出海机会**:海外侧的“算力投入-产出”循环可能比国内更明显、兑现更早。2026年存在一些从0到1的出海方向,整体判断偏积极[15] * **ROI担忧缓解**:资本市场此前对投资回报率(ROI)的担忧,预计在2026年得到较好解决,2026年上半年将看到AI Agent与模型性能提升及变现落地的进一步发展[15]
电子行业深度报告:端云协同驱动AI入口重塑与硬件范式重构
东吴证券· 2026-02-27 13:50
报告行业投资评级 - 增持(维持) [1] 报告的核心观点 - 端云协同正驱动AI入口重塑与硬件范式重构,云端模型能力外扩与成本下降,端侧模型聚焦效率优化与能力压缩,并牵引硬件在算力、存力与散热方面协同升级 [1][2][5] 根据相关目录分别进行总结 1. 云端模型:能力边界外扩与成本重构并行 - **海外模型加速迭代,竞争范式转向任务能力比拼**:2026年以来,海外头部厂商围绕代码能力与多Agent体系密集布局,大模型正从对话式助手升级为具备执行闭环能力的操作型智能体 [5][10] - **代码模型沿“低延迟交互”与“长链复杂推理”双路线演进**:以OpenAI的Codex-Spark为代表的交互型Agent追求“近乎即时”(每秒超1000 tokens)的响应速度;以Claude 4.6为代表的任务型Agent则提供一百万Token长上下文,提升金融、法律等复杂业务场景的任务成功率 [5][13][14] - **多智能体(Multi-Agent)框架加速成为主流架构**:xAI的Grok 4.20以C端免费形态推广多智能体,通过四个专家体协同运行,使复杂推理准确率提升、幻觉率下降约65% [5][15] - **模型迭代周期显著缩短**:行业模型更新节奏加快,例如Google在推出Gemini 3 Pro后约三个月发布能力翻倍的Gemini 3.1 Pro;xAI的Grok 4.20可实现“每周版本更新” [5][17] - **国内模型性能快速追赶且性价比优势扩大**:春节期间国内厂商密集更新,呈现“性能逼近海外头部、价格快速下探”特征,正从供给端拉低行业推理成本并带动需求释放 [5][18] - **具体厂商表现**: - MiniMax M2.5定价显著低于行业主流,在约100 Tokens/s吞吐条件下连续运行一小时成本约1美元,1万美元预算理论上可支撑约4个Agent全年7×24小时运行 [20] - 字节豆包2.0 Lite输入价格约0.6元/百万tokens,相较行业均值呈数量级下降 [20] - 阿里通义千问Qwen 3.5引入原生GUI理解能力,综合成本较前代下降约60%,大型工作负载处理能力提升约8倍 [20] - **需求弹性开始释放**:MiniMax M2.5上线后24小时内用户构建超过1万个“专家Agent”;智谱GLM-5发布后需求强劲,公司上调GLM Coding Plan价格超过30% [20][22][24] 2. 端侧模型:端云协同主线下的效率优化与能力压缩 - **端云协同成为主流架构范式**:端侧模型的终局并非替代云端,而是与云端分工协同。高频、轻量、强隐私任务在端侧本地处理;重推理、长生成和高算力任务上云执行 [5][26] - **多模态能力是端侧模型关键竞争要点**:端侧是实现多模态“零延迟”交互的理想路径,全双工流式架构正成为主流交互范式。视觉Token压缩(如MiniCPM 4.5的3D-Resampler技术)是提升效率的关键 [5][29][31] - **模型架构在探索中演进**:MoE(混合专家模型)在端侧受限于内存瓶颈,EdgeMoE等工程优化可带来约1.2–2.7倍的推理性能提升,并降低约5–18%的内存占用。行业同时探索Qwen的Gated Delta-Net、DeepSeek的mHC、Mamba与注意力结合的混合架构等替代方案 [7][29][32][33] - **低比特量化技术持续发展**:4-bit已成为行业标准部署配置。行业开始探索2-bit等更低精度量化,Microsoft的BitNet表明1.58-bit量化可行,但需从头训练模型 [7][36][37] - **推理优化决定端侧体验上限**: - **Attention效率优化**:FlashAttention系列通过IO-aware设计提升计算利用率,端侧模型采用local-global attention、grouped query attention以适配硬件 [7][40] - **KV Cache管理**:KV Cache压缩对内存占用至关重要,研究显示可压缩至约3bit而质量损失有限。ChunkKV等技术在保持语言结构的同时带来约26%的吞吐提升 [7][41][42] - **并行解码加速**:Medusa、EAGLE等技术通过小模型生成草稿token再由大模型并行校验,实现约2.2–3.6倍推理加速。Diffusion LLM与并行解码结合,推理速度有望较传统自回归提升约4–6倍 [7][43][44] 3. 端侧模型牵引硬件重构:算力、存力与散热协同升级 - **整机AI功能从单点走向多模态与系统级整合**:2024年行业以图像消除、文本摘要等低门槛功能为主;2025年加速向语音、生成式图像等多模态创作延展,并进一步向操作系统底层渗透,竞争转向多模态体验与系统级整合深度 [2][48] - **存储侧:LPDDR6实现系统性能效提升**:三星LPDDR6支持高达10.7 Gbps的数据传输速率,单颗容量最高支持16GB。通过架构与电源管理重构,实现较上一代约21%的能效提升 [2][50][51] - **散热侧:新材料与方案优化热管理**:三星Exynos 2600芯片首次引入High-k EMC材料,使热阻较Exynos 2500降低约16%,有效缓解重载场景下的降频问题 [2][51] - **下一代旗舰SoC实现协同升级**:高通Snapdragon 8 Elite Gen 6有望推出支持LPDDR6的Pro版本,频率或将达到5GHz-5.5GHz,并计划引入三星HPB(高性能散热方案) [2][55]
“一人公司”的齿轮开始转动,2026 的 AI 到底发生了哪些变化?
AI科技大本营· 2026-02-26 18:05
行业核心观点 - 2026年AI行业发生根本性变局,焦点从大语言模型的“参数崇拜”和“脑子”的智能,转向了AI智能体(Agent)在现实世界中拥有自主执行、交易和解决纠纷的能力,即长出了“手脚”和“钱包”[4][6] - 单体模型的智力竞赛边际效益递减,真正的竞争和魔法发生在“系统级工程”上,即由成百上千个能够并行工作、相互协同的智能体组成的系统[15] - AI智能体正在构建一个自我闭环的平行社会经济基础设施,包括自动化开发、可编程治理和机器间金融,这将催生“一人公司”成为现实,并可能绕过传统金融监管[22][31][47] 模型竞争与战略分化 - 主要AI公司发布新模型的策略出现显著分化:Anthropic的Claude 4.6采取“加量不加价”策略,在长文本推理和智能体编码能力上大幅提升,并在衡量经济价值的“GDP评测基准”上领先[13];OpenAI则专注于通过模型蒸馏等技术降低token成本[13] - xAI的Grok 4.20更新重点不在传统聊天,而在于**多智能体推理**能力,预示大模型的终局是大量协同工作的“专员”而非单一全能模型[14] - 行业竞争已从“百模大战”演变为巨头间的“诸神黄昏”,竞争焦点转向实际应用与经济价值创造[10][13] 软件开发范式革命 - 传统编程模式被颠覆,例如Spotify内部代号为HONK的项目已让开发者三个月未手写传统代码,其系统完全由Claude驱动,智能体可直接向App推送代码更新,人类工程师仅做最终审查[19] - OpenAI内部数据显示,目前**95%** 的代码由Codex等模型生成[19] - 工程师角色转变为“智能体经理”或“巫师”,负责管理一支由**10到20个**AI智能体组成的“舰队”并分发任务,将过去需要**15分钟**的拉取请求审查压缩至**2分钟**[20] 智能体平行社会经济系统 - 出现由AI智能体自治的“影子社会基础设施”,包括解决智能体间纠纷的**Moltcourt(智能体法庭)**系统,该平台通过密码学验证和由中立AI组成的陪审团,可在几百毫秒内完成诉讼、辩论到裁决的全过程[27][29] - Coinbase推出了专为AI智能体设计的**Agentic Wallet(智能体钱包)**,基于x402协议支持机器对机器交易,使智能体能够自主租用服务器、购买API额度、雇佣其他智能体并用加密货币结算[31] - 由OpenClaw(本地运行的智能体框架)、Moltcourt和Agentic Wallet构成的系统,使AI智能体成为可绕过传统法币和金融监管的独立经济实体[23][31] 算力需求与能源挑战 - 智能体的普及导致算力需求呈指数级暴涨,因为单个任务可能触发成百上千次后台推理[34] - 到2025年,美国数据中心已消耗全国**7%** 的电力,未来**3到5年**还需新增**80吉瓦**的电力,相当于需要新建**50到60座**标准核电站(每座约1.5吉瓦)[36] - AI算力需求已成为国家战略和地缘政治议题,推动如台积电在美国亚利桑那州投资**1000亿美金**新建四座晶圆厂等重大基础设施投资[38] 物理世界融合与隐私冲击 - AI通过智能眼镜等设备向物理世界延伸,例如Meta计划推出带面部识别功能的智能眼镜,可实时识别陌生人信息并投影,可能彻底终结公共空间隐私[41][42] - 关于该技术的辩论激烈,一方认为这是赋予个体“超级感知”的必然趋势,禁止会导致战略落后;另一方则认为这是隐私的灾难[43] - 当绝大多数人使用该技术获得便利时,选择保护隐私可能成为社交阻碍,赛博朋克式技术平推正在成为现实[43][44] 未来工作形态与个体机遇 - 未来**24个月**内,职场将出现严重两极分化:不懂利用智能体的传统白领工作将被压缩和替代;而能像“巫师”一样驾驭智能体工具链的个人,其产出可媲美过去的百人团队[45] - “一人公司”时代已成为现实,个体可通过智能体获得代码编写、加密货币结算、纠纷解决乃至现实世界感知等全套能力,形成强大的生产力杠杆[47] - 行业的关注点已从AI意识等形而上讨论,转向由商业齿轮驱动的现实应用与基础设施构建[46]
Wall Street’s AI Anxiety-Induced Software Selloff Gets a Reality Check
Yahoo Finance· 2026-02-19 13:01
行业整体表现与市场情绪 - 新型AI工具能在数秒内生成网站并自动化企业工作流程 对软件公司角色构成替代威胁 导致市场恐慌并抹去数十亿美元市值 [1] - iShares Expanded Tech-Software Sector ETF今年已暴跌超过23% 领先软件公司如Adobe、Salesforce和ServiceNow跌幅超过五分之一 [2] - 市场情绪在周中出现转变 iShares Expanded Tech-Software Sector ETF在周三上涨1.3% 部分受挫的AI超大规模公司如亚马逊、Meta和微软股价也出现上涨 [3] 公司具体动态与股价表现 - 英国软件集团Pinewood Technologies股价本周暴跌超过30% 此前私募股权公司Apax Partners放弃了7.76亿美元的收购要约 [3] - 网络安全公司Palo Alto Networks股价重挫6.8% 尽管其第二季度业绩超预期且CEO断言AI不会“很快”取代网络安全软件 但其业绩指引令华尔街失望 [3] - 云计算与业务流程公司ServiceNow股价周三上涨1.8% 公司内部人士展现出大胆的信心投票 高管取消了定期股票出售计划且CEO承诺购买300万美元股票 [4] 投资机构观点与机会识别 - 摩根大通分析师指出市场正在无差别抛售 并认为对于相信Claude Code只是另一个DeepSeek时刻的投资者而言 当前的软件估值值得关注以寻找入场点 [6] - 高盛列出了一份预期将从近期软件抛售中复苏的股票名单 包括Cloudflare、CrowdStrike、微软、甲骨文以及Palo Alto Networks [6] - 高盛同时列出了可能“落后”的股票名单 包括埃森哲、Monday.com、Salesforce、DocuSign和Duolingo [6] 技术发展背景与竞争威胁 - 谷歌的Gemini 3和Anthropic的Claude 4.6等新型及更新的AI模型 似乎能够开发出与软件制造商竞争的工具 这威胁到软件公司的利润率 [2]
【申万宏源策略 | 一周回顾展望】震荡区间下限逐步探明
申万宏源研究· 2026-02-09 09:32
文章核心观点 - 市场短期调整的快速回调阶段可能已经过去,反弹随时可能发生,但后续仍需确认震荡区间下限,市场自身反弹力量有限,需要新催化[2] - 中期市场定位为“两阶段上涨行情”,当前仍处于2026年开门红行情的第一阶段上涨高位区域,多个主线板块估值已处历史高位,市场进入中期震荡符合历史规律,等待产业趋势强化和性价比缓和后开启第二阶段上涨[2][3] - 短期探明震荡区间下限后,基于中期机会做配置的窗口将打开,这更可能是一个可以从容配置的缓慢启动过程,春季后续总体可能是震荡市,期间如春节前后、两会期间等时点可能演绎反弹波段[4] 小波段调整阶段判断 - 从量化情绪指标看,总体赚钱效应、成长相对价值的赚钱效应均已回落至历史中高位,浮盈偏高、过度交易、拥挤交易的问题短期有所缓和[2] - 短期低性价比不再极端,但性价比改善尚不充分,快速回调阶段可能已经过去,但基于市场自身力量的反弹力量仍有限,有效反弹需要新催化、新亮点[2] - 美股反弹可能带动A股科技板块反弹,但后续可能还有确认震荡区间下限的过程[2] 中波段市场定位与两阶段行情 - 2026年开门红行情本质是2025年结构性行情的拓展和延伸,当前仍处于第一阶段上涨行情的高位区域[2][3] - 历史规律显示,当板块估值提升到历史高位区域后,行情演绎阻力增加,上涨波段会向震荡波段过渡[3] - 自2025年9月以来,多个结构主线板块估值陆续来到历史高位区域并开始横盘震荡,包括:2025年9月的英伟达算力链、11月的光伏和储能、12月下旬的谷歌算力链、2026年1月中旬的商业航天和AI应用、1月底的有色金属和基础化工[3] - 现阶段,通信、电子、国防军工、计算机以及基础化工的估值都已处于历史高位区域,同时全部A股总体PE估值也在历史高位区间[3] - 中期维持“两阶段上涨行情”判断,当前抢跑远期景气、估值扩张初步到位只是“第一阶段行情高位”,等待中期产业趋势强化与周期性改善验证后,还有“第二阶段上涨”[3] - 两阶段上涨行情中,领涨板块和风格特征是一脉相承的[3] 基于中期机会的配置方向 - 一级市场创投融资额已触底回升,科技新方向不断出现,可能是趋势[5] - AI产业趋势还有明确空间,等待应用端业绩非线性变化,AI应用进步不断验证[6] - Claude 4.6的发布强化了AI应用进步趋势认知,也有利于强化算力通胀预期,A股算力链迎来反弹窗口[6] - AI投资使得部分行业传统产能升级,传统产能加速出清,同一行业中,新经济高景气,传统细分领域同样涨价,这类投资机会目前性价比较高,关注存储、光纤、玻纤、CPU[6] - 短期周期Alpha逻辑集中演绎,但周期Beta分歧犹在,国内海外周期性改善仍是有较大预期差的变化,后续周期改善仍构成二阶段上涨行情启动的充分条件[6] - 沃什的影响体现为美国版“脱虚向实”和“宽信用”,可能导致资本市场剩余流动性下降,但基本面周期性改善概率提升,后续外需改善预期可能更容易发酵[7] 震荡市中的机会与关注板块 - 震荡波段中,最佳机会是科技新方向,等待新亮点出现[7] - 其次是在震荡区间下限探明后的机会,春节前后可关注AI产业链反弹机会[7] - 宽基ETF赎回压力减弱,非银金融也有望反弹[7] - 基于中期机会做配置,景气科技和周期Alpha仍是方向[7] - 景气科技关注:海外算力链、AI应用(港股互联网真正机会)、半导体、机器人、商业航天、储能等[7] - 周期Alpha关注:有色金属和基础化工,中期周期Alpha投资的延伸可能是出口/出海链[7] - 中期看好非银金融的重估机会,春节前后短期反弹中,更高弹性的也是有中期机会的方向[7] 市场数据与指标观察 - 根据赚钱效应扩散指标,截至2026年2月6日,多个行业呈现全面收缩状态,例如:石油石化(按个数83%,较前周下降7%)、基础化工(按个数77%,下降3%)、有色金属(按个数71%,下降12%)、电子(按个数57%,下降11%)、通信(按个数51%,下降6%)、计算机(按个数39%,下降10%)[10] - 部分行业赚钱效应继续扩散,例如:食品饮料(按个数52%,上升13%;按市值70%,上升60%)、家用电器(按个数48%,上升9%;按市值58%,上升31%)、医药生物(按个数47%,上升7%)、银行(按个数45%,上升24%)[10] - ETF数据显示,部分科技及周期主题ETF近期份额增长显著,例如:富国中证电池主题ETF近5个交易日份额增长17.7%,广发中证创新药产业ETF今年以来份额增长25.9%,富国中证大数据产业ETF今年以来份额增长33.8%,博时自然资源ETF今年以来份额增长35.3%[11]
昨夜,OpenAI 与 Anthropic 双雄打擂台,专家:2026 年 Agent 将在产业里遍地开花
36氪· 2026-02-06 18:43
AI技术发展现状与阶段 - 人工智能发展处于“阶梯式跃迁”的平台期,沿着现有技术路径的边际收益正在递减,下一次质变需要全新的范式突破 [1][5][6] - 近期OpenAI与Anthropic的模型更新(如Codex 5.3与Claude 4.6)被解读为大模型能力正逼近阶段性上限的信号,行业在集体寻找新突破口 [1] - 预训练范式遇到瓶颈:规模定律红利趋近耗竭,互联网高质量训练数据见顶,继续扩大模型规模的边际收益显著下降 [6] - 后训练范式同样存在局限:奖励函数设计复杂度已堪比特征工程,Meta近期研究表明后训练的增量空间可能比预期更有限 [6] 下一代技术突破方向 - 下一代突破可能针对现有范式的缺点进行改进,例如突破记忆与持续学习瓶颈、打通经验学习和自我博弈路径、提高长上下文支持能力、探索动态数据新训练方法 [7] - 也可能需要探索全新的技术范式,例如受神经科学启发的软硬件结合架构、新的数据来源、离散Diffusion等新建模方式、以及新的智能性理论与奖励函数设计 [7] - 合成数据被视为核心解法之一,其本质是搜索,在语言空间中使用预训练好的大模型去发现新的高价值数据,可能存在新的Scaling Law [8] - 以o1为代表的推理模型通过搜索和强化学习生成高质量思维链数据;Agent则通过与环境交互并调用工具来发现全新高价值数据 [8] AI Agent发展现状与展望 - Agent被视为基座模型,是业界押注智能性提升的主要技术路线 [7] - Agent发展正从“对话”向“办事”演进,2025年已有许多能真正提高生产力的落地案例 [17] - 2026年有望成为Agent在真实场景中集中落地的关键一年,Coding Agent等新范式正在重塑传统软件开发逻辑 [1][2][13] - 在现有范式改进上,值得关注的方向包括:运行时学习(Runtime Learning)、记忆机制、解决幻觉与可靠性问题、下一代评测方法、提升智能体系统整体可用性与智能性 [10] - 在新范式探索上,自我迭代的训练方式以及内在动机驱动的奖励机制可能为Agent带来阶跃式突破 [10] 中美AI竞争格局与核心差距 - 当前中美竞争的核心差距不在技术路线,而在高质量数据和算力资源 [2][11] - 数据差距:美国正系统性地采集长程、复杂、高难度的专业级数据(如编程、金融、法律、咨询),这类数据推理链条长、涉及多轮交互与工具调用,单条价值可达上千美金,而国内在这方面还比较欠缺 [11] - 算力差距:算力是智能性提升的第一性原理,但国内面临芯片性能受限及大规模组网能力待提升的挑战。据传美国xAI拥有80万张H100级别集群,而国内头部“六小龙”基本还在5万张上下 [11] - 中国优势在于庞大的人才基数、深厚的数理传统、出色的工程落地能力,以及产业门类齐全、应用场景丰富、市场规模庞大的独特生态 [10] AI产业落地与市场前景 - 当前AI行业渗透率已很高,但对GDP的实际贡献还很有限,技术研发与产业落地之间存在时间差 [5][12] - AI产业真正的爆发拐点正在加速,2026年将是AI产业落地的关键一年,Agent、Coding Agent等产品形态将让更多用户真正用上AI [12][13] - 白领和知识工作者群体(如法律、金融、咨询、研究领域)有望率先释放生产力红利,AI对GDP的拉动很可能从这里开始 [14] - Coding Agent正在颠覆传统软件开发范式,使个体开发者能快速开发大量产品,极大改变了成功概率和路径 [15] 公司、产品与商业模式动态 - 在Agent领域,开源的Clawdbot被称为“AI Jarvis”;Anthropic的Claude Cowork实现了从“对话助手”到“数字同事”的跨越 [17] - Coding Agent是落地最快的方向之一:海外的Cursor、Claude Code已成为开发者标配;国内方面,Kimi K2.5作为Agentic模型表现亮眼,基座模型中GLM-4.7领先,DeepSeek-V3.2、Qwen3、MiniMax-M2.1也都不错 [17] - 通用大模型发展已非常成熟,以Gemini 3和GPT-5.2 Deep Think版本为例,性能非常强大,垂域模型很难在特定领域超越它们,生存空间有限 [18] - 开发垂域应用更优策略可能是直接基于顶级通用大模型(如GPT-5.2)进行开发,而非自研垂域模型 [18] 科研与人才培养重点 - 中关村两院AI基础学部的战略目标是补全AGI下半场的关键拼图,在产业上输出能重塑行业逻辑的核心变量,在人才上培养兼具工程能力与科学直觉的领军人才 [4] - 一项前沿科研方向是让智能体“预测未来”,通过将“信息采集—逻辑推演—仿真模拟”三个环节形成闭环,构建可工程化的科学决策平台,相关模型在国际预测评测中取得最好成绩全球第二 [20] - 未来优秀AI人才应具备三类核心能力:数学和物理的第一性原理思维、系统工程能力、以及知道什么问题值得做的科学品味 [21] - 应大胆拥抱先进AI工具,将精力集中于提出新假设、设计新实验、发现新规律等创新本质,而非纠结于底层技术细节 [22][23]