Workflow
Gemini 3.1
icon
搜索文档
AI 季报 26Q1:OpenClaw、OpenAI 与 Anthropic 的三重对阵、自进化丨晚点播客
晚点LatePost· 2026-04-03 11:24
OpenClaw的崛起与AI Agent生态 - OpenClaw是一个开源的个人AI Agent框架,能在60天内其GitHub星数超过前端库React过去10年的累计,周下载量超过165万次[5][9] - 其成功标志着AI从聊天工具转向实际生产力工具,核心突破在于交互范式:它运行在本地电脑,拥有系统权限并能接入飞书、WhatsApp等日常聊天软件,使AI主动融入用户生活,而非用户主动寻找AI[9][10][11] - OpenClaw的流行在中国尤为显著,原因包括用户习惯聊天优先产品、使用Claude等应用受限、对成本敏感,以及其与高性价比国产模型的结合[12] - 它形成了一个模型厂商的新战场,中国公司反应迅速,如智谱推出了专门面向OpenClaw优化的GLM 5 Turbo模型[14][16] - OpenClaw当前存在成本高、稳定性与安全性三大不足,例如在长任务中可能因上下文压缩而丢失关键安全指令[17] - 业界正通过安全加固版本、无损压缩插件、多Agent协作插件及Skill市场等方式完善其体验[18] 头部AI公司的竞争格局演变 - **竞争焦点转移**:行业竞争焦点从纯模型能力(Benchmark跑分)转向产品与生态建设[6][9][30] - **Anthropic的强势崛起**:从2025年12月到2026年3月初,其年度经常性收入从90亿美元增长至190亿美元,增长约100亿美元,其中约75%收入来自B2B API服务,Claude Code在2026年2月的ARR达到25亿美元,已超过Cursor同期的20亿美元[23][24] - **OpenAI与Anthropic的三重竞争**:竞争体现在公司、产品(Codex vs Claude Code)和最新模型(GPT-5.4 vs Opus 4.6)层面[6][24] - **产品体验差异**:Claude Code在开发者意图理解和交流上更聪明,被比喻为负责规划的“主人”,而Codex在纯写代码能力上强,被比喻为负责执行的“奴隶”[25] - **公司战略对比**:Anthropic极为聚焦于编程和企业用户;OpenAI则优势在于庞大的C端用户基础和资金,但注意力分散,其内部已开始反思并减少支线项目投入,聚焦coding和企业服务[26][27] - **其他竞争者动态**:xAI在2026年Q1经历团队震荡,有联合创始人级别人物离职,追赶其他公司面临困难;Google正将AI深度集成进其办公套件,拥有强大的分发能力[28][29] AI模型与成本趋势 - **模型能力收敛与竞争新维度**:GPT-5.4、Opus 4.6及Gemini 3.1的能力差距正在收敛,Benchmark不再是核心差异点,下一阶段竞争关键在于开发者生态、企业信任感(安全合规)以及推理成本[30] - **编程能力成为通用代理基础**:全行业都在All in编程方向,模型的coding能力是担任个人助理类任务的基础,长上下文(如100万Token)和长程任务处理能力成为标配[30] - **推理成本成为关键**:Agent场景需要频繁调用模型,成本差距巨大,例如使用MiniMax的成本仅为使用Claude的5%,每月费用从约200美元降至15美元[14] - **中国开源模型受认可**:在OpenRouter的Token消耗榜上,中国模型如阶跃、MiniMax、Kimi、智谱等占据前列,性价比是核心优势,Cursor使用Kimi的K2.5模型作为基座也体现了对中国开源模型的认可[14][33][34] - **垂直整合趋势**:单纯做模型的厂商面临被“商品化”风险,趋势是从底层模型到上层应用的垂直整合,需要自有产品作为触手来收集真实的用户“轨迹数据”以指导模型优化[31][32] AI自我进化与前沿研究方向 - **Autoresearch展示自进化潜力**:Andrej Karpathy的autoresearch实验让AI Agent自主优化训练代码,在两天内找到20多个有效改进,将训练时间压缩了约20%[35][36] - **自进化案例密集出现**:包括Google的AlphaEvolved项目用Gemini优化自身内核提升23%性能,GPT-5.3 Codex参与自我调试,以及MiniMax发布的M2.7模型副标题为“自我进化的早期回响”[36] - **持续学习的两种路径**:一是基于文本和记忆机制的“穷人版”持续学习,易受上下文压缩影响;二是更前沿的权重更新技术,如Test Time Training,目前仅在数十亿参数小模型上验证可行[39] - **世界模型创业活跃**:方向包括3D空间建模、JEPA架构、视频信息与机器人学结合、环境模拟与交互式视频模型等,应用领域聚焦交互式媒体和具身智能[42][43][44] - **新的创业机会**:包括支持大规模个性化定制的工具、从大模型中精炼专门负责学习能力的小模型、以及将单Agent自进化实验扩展为多Agent并行协作等[41] 算力基础设施与行业影响 - **算力重点从训练转向推理**:英伟达新一代Vera Rubin架构推理性能提升3-5倍,推理Token成本可能降低10倍,Groq的LPU技术被集成其中[45] - **推理优化空间巨大**:例如Google的TurboQuant工作将KV Cache存储需求压缩至原来的1/6,CPU在Agent任务调度和执行中的作用凸显,需求出现增长曲线[46][47] - **AI引发组织与就业变革**:硅谷出现科技大裁员,如Meta裁员20%约15000人,并将节省的资金投向AI资本支出,预计AI投资将增加至650亿美元[48][49] - **企业用人逻辑变化**:招聘更重质量而非数量,倾向于“超一流人才+Agent”模式,全员AI native能力成为重点,小团队创业成为可能[49][50] - **社会影响探讨**:AI加剧资源与能力集中,可能扩大社会不平等,出现了对消耗大量计算资源的AI征收“Token税”的新思路[53][54]
AI 时代,只要你学得足够慢,就可以不用学?
佩妮Penny的世界· 2026-03-30 19:53
AI对职场环境的冲击与重塑 - 职场中形成“AI人设”维护压力 员工需自费购买并使用先进AI模型完成工作 并将优化后的结果包装为AI一键生成效果向上汇报[4] - 员工被迫利用个人时间进行与本职工作关联度低的AI项目展示 以维持“跟上时代”的形象 此举反而强化管理层“AI可替代人力”的认知 加速岗位削减[5] - 初级岗位需求正迅速下降 已成为现实 而非恐吓[9] AI对特定职业岗位的替代效应 - 设计师是受AI冲击最早的职业之一 企业招聘大幅收缩 某大厂设计团队去年仅招一名实习生 核心原因是其“用AI做东西的能力特别强”[7] - 金融投资领域招聘门槛出现变化 一家二级私募招聘投研人员仅要求年满18岁、高中学历 唯一硬性要求是“懂AI” 一级市场风险投资对年轻投资人的需求也新增“AI深度使用者”要求[10][12] - 投资机构用工结构发生变化 从过去三名初级分析师支持一名资深投资经理 转变为一名初级分析师借助AI工具支持三名资深投资经理[12] - 当前AI的能力程度被认为比三年工作经验以内的初级员工更好用 教会AI完成重复性工作的性价比远高于培养实习生[12] AI能力边界与人力协作模式 - 按投资人效率深耕单一行业 AI深度约相当于两年经验的专家 拥有三年以上行业经验者能识别其产出中的诸多问题[13] - 职场年轻人过度依赖AI导致产出存在大量错误 资深员工不仅需纠正初级员工的错误 还需纠正其使用的AI的错误[13] - 未来有效分工模式在于AI处理其擅长任务 人类负责自身擅长领域 例如AI分析税务合规可能性 人类律师则负责实现更优的税务方案[19] AI职业替代风险的数据化呈现 - Anthropic报告指出 工作被AI替代的风险取决于“工作AI能做的任务完成率” 工作环境数字化程度越高越易被替代[13][15] - 报告列出了AI任务完成率暴露度最高的十个职业 其中计算机程序员暴露度为74.5% 客户服务代表为70.1% 数据录入员为67.1% 医疗记录专员为66.7% 市场研究分析师与营销专家为64.8% 批发和制造业销售代表(不含技术或科学产品)为62.8% 金融与投资分析师为57.2% 软件质量保证分析师和测试人员为51.9% 信息安全分析师为48.6% 计算机用户支持专员为46.8%[18] - 受冲击严重的人群特征为:女性比例比平均高16% 白人高12% 亚洲人高100% 拥有研究生学位者在暴露最多群体中占17.4% 比总样本量高4倍[18] 应对策略与职业发展路径 - 个人应快速成长晋升为资深人员 或选择创业实现弯道超车[21] - 学习目的不应仅为求职或建立人设 而应深入解决实际问题 善于利用任何工具或人作为抓手[21] - 各地推行的一人公司政策红利 为年轻人自雇与灵活用工提供了出口[21] - 职业早期需要积累 投资等事业需要一定基础才能开展[24]
多Agent 狂吞token,Claude 顶不住了:一人月烧15万美元,免费AI正在退场
AI前线· 2026-03-30 18:15
Anthropic (Claude) 的产品表现与市场策略 - **内部使用强度极高** 在过去52天内,Claude团队推出了50多项重大功能更新,80%的员工每天都在使用Claude Code,一名员工单月使用费用高达15万美元 [2] - **外部付费订阅用户数大幅增长** 付费订阅用户规模在2026年翻了一倍多,大多数新增用户选择每月20美元的最低档Pro套餐 [3] - **通过营销与产品更新驱动增长** 超级碗广告调侃ChatGPT、1月推出Claude Cowork和新上线的Computer Use功能,都为其带来了明显增长 [5] - **调整使用限制以平衡需求** 在太平洋时间05:00至11:00的高峰时段,降低服务强度,用户可能在不到5小时内耗尽原本对应5小时的会话额度,约7%的用户会受到影响 [7] - **采用不透明的订阅使用上限** 订阅用户(Pro每月20美元,Max 5x每月100美元,Max 20x每月200美元)在未公开的使用上限下使用Claude,用户无法提前规划token使用量 [8] - **产品存在高风险工程缺陷** Claude Code被曝出在特定情况下,插件市场后台刷新机制可能每10分钟错误执行`git reset --hard origin/main`,导致未提交的本地改动被清除 [9][10] - **补贴逻辑旨在锁定终身高价值客户** 其补贴策略建立在将用户转化为终身客户的基础上,通过大量低使用率的付费用户补贴少数重度用户,重度用户可能带动团队或公司级采购 [23][24] - **高价套餐隐含高额算力价值** 每月200美元的订阅最高可能对应价值5000美元的算力资源,随着推理成本下降和大量用户未用满额度,平台有机会逐步实现盈利 [25] 行业竞争格局与OpenAI的定位 - **OpenAI仍在快速吸引付费用户并保持领先** OpenAI继续稳居消费者AI平台中的最大玩家,与Claude之间仍有不小差距 [5] - **OpenAI处于增长阶段的“抢地盘”策略** 通过更激进的补贴、临时提升速率限制和推动外部工具集成,旨在成为“最好的选项”而非“唯一的选项” [23] 免费与补贴模式的困境与收缩 - **免费AI模式正在退场** 前期依靠高额补贴吸引用户的策略正在收缩,免费AI可能真的要结束了 [11] - **Google收缩免费权益信号明确** Google已调整Gemini CLI策略,更严格识别违规使用、优先保障特定账号流量,并限制免费层用户访问Gemini Pro模型 [12] - **免费模式难以维持的根本原因** 世界上不存在“免费算力”,免费模式需依赖广告、数据收集或客户转化来弥补成本,但当前推理需求的复杂度和规模上涨更快,成本压力巨大 [14] - **单次请求成本差异巨大,按消息数收费不合理** 不同消息的token消耗差距可达400倍,最低请求成本约0.001美元,最高可达数美元,按固定月费或按消息数收费会导致严重亏损 [16] - **广告收入难以覆盖AI推理成本** 广告业务依赖海量曝光,单次展示收入极低,例如某频道单次播放广告收入仅约0.28美分,远不足以覆盖单次可能超1美元的AI推理成本 [18] - **用户数据价值不足以支撑完全免费服务** 虽然真实用户数据是AI时代的重要资产,但其价值高度分化,无法替代真正的付费转化,只能帮助公司多吞一点成本 [19] - **免费用户结构存在“死亡线”** 免费策略会吸引大量“只在免费时使用”的低价值用户,他们消耗大量资源却几乎零付费概率,且服务成本往往更高 [21] - **Google陷入免费模式困境** 因产品竞争力不足而依赖免费引流,吸引了大量只消耗资源不产生收入的用户(包括新手程序员和不愿付费的资深开发者),最终不得不收紧补贴 [22] - **Google的问题包含组织内部失控** 内部多个团队争抢GPU和资源,开发者工具团队难以获得模型资源支持,因为资源优先级被让给了免费用户 [25] AI工具的成本结构与定价演变 - **推理需求复杂度与规模激增推高成本** 与2023年相比,单个问题生成的token数量至少增加了十倍,因为模型需要处理整个代码库、调用工具、执行多步操作,token生成量大幅增加 [14] - **GPU占用成本高昂** 过去一条消息可能生成200个token,现在可能达200,000个token,GPU占用时间成倍增加,只要GPU服务一个用户就无法服务他人,这本身就是高昂成本 [15] - **行业计费模型从按消息数转向按实际用量** 由于单条消息成本差异巨大,过去一两年围绕“按消息数收费还是按实际用量收费”的争议越来越多,例如Cursor从按消息数切换到按使用量计费引发了用户情绪爆发 [16] 当前市场阶段与用户窗口期 - **开发者处于矛盾且短暂的窗口期** 大公司间的竞争使得补贴和订阅服务依然慷慨,但这种状态不会永远持续,免费将减少,补贴将更精准,高价值套餐将像稀缺资源 [27] - **对用户是获取高性价比价值的“黄金期”** 用户仍能在相对低的价格下(如每月20或200美元)获得远高于支付成本的价值回报,生产力提升极具性价比 [28] - **小公司面临最艰难的竞争环境** 大公司用补贴抢客户,用高额算力压缩后来者空间,小公司需承担原价API成本,并面对用户被教育成“免费理所当然”的市场心态 [28]
计算机行业重大事项点评:AI+应用:MaaS钟摆下的历史性机会
华创证券· 2026-03-09 14:48
行业投资评级 - 计算机行业投资评级为“推荐”(维持)[3] 核心观点 - AI产业正处于“模型能力跃迁”与“应用生态繁荣”螺旋上升期,从“技术验证”向“商业落地”关键转折点,AI-Native应用正重塑全球科技版图 [6] - 2026年被视为AI Agent元年,OpenClaw等现象级个人Agent产品有望涌现,影响力可比肩2025年DeepSeek大模型开源时刻 [6] - 在此轮产业周期中,拥抱AI的企业将成为胜出关键,而AI-Native厂商凭借更具攻击性的组织形态与轻量的历史包袱,胜率更为凸显 [6] 产业趋势与技术发展 - **技术收敛与能力跃迁**:GPT-5.4、Gemini 3.1、Claude 4.6等多模态模型实现文本、图像、音频、视频统一理解与生成;o1/o3类推理模型在数学、代码、科学推理领域近似达到人类专家水平;百万级token上下文窗口成为标配 [6] - **开源与闭源双轮驱动**:DeepSeek以约1/10成本实现GPT-4o级别性能;OpenClaw推动AI Agent能力落地个人端,开源生态催生垂直领域创新,推动AI民主化;闭源模型持续引领能力边界,形成“基础模型-垂直优化-场景落地”良性分工 [6] 市场动态与商业落地 - **海外市场格局**:Anthropic、OpenAI与Google Gemini三足鼎立,企业级服务已成为核心增长引擎 [6] - **商业模式进入价值兑现阶段**:OpenAI年化收入突破250亿美元大关,Anthropic营收预计2026年翻倍至200亿美元 [6] - **市场重估与竞争壁垒迁移**:传统软件巨头(如Salesforce、ServiceNow)的护城河面临AI原生替代威胁;真正的护城河向“场景深度”与“数据闭环”迁移,如工业预测性维护、金融智能风控、医疗辅助诊断、法律合同审查等垂直场景 [6] 投资关注方向 - **大模型**:港股成为全球AI稀缺资产价值发现地,MiniMax与智谱作为全球唯二具备基座大模型能力的厂商,稀缺性溢价持续凸显 [6] - **互联网**:阿里巴巴通义开源生态国内领先,具备全栈赋能能力;腾讯混元大模型深度融入微信生态,AI广告收入高速增长,价值待重估 [6] - **AI+企服**:金蝶国际发布“企业管理AI战略”,向“AI原生企业服务平台”转型,构建企业AI内生闭环;范式智能以“AI Agent + 世界模型”为核心,在金融、能源、交通、制造、医疗等行业累计服务客户 [6] - **AI+工业**:海康威视、中控技术与容知日新分别领跑流程工业智能控制与设备预测性维护,工业现场正成为AI Agent落地的核心场景 [6] - **AI Infra(基础设施)**:达梦数据、星环科技、海量数据等国产数据库厂商加速向量数据库与AI运维功能布局,受益于信创替代与智能化升级双重红利 [6] - **AI for Science**:华兰股份、九安医疗将AI技术注入药物研发与医疗诊断;英矽智能的AI制药管线进入临床阶段,验证颠覆性技术商业化前景 [6] - **端侧陪伴**:会畅通讯针对中国超亿级独居人口的刚性情感需求,开发陪伴机器人,产品已成型发布 [6] - **数据要素**:海天瑞声等高质量数据服务商享受多模态数据需求爆发带来的量价齐升,成为AI时代“卖铲人” [6] 行业基本数据与表现 - 计算机行业股票家数337只,总市值60,008.15亿元,流通市值54,005.61亿元 [3] - 近1个月绝对表现-0.5%,近6个月绝对表现2.6%,近12个月绝对表现5.5% [4] - 近1个月相对沪深300指数表现-0.9%,近6个月相对表现-1.9%,近12个月相对表现-12.3% [4]
AI主线开年布局-春节期间海内外大模型产业动态
2026-02-24 22:15
行业与公司 * **涉及的行业**:人工智能 (AI)、大模型、多模态生成与理解、Agent AI、AI基础设施、AI for Science、广告科技 (AdTech/MarTech) [1][3][9][18][21][25] * **涉及的公司**: * **国内**:智谱 (GLM)、Minimax、字节跳动 (C-DOS, C-Dance, 豆包)、阿里巴巴 (千问)、Kimi (月之暗面)、网宿科技、优克金山、石油股份、广联达、合合信息、海天瑞声、万兴科技、税友、硅基流动 (Circon Flow) [1][2][4][5][11][12][23] * **海外**:OpenAI、谷歌 (Gemini)、Anthropic (Claude)、Meta、Janice、Oasis、DeepMind、Sora、VEED、LLaMA、Mistral [1][6][7][13][16] 核心观点与论据 * **国产模型在中腰部市场凭借性价比优势崛起**:国产模型如智谱和Minimax在Agent AI和成本优化方面表现突出,在Open Router等第三方平台的调用量排名中占据领先地位,显示出在中腰部市场的优势 [1][2] * **Agent AI驱动Token需求显著增长,国产模型承接外溢需求**:Agent AI带来的Token需求增长显著,全球开发者对价格敏感度提升,国产模型凭借高性价比承接大量需求,例如智谱API价格虽上涨但仍具优势 [1][2] * **Kimi商业化表现亮眼**:Kimi K2.5发布后20天收入已超去年全年,其中海外收入占比更高 [1][4] * **字节跳动在多模态生成领域领先**:字节跳动C-DOS 2.0在视频生成领域效果、性价比和可用度均超越竞争对手Sora 2和VEED 3.1,春节期间用户量激增 [1][5] * **国内大厂模型具备成本优势**:字节跳动、阿里巴巴等国内大厂模型参数量不大但效果良好,具备成本优势,能够以较低成本提供高质量服务 [1][5] * **海外巨头明确长期目标与持续迭代**:OpenAI设定2030年收入目标为2,800亿美元,计划投入6,650亿美元算力;谷歌发布综合能力全球领先的Gemini 3.1;Anthropic推出性价比更高的Claude 4.6 Sonnet [1][6][7] * **AI行业未来三大发展趋势**:Agent带来的Token增长(可能带来10倍甚至百倍提升)、推理成本优化、多模态生成与理解 [3][9][10] * **Unified Model(统一模型)是重要技术趋势**:能够理解并生成内容,实现从图片到视频生成的一体化体验,预计将推动视频生成市场从目前全球10亿美金增长至260亿美金 [3][13] * **AI模型留存率低,企业自研需谨慎**:即使是领先的LLM(如GPT-4),6个月后留存率仅为30%,12个月后降至20%,企业自行训练和维护模型可能不划算 [16] * **Multi-Agent协作提升效能**:多代理协同工作可以产生涌现效应,Kimi K2.5通过统帅100个Agent分工合作,效果优于单个Agent [17] * **AI基础设施需求稳健**:尽管SaaS模式面临挑战,但对AI基础设施(算力、AIDC、CDN、云计算)的需求仍然是全面利好 [11] * **AI应用层存在长期投资机会**:尽管短期承压,但在行业know-how、数据和客户方面有深厚积累的公司(如广联达、合合信息等)长期有望证明价值 [12] 其他重要内容 * **技术发展方向**:未来AI模型将向“千人千面”(个性化)、“活在当下”(实时信息获取)、“举一反三”(情景记忆优化)三个核心能力发展 [15] * **2026年关键技术节点**:预计2026年推理端技术将有显著提升;2026年将是“持续学习”之年;AI for Science预计在2026年迎来重大转折点 [3][14][21] * **开源模型的部署与盈利**:在没有原厂技术支持的情况下,部署开源模型效果通常较差;开源许可证可通过法律手段强制用户在特定条件下付费(如用户数超一亿需付费);原厂对自身模型调优成本最低,第三方服务商可能落后3-6个月 [22][23][24] * **AI对广告行业的影响初现但未完全打开**:大型语言模型对广告行业的影响已在Meta和Google财报中初步体现,但尚未广泛应用于广告投放,预计今年国内广告生态可能有所动作 [25][26] * **超长视频理解与推理技术的应用前景**:该技术可集成到耳机或AR眼镜等硬件中,实现小时级视频识别与推理,带来巨大商业机会 [20] * **特定会议信息**:2026年3月10日至11日将在深圳举行春季策略会,探讨AI重塑AdTech和MarTech领域 [19]
8500亿美元!OpenAI刷新AI公司估值纪录,领先第二名2.2倍
搜狐财经· 2026-02-20 22:57
OpenAI新一轮融资与估值 - 公司接近完成新一轮融资的第一阶段 预计募集超过1000亿美元(约6908.7亿元人民币) 远超其在2025年初创下的400亿美元融资纪录 [1] - 随着融资推进 公司整体估值可能超过8500亿美元(约5.87万亿元人民币) 成为AI圈最高估值企业 [4] - 公司投前估值也有说法维持在7300亿美元 [7] 主要战略投资者与资金用途 - 第一阶段主要战略投资者包括亚马逊、软银、英伟达和微软 [7] - 软银已累计向公司投入346亿美元 占股11% [8] - 亚马逊预计将投资最多500亿美元 软银最多300亿美元 英伟达已讨论投入200亿美元 资金将分批到位 [8] - 融资资金可能用于扩大对亚马逊芯片与云计算服务的使用规模 [8] 行业竞争格局与对比 - 若将估值约1.25万亿美元、已合并xAI的SpaceX纳入比较 OpenAI的估值将退居第二 [4] - 竞争对手Anthropic近期以3800亿美元估值完成300亿美元融资 OpenAI的估值是其2.2倍还多 [4] - 谷歌近期发布了Gemini 3.1 重新夺回AI模型王座 [9] - 有传言表示GPT将上新成人模式 且GPT5.3也将上线 [9] - Anthropic在春节期间发布了Claude Sonnet 4.6 更早之前还有Claude Opus 4.6 [12]