Agent
搜索文档
在千问30亿请喝奶茶时,Kimi悄悄在海外干了件大事
36氪· 2026-02-10 17:38
AI行业竞争格局与市场动态 - AI应用已从概念阶段进入商业化变现阶段,春节期间通过红包和补贴活动直接刺激用户增长和收入 [1] - 腾讯元宝通过极低门槛的社交裂变红包活动,迅速渗透几乎所有微信社群,引发AI领域第一波大规模用户参与 [3] - 阿里千问采取直接现金补贴策略,投入30亿并提供25元注册券,上线当天订单量突破1000万,应用冲至苹果App Store下载榜第一 [4] - 补贴大战导致市场排名洗牌,豆包跌至第三,DeepSeek跌出前三,一批国产AI应用被边缘化 [4] 月之暗面(Kimi)的战略转型与市场表现 - 公司主动放弃在C端聊天机器人赛道与巨头正面竞争,转向竞争强度较低的AI Agent(智能体)方向 [5] - 2026年1月27日发布的Kimi K2.5版本,核心优势在于处理长文本和复杂逻辑时的稳定性和“抗造”能力,而非追求惊艳的对话效果 [6] - 该版本在长上下文记忆稳定性和多轮任务执行中表现出色,更符合工程化部署和Agent场景对稳定可控的需求 [8] - 凭借工程友好型特质,Kimi K2.5被顶级开源自动化Agent框架OpenClaw列为首选推荐模型,获得全球开发者社区关注 [9] - OpenClaw框架在短期内(约一周)吸引超过200万访客,实际运行实例从1000多个暴增至2万以上,甚至带动了部署硬件(如M4版MacMini)的二手市场价格上涨 [11] - Kimi在OpenClaw上的调用量出现暴涨,据称在Token消耗量上超过了谷歌的Gemini 3 Flash [12] - 近期在GitHub等开发者社区中,关于使用Kimi部署OpenClaw的讨论成倍增加 [14] 月之暗面(Kimi)的财务状况与资本动向 - 截至2025年12月31日,公司完成5亿美元C轮融资后,账面流动资金接近100亿元人民币 [15] - 充足的现金储备使公司在行业内处于强势地位,并明确表示“短期不着急上市” [15] - 对比同行,智谱AI上半年营收1.9亿,净亏损24亿;MiniMax 2025年前三季度净亏损超5亿美元,凸显Kimi财务健康状况相对良好 [16] - 2024年春天公司估值约25亿美元时,部分创始团队及核心高管(如联合创始人张予彤)选择套现老股离场 [17][18] - 知名投资人朱啸虎曾在2024年多次公开唱空公司,认为通用大模型同质化严重,最终会被大厂收编 [21] AI行业面临的挑战与Kimi的潜在风险 - 算力是核心瓶颈,公司公开表示“是真的缺卡”,多次扩容仍无法满足需求,公开在线寻求算力渠道 [23] - 在当前地缘政治和供应链环境下,算力是中国AI企业的集体软肋,对用户量暴涨的公司而言是实打实的瓶颈 [26] - 竞争对手(阿里千问、腾讯元宝、字节豆包)不仅拥有现金,还具备自建算力集群、长期锁定的供应链和内部资源倾斜能力 [27] - 巨头的一次大规模营销战役(如阿里千问的30亿补贴)成本,可能就相当于公司持有的部分现金储备 [28] - 公司曾在2024年凭借“长文本”技术取得短暂领先,但优势很快被大厂跟进并抹平,面临“先发而后至”的挑战 [30] - 当前在Agent赛道取得的半步领先优势,未来可能面临巨头转向同一赛道后的激烈竞争 [29]
迈富时午后涨近10% Agent供需两端将迎指数级增长 公司构建全链路AI原生营销闭环
智通财经· 2026-02-09 15:28
公司股价与交易表现 - 迈富时(02556)午后股价大幅上涨,截至发稿时涨幅达9.06%,报41.16港元 [1] - 成交额活跃,达到1.72亿港元 [1] AI Agent行业增长前景 - 根据IDC报告,各行各业对AI Agent的需求正以指数级速度膨胀 [1] - 全球AI Agent年度Token消耗量将从2025年的0.0005 PetaTokens暴增至2030年的152,667 PetaTokens [1] - 该消耗量的年复合增长率高达3418% [1] - 全球活跃AI Agent数量将从2025年的2860万飙升至2030年的22.16亿 [1] - 活跃AI Agent数量在五年内增长近80倍,年复合增长率为139% [1] 公司业务概况与市场地位 - 迈富时是全球领先的AI应用平台 [1] - 公司已累计服务超过21万家企业 [1] - 公司的GEO平台已深度落地多个行业,包括零售消费、B2B生产制造、汽车、家居、大健康、文旅、外贸出海等 [1] 公司产品与技术升级 - 迈富时Marketingforce日前宣布全新升级GEO智能助手 [1] - 升级强化了生成式引擎优化(GEO)技术 [1] - 目标是构建全链路AI原生营销闭环 [1] - 此举旨在助力企业抢占AGI时代的AI搜索流量高地,沉淀品牌AI认知资产,筑牢消费者决策全链路的竞争优势 [1]
未知机构:算力缺口将持续到2027年Agent爆发带来的算力缺口是底层-20260209
未知机构· 2026-02-09 11:05
行业与公司 * **涉及的行业**:人工智能(AI)算力行业,具体涵盖AI芯片(GPU、CPU)、存储(HBM)、先进封装、数据中心基础设施等[1][2][3] * **涉及的公司/案例**:Kimi(月之暗面)[1]、特斯拉[4]、小鹏汽车[5] 核心观点与论据 * **核心观点:AI Agent的爆发将导致算力缺口持续至2027年,甚至更久** * **根本原因**:AI Agent的普及是底层逻辑的质变,驱动算力需求呈指数级增长,而非线性增长[1][3] * **持续时间**:算力缺口将持续至2027年第二季度,部分高端环节的紧张可能延续至2030年[1][3] * **论据一:单Agent算力消耗远超传统Chatbot** * **任务性质质变**:Agent任务从“聊天”变为“执行”(如一句话点外卖),导致Token消耗爆炸式增长[1] * **具体数据**:传统Chatbot单次交互约2,000 token;Agent启动阶段消耗1-2万 token,单步思考消耗20万+ token,完成项目总消耗达百万级token,是普通用户的100-1000倍[1] * **论据二:算力需求结构发生质变,并发率飙升** * **工作模式**:从“用户触发”变为“7×24小时自主工作”[1] * **并发率变化**:长任务并发率从ChatGPT时代的约1%飙升至Agent时代的30%-40%,导致资源持续占用不释放[1] * **论据三:算力核心硬件全面缺货且扩产周期长** * **缺货现状**:GPU(“卡”)严重短缺,Kimi(月之暗面)在2026年2月5日公开表示“是真的缺卡”[1][2];存储(如HBM)价格已上涨好几倍;CPU也面临缺货和延期[2] * **供给受限**:先进制程产能优先排产GPU,材料供给受限等多因素叠加[2] * **扩产周期**:算力核心硬件(GPU、HBM、先进封装、CPU)的扩产周期都在18-24个月以上[3] * **论据四:2026-2027年将迎来“训练+推理+边缘”三端共振** * 进一步拉长算力缺口周期[3] * **论据五:区域数据政策导致算力需求区域错配,催生新增量** * **政策要求**:许多国家(如美国、中国、欧洲)不允许数据出境,跨国企业需在当地建立数据中心[4] * **新增市场**:这催生了数据中心本地化建设的新增长需求[4] * **案例佐证**:特斯拉宣布其国内的AI训练中心投入使用;小鹏汽车出海欧洲,其智能驾驶也需要在欧洲建立AI训练中心[4][5] 其他重要但可能被忽略的内容 * **CPU成为Agent任务的核心瓶颈**:在Agent任务中,**90.6%的端到端延迟消耗在CPU**(用于工具调用、任务拆解、逻辑判断),GPU仅负责不到20%的密集计算[1] * **对产业链的潜在影响**:硬件短缺和区域错配可能**利好国产替代**,例如光刻机、光刻胶等领域[3] * **一个创新的设想**:为应对数据本地化要求,提出了一个设想——是否可能在巨轮上建立可移动的数据中心,以实现硬件复用,同时满足数据本地化要求[5]
华泰证券:Agentic Coding加速迭代 关注Agent进展
第一财经· 2026-02-09 08:15
行业趋势与展望 - 以Claude Code为代表的Agentic Coding产品和以OpenClaw为代表的Agent应用产品正在加速迭代,Agent应用正在加速,有望带来软件行业重构 [1] - 判断2025年是Agent元年,2026年可能进入Agent加速落地期 [1] Agent发展的具体体现与影响 - Agent加速落地主要体现在两方面:一是Agentic Coding的迭代速度会大幅加快;二是国内外大厂会激烈争夺个人Agent助手的超级入口 [1] - 上述两方面均会成为下一轮token加速的重要推手 [1] - Agentic Coding的快速迭代可能会加速软件行业的重构,软件开发成本面临“杰文斯悖论”:未来个性化的、由AI生成的软件会爆发,但单体软件的价值可能下行 [1] 投资建议 - 建议持续关注Agent进展 [1]
大科技海外周报第5期:布局节后科技行情-20260208
华福证券· 2026-02-08 21:41
行业投资评级 - 强于大市(维持评级)[8] 核心观点 - 科技多板块持续回调,短期回调更多是资金和情绪驱动,各成长方向产业趋势明确,中长期具有坚实的基本面趋势支撑,建议关注板块内超跌个股的机会[1][2] - 布局节后科技行情,重点关注Agent带动CPU需求、具身智能机器人、商业航天及半导体涨价四大方向[3][4] 市场表现总结 - 2026年01月28日至2026年02月06日期间,科技行业多板块回调幅度显著:半导体(申万)下跌9.30%,万得AI眼镜主题指数下跌8.51%,国证算力下跌8.48%,卫星通信下跌8.23%,机器人指数下跌4.82%,同期上证指数下跌1.80%[2] 具体投资方向与逻辑 Agent带动CPU需求 - 近期国产Agent在春节前开启“红包大战”,Agent APP下载量迎来显著增长,预计Agent的投流推广将带来增量的CPU和GPU需求[3] - 在Agent快速发展的AI时代,系统设计需从以GPU为中心转向CPU-GPU协同,预计在Agent持续发展的过程中,CPU需求有望被拉动,建议关注国产CPU投资机会[3] - 报告建议关注的公司包括:海光信息、龙芯中科、禾盛新材等[5] 具身智能机器人 - 魔法原子、银河通用、宇树科技等多家机器人企业陆续宣布与2026年春晚达成合作,具身智能机器人有望亮相春晚舞台[3] - 据GGII预测,全球人形机器人市场销量2025年预计达到1.24万台,2030年有望达34万台,2035年有望超过500万台[3] - 随着物理AI的技术迭代,人形机器人将有望从表演舞台走向工厂产线,建议关注人形机器人产品进展和产业链机会[3] 商业航天 - 宇航电源供应商电科蓝天将于2月10日登录科创板[4] - 可回收火箭核心公司蓝箭航天的IPO进程在2025年12月31日被上交所受理后,在2026年1月22日就达到“已问询”,上市进程大超预期[4] - 相关公司的上市融资或将加速产业发展,坚定看好商业航天产业链在2026年的加速发展机遇[4] - 报告此前明确提出看好商业航天产业趋势,预计未来我国可回收火箭的成功回收将降低单次发射成本,有望成为行业加速发展的拐点[4] - 报告建议关注空间激光通信及手机直连卫星通讯产业链相关公司[5] 半导体涨价 - 观察到半导体涨价涵盖存储、晶圆代工、功率、模拟、MCU、被动元器件等多个品类[4] - 判断涨价主要原因包括:1)需求端AI基建对半导体的拉动速度超出产业预期;2)供给侧存储的产能挤占导致其他品类产能受挤压;3)供应链方面上游金属涨价提升了成本,产业链有顺价的需求[4] - 看好半导体涨价的持续性,建议关注相关投资机会[4] - 报告建议关注半导体国产替代在材料、设备及零部件、Fab等环节的相关公司[5] 其他建议关注方向 - 端侧AI:报告建议关注龙旗科技、立讯精密、统联精密、歌尔股份、蓝思科技、恒玄科技、汇顶科技、华灿光电、中科蓝讯、紫建电子、佳禾智能、润欣科技、豪鹏科技等[5]
AI“租人”平台一夜爆火:时薪3500、2.4万用户抢着“卖身”,专家:警惕劣币驱逐良币
AI前线· 2026-02-08 14:12
文章核心观点 - AI Agent(智能体)的发展已从被动执行工具演变为能够自主规划、调度资源,甚至将“人类”明确定义为一种可被API调用的现实世界执行资源,这引发了关于技术伦理、社会影响和行业未来方向的广泛讨论与焦虑 [2][4][25][32] 关于RentAHuman.ai平台的现象与影响 - 一个名为RentAHuman.ai的网站上线,其标语为“机器人需要你的肉身”,将人类定义为可被AI调用的“硬件资源”,上线一天访问量突破50万 [4][5][6] - 平台逻辑是AI代理直接发布线下任务雇佣人类执行,任务内容高度日常化,如取衣物、拍照、试吃等 [8] - 截至文章撰写时,已有超过2.4万名人类用户“挂牌待租”,时薪从50美元到150美元不等,最高达500美元,多数任务以稳定币结算 [10][12] - 该平台在技术社区引发热议,核心担忧在于AI可能将非法行为拆解为多个表面无害的小任务,分发给不同人类执行,从而稀释责任,且AI能以更低成本、更高效率进行这种调度 [14][15][16][17] 技术架构与行业意义分析 - 从技术角度看,RentAHuman.ai并未引入突破性技术,但其系统架构首次明确将“人类”定义为AI可调用的一类执行资源,是为AI Agent补齐现实世界执行的“最后一块工具拼图” [25][26] - 平台将人类任务拆解为包含明确指令、有限输入、预期输出、时间与报酬等要素的结构化任务,使其在技术上与API调用无异 [27][28][29][30] - 专家指出,此类项目(包括Moltbook)的爆火,本质上是让大众直观感受到Agent的“主动性”和“扩展性”,而非展示了成熟的产品形态 [32] AI Agent发展的风险与挑战 - 爆火项目暴露的问题集中在三方面:内容与信息风险急剧放大;技术焦虑的社会性扩散;技术发展方向可能偏移,导致“劣币驱逐良币” [33] - 当前主流Agent框架的最大瓶颈在于无法精准、稳定、可预测地理解真实物理世界的环境、规则及人类意图,导致在现实世界中频繁遭遇“最后一公里”问题 [36] - 当前Agent技术仍普遍存在幻觉生成、决策不可解释、推理链条脆弱等根本性局限 [39] 行业未来范式与人类角色 - RentAHuman可被视为Agent体系的“物理世界补丁”,它以低成本、即插即用、全球可扩展的方式,为Agent提供了临时的物理执行通道并缓解部分幻觉问题,但本质是阶段性方案,未来可能被具身智能等技术替代 [35] - Agent的创新路径正在推动范式从“Human-in-the-loop”向“Human-as-a-service”转变,人类逐渐从主导者转变为一种可被灵活调用的智能资源 [37] - 专家强调,无论技术如何演进,人类都必须处于主导位置,因为人类独有的直觉、审美、价值权衡和情感理解是Agent系统无法内生具备的关键要素,缺乏人类引导易导致机械化的无意义循环 [38][39]
Agent叙事强化,算力与SaaS分化加剧
华泰证券· 2026-02-08 12:20
行业投资评级 - 科技行业评级:增持(维持)[6] - 计算机行业评级:增持(维持)[6] 报告核心观点 - 2026年AI Agent的渗透是下一个Token加速点,行业正从“能力验证”走向“规模化应用”的关键拐点年[2][49] - 海外云厂商资本开支持续上修,AI需求表述乐观,算力侧Agent主线强化[2][50] - AI应用层面,云厂商业绩加速兑现,但SaaS市场预期偏悲观,部分公司有望通过产品价值下沉实现重估[3][57] - AI for Science在生物制药商业化最快,材料领域有望突破,预计2026年将成为重点应用与投资方向[4][89] - Agentic Coding加速迭代,将重构软件行业,软件开发成本面临“杰文斯悖论”[5][91] 根据目录总结 AI模型:Agent能力持续演进 - **DeepSeek-OCR 2提升视觉理解能力**:2026年1月底推出,参数规模约3B,在OmniDocBench v1.5上评分为91.09,较前代提高3.73个百分点,压缩效率方面仅用1120个视觉token实现较低编辑距离误差(0.100 vs Gemini-3 Pro的0.115)[10][18][22] - **Kimi K2.5引入并行Agent架构**:总参数量约1万亿,采用MoE架构,引入“Agent Swarm”并行Agent架构,可将多步任务总耗时减少4.5倍,端到端运行时间降低约80%[24][30] - **腾讯CL-bench揭示模型临时学习短板**:基准测试显示,主流模型在CL-bench上整体成功率偏低,GPT-5.1(High)平均成功率仅为23.7%[32] AI算力:Agent主线强化,CSP Capex持续上修 - **Agent渗透驱动算力消耗指数级增长**:Agent推理范式复杂,算力消耗大,以Claude Code为例,完成一个小项目可能消耗百万级别token,相比Chatbot单次交互消耗提升3个数量级[47] - **海外云厂商资本开支快速增长**:2025年第四季度,海外四大CSP资本开支合计1270亿美元,同比增长63%,环比增长13%,其中Microsoft/Google/Meta/Amazon的资本开支同比分别增长66%/95%/49%/52%[50] - **下一代光互连方案CPO/NPO进入产业化元年**:英伟达Rubin Ultra机架将采用NPO方案,预计2026年上半年开始部署,CPO技术进入规模化商用阶段[52][56] AI应用:云厂商业绩加速兑现,静待SaaS预期修正 - **云厂商业绩持续加速**:2025年第四季度,Microsoft、Google、Amazon云业务收入同比增速分别为39%、48%、24%,下游需求持续高增[59] - **传统SaaS加速产品价值下沉**:例如ServiceNow的AI Control Tower订单量环比增长近3倍,SAP的Business Data Cloud累计合同金额约20亿欧元[63] - **Palantir提供业绩范式参考**:2025年第四季度总营收14.07亿美元,同比增长70%,其中美国商业收入同比增长137%,积压订单(RPO)达42.10亿美元,同比增长43%[66][68] AI4S:生物制药商业化最快,材料领域有望突破 - **AI制药合作深化与爆发**:2026年1月,赛诺菲与Earendil Labs的合作总价值从18.45亿美元提升至25.6亿美元,标志着AI驱动抗体药物研发投入加大[79][80] - **AI新材料研发范式变革**:微软的MatterGen能够根据性能需求从头生成新材料,相比传统筛选方法,在同等计算成本下发现的新材料数量远超数个量级[82][85] - **产业合作进入验证阶段**:2026年1月,晶泰控股与晶科能源子公司合作,共建全球首个“AI决策-机器人执行-数据反馈”全闭环叠层电池智造线[87] 月专题:Agentic Coding加速迭代 - **AI Coding成为企业AI支出热点**:占企业部门级AI支出的55%,正从代码补全向自主执行任务的Agentic Coding范式跃迁[92] - **AI Coding能力快速演进**:预计目前已能构建5000-20,000行代码的中型系统,未来两年可能实现中型系统完全自主生成[92][93] - **中美厂商加速布局**:海外以Claude Code、Cursor、GitHub Copilot等为代表,国内阿里巴巴、字节跳动、百度、腾讯、DeepSeek等厂商均有产品布局[101][102][103] - **对软件行业价值锚点产生冲击**:软件价值将从交互外壳向逻辑内核、从记录系统向执行系统、从封闭系统向开放接口转移,软件开发成本面临“杰文斯悖论”[104]
2026 AI年度展望:关于「大公司、独角兽、创业者」的十条趋势判断
新浪财经· 2026-02-07 21:43
2026年中国AI市场竞争格局 - 2026年是中国AI ToC市场大厂进行最后一搏的关键窗口期,竞争激烈程度不亚于历史上的打车、支付等大战 [2][58] - 字节跳动凭借豆包已占据AI to C一线位置,手握最大流量,其推出的豆包手机是对边界的试探 [2][58] - 阿里巴巴对“千问”进行战略级投入,2026年将更加淋漓尽致,例如投入30亿人民币进行市场推广 [2][58] - 腾讯同样会采取大动作,大撒“元宝红包”仅是开始 [2][58] - 对于“AI六小虎”(如智谱、MiniMax、月之暗面、阶跃星辰等)而言,随着部分公司完成港股IPO或大额融资,故事告一段落,自我造血和寻找差异化商业化道路迫在眉睫 [3][58][59] 主要科技公司战略与挑战 字节跳动 - 豆包的核心决策是早期确认多模态为核心能力,实现了AI能力平权,并在2025年抓住了最佳增长时机 [8][64] - 2025年通过引进以吴永辉为代表的世界顶尖人才,完成了顶尖模型人才储备,基础模型层稳居国内第一梯队 [8][64] - 2026年面临的核心挑战是如何在激烈竞争中留住顶尖人才 [8][64] - 长期挑战在于如何保持AI模型能力领先,并将AI助手与电商、外卖等线下服务联动,尽管公司组织年轻有活力,但内部协同仍是难题 [8][66] 阿里巴巴 - 千问是阿里集全集团之力打造的C端AI入口,产品路线从差异化的办事、办公场景切入,走专业路线,长期目标是成为AI入口 [10][69] - 千问未来不仅是对外AI入口,也将为阿里内部众多业务提供底层AI能力平台 [10][69] - 2026年的挑战在于,阿里业务体系庞杂,千问作为独立技术团队,理解并协同各业务单元对AI能力的诉求存在困难 [10][69] - 阿里通过组织变革(如成立千问C端事业群)来换取决策速度,以抓住AI助手可能成为新流量入口的短暂机会窗口 [11][70] - 行业观点认为,2026年将是大厂真正开打“ChatGPT之战”的一年,虽然市场已有DAU过亿的产品,但市场远未饱和 [10][69] 腾讯 - 元宝早期就明确了“模型即产品”的重要性,接入DeepSeek后强化了这一共识,2025年聚焦于提升模型能力及产品与模型的深度整合 [15][73] - 元宝选择聚焦高知人群走差异化路线,旨在利用其意见领袖效应形成示范 [15][73] - 截至2025年底,元宝的搜索服务部分基于混元,部分基于DeepSeek,但大多数用户仍选择DeepSeek作为默认模型,公司需摆脱对DeepSeek的依赖 [15][73] - 近期TEG搜推部门与元宝搜推合并,旨在提高效率并整合搜索链路,未来可能只存在统一的“元宝搜索” [15][74] - 腾讯整体节奏相对谨慎,混元策略可能避开基础模型正面竞争,聚焦Agent等差异化方向,2026年关键是要理清微信与元宝的战略定位 [16][17][75] 百度 - 百度认为AI正开启“超级周期”,其价值将远超互联网时代,将深度重构“研产销服”全产业链,撬动10万亿级市场 [18][77] - 智能体(Agent)被视为产业落地的关键形态,企业需构建AI原生组织,未来可能形成“决策层+智能体”的高效架构,中层可能大幅缩减 [18][77] - 百度指出当前AI产品存在三大痛点:认知偏差与幻觉问题、落地断层(手脑分离)、体验割裂 [18][78] - 百度致力于将百度文库和百度网盘打造为“超级个人智能体”,以解决上述痛点 [19][79] - 在数字人领域,百度将其发展分为三个阶段,并率先发布高说服力数字人进入3.0阶段,未来数字人将能持续自主进化并在更多场景超越真人 [20][21][80][82] 商业模式探索与分化 - 大模型主流商业模式有五种:ToC订阅和广告付费、ToB的API售卖、ToB/ToG定制化、按效果付费、软硬件一体 [4][25][60][85] - 选择ToC订阅模式的厂商基本都选择出海,因国内用户付费意愿不高 [25][85] - 售卖API的模式本质是云服务延伸,未来云厂商会将价格压得很低,独立模型厂商难规模化,故API只能作为短期商业化补充手段 [25][85] - 定制化模式在国内不仅需要技术交付能力,人脉也很重要 [25][85] - 按效果付费和软硬一体对初创公司有机会,但都对能力提出高要求:按效果付费需模型能力足够强,软硬一体需多模态模型矩阵和端云协同交付经验 [25][85] - 2023年以来许多模型公司有“OpenAI病”,但到2025年,因资源(钱和卡)有限,更多公司转向学习Anthropic,聚焦推理和Coding等有付费市场的方向 [25][26][86] - 目前没有商业模式是成熟的,仍需几年探索,产品形态也未定型,例如OpenAI也在探索ChatGPT采用广告模式的可能性 [4][27][60][86][87] 创业公司机会与策略 - 创业公司应寻找垂直场景切入,做端到端的服务交付,而非工具 [31][91][92] - 应聚焦信息生产场景,而非娱乐、社交等消费场景,后者是大厂必争之地 [31][92] - 创业公司相较于大厂有两个优势:技术更垂直深入、可以保持技术独立性(因部分场景客户与大厂存在竞争或数据安全顾虑) [32][33][93] - 2026年被认为是Agent“按效果付费”的元年,经济模型将从“订阅费覆盖算力成本”转向“任务分成覆盖算力成本”,这能帮助用户低门槛赚钱,传播速度快 [33][94] 融资与上市环境 - 2026年初,月之暗面、阶跃星辰获得新一轮大额融资,证明一级市场仍能支撑大模型发展 [39][100] - 此前智谱、MiniMax的港股IPO向市场释放了信号,但走向二级市场是“双刃剑”:带来融资渠道和市场声量,但也立即面临商业化压力和股价审视 [3][39][59][100][101] - 港股IPO越友好、上市公司越多,越能改善一级市场环境,为优质科技企业提供更顺畅的退出渠道和国际公允定价,反哺创新 [37][38][98] - 创业者应致力于全球创新而非区域创新,只要坚持创新,资本(包括海外资本)会主动进入,例如2025年DeepSeek和宇树的案例 [38][39][99] AI组织形态与效率 - AI时代,极小团队组织形式与全栈创新能力相辅相成,大公司中的AI研发团队也有必要简化以避免沟通瓶颈 [42][104] - 称职的极小团队创始人需具备三种核心能力:找机会(深挖行业痛点)、快速执行力(借助AI快速出Demo)、自我营销(利用社交媒体获客与验证) [42][104] - 在AI研发组织中,算法和基础设施(Infra)团队不应截然分开,强调分工易导致创新空间丧失和底层感知缺失,应共同设计、协同演进 [42][43][105] - 不应迷信一人公司,组织的关键评价维度是“人效”,公司80%的成本是沟通成本,AI可帮助规避此隐形成本 [43][44][105] - 一些头部AI公司已用AI进行内部分工,例如用Claude识别员工技能并分派任务,未来更需要具备批判性思维的通才来减少人际沟通问题 [44][105][106] 基础模型技术发展趋势 - 多模态需要走向“大一统”,即将图文、音视频等模态的理解与生成混合在一个模型中,以获得更强的上下文学习和零样本学习能力,天花板更高 [47][110][111] - AI时代真正的壁垒是“记忆”,这是所有AI产品的兵家必争之地,衡量指标应从DAU转向DTU(每日交流用户)和LMU(长记忆用户) [47][48][111][112] - 模型落地存在鸿沟,因中心化大模型缺乏高精尖领域或机构的私有数据,未来趋势是“去中心化”,通过提供低成本、易用的“脚手架”让各机构部署本地化模型,并通过模型融合构建领域基础模型 [48][49][112][113][114] 具身智能与世界模型 - 世界模型要真正有效,必须与下游场景形成验证闭环,例如商汤用上汽智己的实车检验其智能驾驶世界模型,大晓机器人用四足狗在巡逻任务中迭代模型 [52][118] - 预测物理世界的“ChatGPT时刻”可能在2-3年内到来,其定义为在100种常见任务中,90%的场景下达到95%的成功率,需VLA、世界模型和强化学习互相配合 [53][119] - 世界模型不同于数据驱动的VLA,它需要靠算法建模物理世界运动规律,让机器人能预知未来动作后果,是适合前沿实验室探索的方向 [53][54][119][120]
2026 AI年度展望:关于「大公司、独角兽、创业者」的十条趋势判断
36氪· 2026-02-07 21:34
2026年中国AI市场竞争格局 - 2026年是中国AI ToC市场大厂进行“最后一搏”的关键窗口期,竞争激烈程度堪比历史上的打车、支付大战 [7][8] - 字节跳动凭借“豆包”已占据AI to C一线位置,手握最大流量,并通过推出“豆包手机”试探边界 [7] - 阿里巴巴对“千问”进行战略级投入,计划投入30亿元进行市场推广 [6] - 腾讯通过“元宝红包”等动作参与竞争,但节奏相对谨慎 [6][32] - 百度认为AI将深度重构产业链,撬动10万亿元级市场 [34] 主要玩家战略与挑战 字节跳动 - 核心优势在于早期将AI能力平权并确立多模态为核心,2025年抓住最佳增长时机 [16] - 通过引进顶尖人才完成一流模型人才储备,基础模型层稳居国内第一梯队 [16] - 2026年核心挑战是如何在激烈竞争中留住顶尖人才 [17] - 长期挑战在于将AI助手与电商、外卖等线下服务联动,并优化内部协作 [18] 阿里巴巴 - “千问”是集全集团之力打造的C端AI入口,初期从差异化办公场景切入,走专业路线,长期目标是成为AI入口 [21] - 2026年挑战在于如何让独立的技术团队更好地理解并协同阿里内部庞杂的业务体系 [22] - 公司通过成立千问C端事业群,以组织变革换取决策速度,用市场验证产品 [26] - 认为当前AI助手市场同质化高但远未饱和,增量空间巨大,竞争关键在于迭代速度和运营能力 [24][25] 腾讯 - “元宝”早期聚焦高知人群,走差异化路线,以形成示范效应 [29] - 产品强化“模型即产品”理念,并聚焦模型能力提升与产品深度整合 [29] - 截至2025年底,大多数用户仍选择DeepSeek作为元宝的默认模型,产品需摆脱对DeepSeek的依赖 [30] - 公司通过合并搜推部门,旨在整合搜索链路,未来可能只存在“元宝搜索” [31] - 关键挑战是理顺“元宝”与“微信”的战略定位,并在自研模型能力上拿出更有说服力的成果 [32] 百度 - 认为智能体(Agent)是产业落地关键形态,已在编程优化、数字员工等领域展现突破性效能 [35] - 指出当前AI产品存在认知偏差(幻觉)、落地断层(手脑分离)、体验割裂三大痛点 [37] - 目标是打造“超级个人智能体”,赋能用户成为“超级个体” [38] - 在数字人领域,百度已发布高说服力数字人进入3.0阶段,未来数字人将能持续自主进化并支持个性化情感互动 [43][44] AI“六小虎”与初创公司 - 随着智谱、MiniMax推进港股IPO,以及月之暗面、阶跃星辰融资落定,“AI六小虎”故事告一段落,自我造血和寻找差异化商业化道路迫在眉睫 [9] - 一线美元基金合伙人认为,目前没有商业模式是成熟的,仍需几年探索 [10][54] - 模型初创公司高管列举了5种主流商业模式:ToC订阅/广告、ToB API售卖、ToB/G定制、按效果收费、软硬件一体 [10] - ToC订阅厂商多选择出海,因国内用户付费意愿不高;API售卖模式只能作为短期商业化的补充手段 [47] - 初创公司在垂直场景相较于大厂有技术更垂直、可保持技术独立两大优势 [58][59] 模型技术迭代与商业化 - 模型能力迭代方向从盲目对标OpenAI转向跟随客户需求,2025年以来更多厂商将资源聚焦于提升推理和编码能力 [51] - 未来不同模型厂商的能力将根据自身资源、优势和下游客户需求产生分化 [52] - 对于创业公司,按效果付费和软硬一体是潜在机会,但都对能力提出高要求:按效果付费要求模型能力足够强,软硬一体要求拥有丰富的多模态模型矩阵和端云协同交付经验 [49][50] - 攀峰智能CEO认为2026年将是Agent“按效果付费”的元年,经济模型将转变为“获取的任务分成能否覆盖算力成本” [60] 基础模型技术发展趋势 - 多模态需要走向“大一统”,即将图文音视频的理解和生成混合在一个模型中,以获得更强的上下文学习和零样本学习能力 [81] - AI时代真正的壁垒是“记忆”,语音是用户自然表达长上下文的最佳方式,产品价值应关注每日交流用户和长记忆用户,而非单纯的日活跃用户 [83] - 当前模型落地存在鸿沟,因缺乏领域数据,企业本地化部署需启动持续预训练以注入私有知识 [84] - 通过“去中心化”的模型融合方式,可以集各领域之力构建领域基础模型,例如融合不同医院的模型得到医疗领域基础模型 [86][87] 具身智能与世界模型 - 世界模型要真正有效,必须要有下游验证闭环,例如在智能驾驶或机器人场景中用真实反馈进行检验和校准 [90][91] - 极佳视界CEO预测,2-3年内可能迎来物理世界的“ChatGPT时刻”,即在100种常见任务中,90%的场景下达到95%的成功率 [92] - 实现该目标需要视觉语言模型、世界模型和强化学习互相配合:视觉语言模型解决作业复杂性,世界模型解决泛化性,强化学习解决准确率和可靠性 [92] - 世界模型的探索是算法创新驱动,旨在建模物理世界运动规律,让机器人预知未来动作后果,目前尚未进入工业化阶段 [94][95] 组织形态与融资环境 - AI研发组织趋向小型化,极小组织形式与全栈创新能力相辅相成,算法与基础设施团队不应脱离,需协同演进以提升效率 [75][76] - 评价组织的关键维度是“人效”,AI有助于规避沟通的隐形成本,一些公司已开始用AI进行任务分工 [77][78] - 未来组织更需要技能全面、具有批判性思维的通才 [78] - 港股IPO被视为改善一级市场融资环境的契机,能为优质科技公司提供更顺畅的退出渠道和国际公允定价 [64] - 上市是一把“双刃剑”,在获得融资渠道和市场声量的同时,也会立即面临二级市场对商业化的严苛审视和业绩兑现压力 [9][69] - 创业者应致力于全球创新而非区域创新,只要坚持创新,资本就会主动寻求机会 [66]
昨夜,OpenAI 与 Anthropic 双雄打擂台,专家:2026 年 Agent 将在产业里遍地开花
36氪· 2026-02-06 18:43
AI技术发展现状与阶段 - 人工智能发展处于“阶梯式跃迁”的平台期,沿着现有技术路径的边际收益正在递减,下一次质变需要全新的范式突破 [1][5][6] - 近期OpenAI与Anthropic的模型更新(如Codex 5.3与Claude 4.6)被解读为大模型能力正逼近阶段性上限的信号,行业在集体寻找新突破口 [1] - 预训练范式遇到瓶颈:规模定律红利趋近耗竭,互联网高质量训练数据见顶,继续扩大模型规模的边际收益显著下降 [6] - 后训练范式同样存在局限:奖励函数设计复杂度已堪比特征工程,Meta近期研究表明后训练的增量空间可能比预期更有限 [6] 下一代技术突破方向 - 下一代突破可能针对现有范式的缺点进行改进,例如突破记忆与持续学习瓶颈、打通经验学习和自我博弈路径、提高长上下文支持能力、探索动态数据新训练方法 [7] - 也可能需要探索全新的技术范式,例如受神经科学启发的软硬件结合架构、新的数据来源、离散Diffusion等新建模方式、以及新的智能性理论与奖励函数设计 [7] - 合成数据被视为核心解法之一,其本质是搜索,在语言空间中使用预训练好的大模型去发现新的高价值数据,可能存在新的Scaling Law [8] - 以o1为代表的推理模型通过搜索和强化学习生成高质量思维链数据;Agent则通过与环境交互并调用工具来发现全新高价值数据 [8] AI Agent发展现状与展望 - Agent被视为基座模型,是业界押注智能性提升的主要技术路线 [7] - Agent发展正从“对话”向“办事”演进,2025年已有许多能真正提高生产力的落地案例 [17] - 2026年有望成为Agent在真实场景中集中落地的关键一年,Coding Agent等新范式正在重塑传统软件开发逻辑 [1][2][13] - 在现有范式改进上,值得关注的方向包括:运行时学习(Runtime Learning)、记忆机制、解决幻觉与可靠性问题、下一代评测方法、提升智能体系统整体可用性与智能性 [10] - 在新范式探索上,自我迭代的训练方式以及内在动机驱动的奖励机制可能为Agent带来阶跃式突破 [10] 中美AI竞争格局与核心差距 - 当前中美竞争的核心差距不在技术路线,而在高质量数据和算力资源 [2][11] - 数据差距:美国正系统性地采集长程、复杂、高难度的专业级数据(如编程、金融、法律、咨询),这类数据推理链条长、涉及多轮交互与工具调用,单条价值可达上千美金,而国内在这方面还比较欠缺 [11] - 算力差距:算力是智能性提升的第一性原理,但国内面临芯片性能受限及大规模组网能力待提升的挑战。据传美国xAI拥有80万张H100级别集群,而国内头部“六小龙”基本还在5万张上下 [11] - 中国优势在于庞大的人才基数、深厚的数理传统、出色的工程落地能力,以及产业门类齐全、应用场景丰富、市场规模庞大的独特生态 [10] AI产业落地与市场前景 - 当前AI行业渗透率已很高,但对GDP的实际贡献还很有限,技术研发与产业落地之间存在时间差 [5][12] - AI产业真正的爆发拐点正在加速,2026年将是AI产业落地的关键一年,Agent、Coding Agent等产品形态将让更多用户真正用上AI [12][13] - 白领和知识工作者群体(如法律、金融、咨询、研究领域)有望率先释放生产力红利,AI对GDP的拉动很可能从这里开始 [14] - Coding Agent正在颠覆传统软件开发范式,使个体开发者能快速开发大量产品,极大改变了成功概率和路径 [15] 公司、产品与商业模式动态 - 在Agent领域,开源的Clawdbot被称为“AI Jarvis”;Anthropic的Claude Cowork实现了从“对话助手”到“数字同事”的跨越 [17] - Coding Agent是落地最快的方向之一:海外的Cursor、Claude Code已成为开发者标配;国内方面,Kimi K2.5作为Agentic模型表现亮眼,基座模型中GLM-4.7领先,DeepSeek-V3.2、Qwen3、MiniMax-M2.1也都不错 [17] - 通用大模型发展已非常成熟,以Gemini 3和GPT-5.2 Deep Think版本为例,性能非常强大,垂域模型很难在特定领域超越它们,生存空间有限 [18] - 开发垂域应用更优策略可能是直接基于顶级通用大模型(如GPT-5.2)进行开发,而非自研垂域模型 [18] 科研与人才培养重点 - 中关村两院AI基础学部的战略目标是补全AGI下半场的关键拼图,在产业上输出能重塑行业逻辑的核心变量,在人才上培养兼具工程能力与科学直觉的领军人才 [4] - 一项前沿科研方向是让智能体“预测未来”,通过将“信息采集—逻辑推演—仿真模拟”三个环节形成闭环,构建可工程化的科学决策平台,相关模型在国际预测评测中取得最好成绩全球第二 [20] - 未来优秀AI人才应具备三类核心能力:数学和物理的第一性原理思维、系统工程能力、以及知道什么问题值得做的科学品味 [21] - 应大胆拥抱先进AI工具,将精力集中于提出新假设、设计新实验、发现新规律等创新本质,而非纠结于底层技术细节 [22][23]