Workflow
Agent
icon
搜索文档
The Era of Agent:拾象 AGI 投资洞察
海外独角兽· 2026-05-08 20:05
AI行业格局与范式转变 - AI发展进入Agent时代,模型竞赛窗口被压缩至以月甚至周为单位,这是2026年最重要的结构性变化[2] - Coding Agent成为科技史上增速最快的新物种,其创造的年度经常性收入预计将在2026年突破1000亿美元[2] - Agent自身正在成为数字世界新的消费者与生产者,市场需要建立一套Agent-native的标尺[3] Coding Agent的战略共识与竞争 - 重注Coding Agent是当前头部AI实验室的最强共识[4][7] - Anthropic凭借Claude Code在Coding领域领先,预计将在2026年年中追平OpenAI的年度经常性收入[2] - 全球Top 3模型格局未变,但头部三家拿走了约90%的AI总收入[8] - 模型竞争交替领先将成为常态,随着OpenAI、Google在Coding上投入加重,竞争将加剧[13] - Coding能力的提升不仅带来收入爆发,还直接加速了AI实验室自身的研发和产品迭代[17] - 知识工作大规模自动化已在领先的AI实验室实现,成为重要竞争工具[20] 领先AI实验室的组织与战略分析 - 在全新范式出现前,模型训练没有秘密配方,组织和战略文化才是核心壁垒[2][34] - **Anthropic**:通过战略聚焦Coding取得胜利,其典型特点是自上而下的决策结构、对预训练路线的坚定信仰,以及面向AGI设计产品的原则[35][36][37][38] - **OpenAI**:虽然经历组织变动和战略失焦,但优势依然明显,ChatGPT周活跃用户接近10亿,付费订阅人数超过5000万[40] - OpenAI的根本问题是战略误判,长期依赖C端流量,未能及时意识到Coding的重要性,且内部同时推进项目一度高达约300个[40][41] - **Google**:是最稳定的追随者,但反应最慢,其根本问题同样是战略失误,将资源集中在C端和多模态,忽视了Coding[46] - Google拥有强大的护城河,包括自有TPU资源、Search、Android等基础设施,即便在worst case下也能退守到类似英伟达的生态角色[46] Agent时代的新范式与投资逻辑 - 市场坐标系应从To B/To C转向To Human / To Agent,需要探索Agent-native的机会[48] - Agent本身正在成为新的消费者与生产者,开始以独立身份发起交易、消耗资源、产出价值[50] - Agent等于模型加Harness,Harness的流行标志着设计哲学的根本转变,从基于规则的控制转向充分信任模型的极简理念[57][59] - Anthropic的商业模式正从按量收费的API公司,向Agent云公司或Agent OS进化,销售从Token变为Runtime[60] 机器人领域的前沿趋势 - 2026年是机器人数据规模化的大年,数据体系可类比LLM训练,分为Egocentric data、UMI数据、Teleop真机数据和World Model[61][63][64] - 行业趋势从“AI first”转向“硬件优先”,硬件是高质量规模化产生数据、影响模型训练与落地的关键[68] - 技术路径正从视觉语言模型转向世界动作模型,后者在新任务与新环境上的泛化能力据称可提升超过2倍[70] 新兴AI实验室的路线 - 硅谷涌现的新兴实验室主要分为两类:追寻下一个范式与专注高价值垂直领域[72] - 第一类实验室致力于探索如持续学习这样的新范式[75] - 第二类实验室更受资本偏好,专注于芯片设计、AI for Science、材料科学等高价值、高精尖领域,与头部公司形成差异化[79]
Product Hunt月榜盘点:单纯做Agent已经不够了,要切进真实、高频的工作流中
Founder Park· 2026-05-08 16:09
文章核心观点 - 4月AI产品趋势显示市场从追逐概念标签转向追求实际效用,竞争门槛从“是什么”变为“能干什么具体活”[7][56] - AI产品发展的核心逻辑是深度嵌入高频工作流、获取上下文、连接工具并交付可用资产或结果,而不仅是聊天或生成[3][4][56] - AI应用进入更冷静、更具体的阶段,创业重点从“造聪明的Agent”跨入“让Agent真的干活”[56][58] Agent产品趋势:从概念到实干 - Agent产品竞争门槛转变为“具体能完成什么任务”,强调交付结果而非身份标签[7] - 最高票产品Brila(1287票)是一个综合性Agent平台,其核心是完成完整工作流,例如根据Google Maps真实评论为本地商户生成可直接上线的一页式网站[8][9][11] - Offsite创新性地将Agent作为“AI同事”纳入团队实时组织架构图,与人类成员协同工作,改变了传统“一对一”的调用模式[13][14][16] - Lessie AI(413票)切入招聘场景,通过跨平台扫描数百万条专业档案来寻找目标人选,并旨在构建“关系操作系统”[17][18][19] 集成与工作流:Agent融入现有流程 - 头部AI产品开始在产品中叠加Agent功能,将其接入用户已有的工作流程中[20] - Figma for Agents让Agent进入设计团队工作流,确保AI生成的设计符合团队已有的设计系统与品牌规范[21][22] - Claude Code的更新(如Desktop App Redesigned和Routines)让开发者能在统一工作区运行多个并行coding agents,并能将任务自动化(如自动review PR),标志着AI Coding从“写代码”走向“跑完整个工程流程”[23][24][25] Voice AI:消费级产品窗口打开 - 4月语音产品形态从面向开发者的API/SDK转变为面向终端用户的消费级产品,市场窗口打开[26][27][28] - NovaVoice作为语音赛道最高票产品,定位为“Voice OS”,用户可通过语音完成桌面操作,语速可达200+ wpm[29][30][31] - Velo利用AI将原始录屏加工成可直接分享的视频内容,目标用户为产品、销售等高频录屏团队[32] - Claude Code Voice Mode的推出验证了语音作为专业工具交互界面的可行性,即使是在写代码这种高精度场景[35][37] - 会议记录产品Fathom 3.0(获711票日榜榜首)更新了bot-free capture等功能,使AI从单纯记录进入会议全流程管理[38][39] 基础设施:MCP成为Agent标配 - 模型上下文协议(MCP)已成为Agent产品的标配基础设施,截至4月底其SDK月下载量超1.1亿次,公开活跃服务器超10,000个[40][41] - 多家产品将MCP集成到具体工作流中,例如Offsite支持接入MCP兼容的Agent,Flint通过MCP从工作流生成落地页,CalendarPipe则为Agent提供日历管理能力[42][43][44][45] 内容生产:Agent接管完整链路 - AI内容生产工具在4月表现突出,产品边界从生成扩展到发布、分发和效果追踪的完整链路[46][55] - ProdShort(月榜第二,707票)将会议内容自动转化为可发布的短视频及社交媒体内容[47][50] - Google Vids 2.0集成Veo 3.1、Lyria 3等顶级AI生成模型并新增可控数字人,巨头的入场验证了赛道规模,但也收窄了通用型工具的创业窗口[52] - Influcio作为面向网红营销的Agent产品,通过自学习系统管理从创作者筛选、沟通到效果追踪的全链路,优化营销投放效果[53][54][55]
你的软件,Agent 才是主用户——Foundation Capital 进入 Agent 时代六个月的六条洞察
深思SenseAI· 2026-05-08 13:09
文章核心观点 - 行业正处在“长程自主Agent时代”的起点,其发展速度远超预期,类比1991年的个人电脑和2000年的互联网,真正的组织重构和定义性产品尚未到来,为当前入局者提供了广阔的机会窗口 [3][6][8] - 软件的新主用户正在从人类转变为AI Agent,这要求产品设计、公司运营和组织基础设施进行根本性重构,以“Agent优先”为原则 [9][10][19][20] - 企业在AI时代的真正竞争优势不在于模型微调或单纯的数据积累,而在于构建可被Agent调用的“上下文图谱”和“运行框架”,以及建立能够实现Agent自我改进的反馈循环系统 [12][14][15][17] AI Agent能力进展与历史节点 - **能力快速扩展**:AI Agent能独立完成的最长软件开发任务,成功率50%的时长从一年前的约2小时扩展到现在的12小时以上,Claude Opus 4.6可完成“从多个RFC实现复杂协议”级别的任务 [4] - **采用率指数增长**:Claude Code发布一年多,已贡献全球公开GitHub提交数量的4%,预计年底将超过20% [4] - **社区关注度爆发**:开源AI助手OpenClaw在三个月内获得的GitHub星标数超过了Linux内核,而Linux达到此里程碑用了15年 [5] - **三个关键拐点**:2022年底的ChatGPT时刻(通用交互界面)、2024年的o1时刻(推理时算力)、以及当前正在进行的长程Agent时刻(自主制定计划、行动与恢复) [6] “Agent优先”的运营与产品范式 - **运营原则转变**:运营模式应从“人类分配任务,AI辅助”转变为“Agent先发起并执行,人类在关键节点介入验证和指导” [9] - **产品设计根本改变**:当软件的主要操作者是Agent时,设计要求从漂亮的用户界面转向清晰的编程接口,从丰富的交互体验转向可预测的系统状态 [10] - **产品战略意义**:产品必须具备清晰的编程接口、支持Agent调用和符合Agent工作方式,否则将面临被Agent默认选择的竞争对手快速超越的风险 [11] 技术架构与持久优势构建 - **模型策略:可插拔优于微调**:为成本优化而持续维护微调模型消耗的工程师工时常超过其节省的成本,且需随基础模型更新重做,因此工程体系应设计为允许在一天内更换底层模型的“可插拔”架构 [12] - **核心资产:运行框架**:用户与模型之间的工程层(运行框架)负责路由、记忆、验证和多步工作编排,其中沉淀的业务流程和判断规则知识比押注特定模型更持久 [13][14] - **真正护城河:上下文图谱**:企业专有优势在于“上下文图谱”,即数据在各系统间被导航、协调以支撑决策的方式,包括隐性规则和判断调用,这随公司决策积累而愈发有价值且难以复制 [15][16] 部署挑战与价值实现路径 - **现状与落差**:AI对财富500强企业实际运营的可量化影响目前仍非常有限,认知与行动存在巨大落差 [17] - **核心问题:部署质量**:价值实现的最大障碍不是模型能力,而是部署质量差,缺乏将Agent作为“需要被管理的系统”来运营的体系 [17] - **解决方案:建立反馈循环**:应像对待新员工一样对待Agent,提供完整入职流程、持续反馈机制和专人负责改进,通过工具化监控、失败归因来形成自我改进的闭环,这本身就是核心产品 [17][18] 未来展望:工作方式的重构 - **长期运行Agent**:未来将出现拥有持续身份、可运行数月甚至更长时间的Agent,人类角色将从执行工作转向设定方向、提供判断和验证结果 [19] - **基本单位改变**:知识工作的基本单位将从孤立的一次性对话,转变为人类与Agent之间的持续关系,这引发了一系列全新的产品设计问题 [21] - **人类角色的再定义**:以建立人际关系为核心的工作(如招聘、企业销售、维护文化)仍将属于人类,人类将成为“处于循环中”的决策者和方向设定者,运营性工作将获得巨大执行杠杆,小团队可管理数百个Agent,完成远超以往的工作量 [22]
Agent对存储的拉动:传媒
华福证券· 2026-05-08 11:54
行业投资评级 - 行业评级为“强于大市” [7] 报告核心观点 - 进入Agent阶段后,人工智能上下文窗口的扩张推高了KV Cache的用量,从而带动了存储需求增长 [2][3] - 由于KV Cache规模已超出高速存储介质的承载能力,存储架构需向分级布局演进,为HBM、DRAM和NAND带来结构性增长机遇 [4] - 看好海外存储产业链的发展机遇,建议关注SK海力士、三星和美光等主要存储厂商 [6] 需求框架 - Agent时代上下文扩张导致KV Cache膨胀,是拉动存储需求的核心驱动力 [2] - 在人工智能推理场景中,为加速模型响应并避免重复计算,系统需将KV Cache保留在高速存储中 [3] - 随着上下文窗口急剧扩大,KV Cache的规模已“远远超出了HBM和DRAM的承载能力” [3] 分级存储架构 - 由于KV Cache和上下文数据规模超出单一介质承载能力,存储架构需按数据访问频率分级布局 [4] - 第一层为HBM,紧贴GPU、速度最快,用于承载活跃的KV Cache,但其典型容量较小,需要向外层存储溢出 [4] - 第二层为DRAM,连接至CPU,容量通常是HBM的“数倍”,作为HBM外溢KV Cache的二级承接层 [4] - 第三层为基于NAND颗粒的SSD,用于承载历史KV Cache及数据湖的海量数据存储,其容量可达HBM的“千倍左右” [4] 竞争格局 - SK海力士深度绑定台积电,其HBM4的核心芯片采用1b DRAM,基底裸片采用台积电12纳米工艺 [5] - 三星具备自有晶圆厂优势,其核心芯片采用1c DRAM,基底裸片采用自家代工4纳米工艺,传输速度可达11.7Gbps [5] - 美光占据北美本土供应优势,作为三大存储厂商中唯一的北美厂商,计划将约40%的DRAM产能落地美国本土 [5] - 美光近日发布其HBM4产品,带宽是上一代HBM3e的“两倍以上”,并正率先在业内挑战图形内存(GDDR)堆叠技术以提升性能 [5] 投资建议 - 报告看好海外存储产业链发展机遇 [6] - 建议关注SK海力士、三星和美光等厂商的存储供应价值 [6]
怎么看CPU-AI与价格
2026-05-07 21:51
怎么看 CPU?AI 与价格 20260507 摘要 CPU 承担 Agent 运行中 90%的后处理工作,1 个内核约支持 3-4 个常 时 Agent,需求随 Agent 规模正向爆发。 全球 CPU 供需极度紧张,Intel/AMD 订单排至 2026 年底,2025 年以 来主流型号价格已翻倍。 国产 CPU 产能今年已售罄,海光、华为等产品价格涨幅超 30%,预计 未来价格具备翻倍空间。 2026 年为国产 CPU 份额翻倍拐点,生态系统已完成量变到质变,国产 GPU+CPU 组合成为主流。 推理需求与 Token 消耗量挂钩,DeepSeek-V3 等新一代国产算力芯片 量产带动国产 CPU 大规模放量。 海光信息、华为鲲鹏占据主流,飞腾产能逐步释放,澜起科技受益于接 口与 Retimer 组件需求增长。 Q&A 在当前 AI 产业发展背景下,CPU 扮演着怎样的角色?其需求与 AI 应用之间存 在何种关联? 在 AI 技术架构中,CPU 主要承担三项核心功能:任务调度、数据处理和系统 控制。 任务调度方面,CPU 负责用户需求的分发、多 GPU 间的协同工作以及 模型的加载与卸载。 数据处理方面 ...
美股财报更新-云和广告业务支撑巨头CapEx投入信心
2026-05-07 21:51
行业/公司概览 * 涉及的行业主要为**人工智能(AI)与云计算**,核心公司包括**微软、谷歌(Alphabet)、亚马逊(AWS)、Meta**,以及**阿里云、腾讯**等国内厂商[1][2][17][18] * 讨论基于**2026年第一季度**的财报与市场动态,焦点是AI投资逻辑的转变、巨头资本开支(Capex)计划、云与广告业务表现,以及AI经济生态的前瞻指标[1][3] 核心观点与论据 1. AI投资逻辑转变:从担忧ROI到认可商业闭环 * 市场态度在2025Q4与2026Q1间发生根本转变:2025Q4公司上调Capex指引导致股价下跌,而2026Q1继续上调指引却获市场积极反应[3] * 转变核心原因:**AI产品形态从付费率低(约6-7%)的对话机器人转向高付费率的Agent产品**,商业模式从广告变现转向直接订阅付费,推动Token消耗指数级增长,使AI经济生态开始走向正向循环[1][3][4] 2. 头部科技公司资本开支(Capex)大幅上调 * 2026年Capex增速预期从50%进一步上调至**超过70%**[1][4] * **Meta**将2026年Capex中值从1,250亿美元上调至**1,350亿美元**[1][4] * **微软**上调超过**200亿美元**,主要因原材料和物料成本上涨[1][4] * **谷歌**给出2027年将继续显著提升的预期[1][4] 3. 云业务加速增长,验证AI需求景气度 * 三家主要云服务商(AWS、Azure、GCP)合计收入2025年接近3,000亿美元,增速约35%[4] * **谷歌云(GCP)**:2026Q1增速达**63%**,经营利润率提升约2个百分点至**33%**,积压订单金额环比翻倍至**4,600亿美元**,预计未来两年确认,支撑其年化收入迈向1,000-2,000亿美元体量[1][9] * **亚马逊AWS**:2026Q1增速达**28%**,预计全年增速超30%,积压订单金额为**3,600亿美元**(不含Anthropic新合约),若计入则约**4,600亿美元**,预计未来两年兑现[1][10] * **微软Azure**:增速持平,主要因算力优先供给内部模型(如Office Copilot及自研大模型团队),预计2026年下半年重返加速增长通道[1][7][8] 4. 广告业务超预期,提供关键现金流支撑 * 自2025Q2以来,各公司广告业务增速普遍处于上行通道,2026Q1趋势延续[4] * **谷歌搜索业务**增速大幅超过YouTube,反映AI对互联网经济渗透率的提升[4][9] * **Meta广告收入**增长**33%**,超过上季度指引上限[11] * 广告业务强劲表现为公司贡献可观利润和现金流,支撑高额AI投入[4][5] 5. 现金流平衡:压缩股东回报以保障高额Capex * 2026Q1经营现金流同比增长**32%**,但Capex占经营现金流比重从2025H1的约60-70%急剧上升至**87%**[1][5] * 为平衡,公司大幅压缩股东回报(分红和回购)比例,从2025年的近**30%** 压缩至2026Q1的约**10%**[5] * 基于当前现金流模型测算,理论上可为未来Capex提供约**30-40%** 的潜在增长空间[5] 6. 关键前瞻指标:Token价格与算力租赁价格 * 判断AI经济生态健康度的**最核心前置指标是Token价格**,其上涨反映下游付费意愿[6] * **算力租赁价格**是尤为敏感的指标,2026年3-4月该价格出现集中跳升,是下游Agent产品接受度提升的直接信号[1][6] 7. 算力供给瓶颈:电力成为核心制约因素 * 当前约**7,000亿美元**的年度Capex,对应约**15-20吉瓦(GW)** 的电力增量需求[1][17] * 美国每年新增并网发电量约**60-70GW**,但电网区域性错配导致“有网无电”或“有电无网”,**电力成为2026年数据中心并网的核心制约因素**,可能引发区域性、短期性短缺[1][13][17] 8. 各巨头业务具体表现与战略 * **微软**:AI业务年化收入约**370亿美元**(含Azure及Office Copilot),实现翻倍增长;Office Copilot B端付费席位数达约**2,000万**,渗透率从约3%提升至4-5%,新增坐席同比增长**250%**[7][8] * **谷歌**:业务几乎100%受益于AI;GCP积压订单达4,600亿美元;自研TPU单芯片成本约**2万美元**,约为英伟达B系列芯片(约6万美元)的三分之一[9][14] * **亚马逊**:自研Trainium芯片(2、3、4代)售罄;若按独立销售计算,Trainium收入体量可达约**500亿美元**,对外销售年化收入约**200亿美元**,收入承诺已达**2,000亿美元**[10] * **Meta**:市场对其Capex必要性存疑,因其缺乏像云服务的直接变现渠道,主要依赖广告业务;其广告增长部分受益于短视频流量红利及算法提升,广告加载率达**30%**,已属高位[11][15][16] 9. AI市场潜在空间:B端更易测算,C端侧重虚拟经济 * **B端市场**:核心价值在于替代人力,若替代**2-3万亿美元**人力资源(约占白领市场5%),即可覆盖当前约1万亿美元的AI相关Capex投资[11] * **C端市场**:直接付费意愿(如聊天机器人)不高;潜在巨大空间在于**虚拟消费领域(如游戏)**,构建满足精神需求的虚拟世界消费[12] 10. 国内厂商动态与出海优势 * **阿里云**:2026Q1增速接近**40%**,若维持此增速,有望实现2030年1,000亿美元营收目标[2][17] * **国内模型出海**:在Agent场景下凭借更低的Token价格展现优势;价格优势主要源于**研发投入规模差异**带来的成本优势(国内数亿人民币 vs 美国数十亿美元),导致训练过程中的折旧摊销成本显著更低[2][20] * **腾讯**:AI对广告业务有正向贡献,主要体现在成本端(毛利率提升);在游戏业务方面,其在AI游戏领域的全球领先布局构成潜在竞争优势[18] 其他重要内容 * **数据中心存量与增量**:AI投资前,三大云巨头累计数据中心运行容量约**10GW**;2026年约7,000亿美元Capex对应每年约**80GW**的新增并网需求,但受制于电网能力[13] * **算力租赁经济模型**:参考案例,每吉瓦(GW)数据中心约对应**100亿美元**收入,扣除成本后利润率约**15%**,即每GW年利润约**15亿美元**[14] * **诉讼风险**:马斯克与OpenAI的诉讼短期内对行业趋势影响较小;市场更关注OpenAI能否兑现其大量剩余履约义务(RPO)[19] * **Meta增长天花板参考**:可将**苹果广告业务增速**作为行业标杆,2026Q1其增速较2025Q4的15%有一个百分点加速[16]
他养了2420只“龙虾”后说:AI时代,执行力已经不是瓶颈
混沌学园· 2026-05-07 20:00
文章核心观点 - AI正在从底层改变组织的协作方式、业务流程和增长模型,真正的AI Native组织意味着组织运行方式的根本性变革,而不仅仅是使用AI工具提效[17][18][19] - 个人使用AI是加法效应,而组织系统性使用AI能形成指数级增长,关键在于AI Agent之间形成网络(IOA,智能体互联网),使任务、知识和能力得以沉淀、调用和迭代[10][13][14] - 在AI时代,人的价值被重新定位,从“我思故我在”转向“我品鉴,故我在”,人类的独特价值在于其判断力、取舍能力、价值感和方向感(Taste)以及在复杂场景中形成的背景认知(Context)[26][28][29] - 当AI Agent成为新的生产力单元,领导力和组织形态将被重新定义,每个人都需要管理自己的Agent团队,组织能力需要整体上移[38][39][40] - 技术的强大执行能力需要理念型组织来引导方向,AI Native组织解决执行效率问题,而理念型组织确保方向的正确性与价值,两者结合是IOA时代组织增长的新范式[44][45][48] 根据相关目录分别进行总结 AI Native组织的本质与变革 - AI Native组织的核心是组织运行方式的改变,而非简单地采购AI工具或账号[18][19] - 展示了AI Native工作现场的具体案例:例如,有2420只“龙虾”(AI Agent)在线协作,处理从学术科研、投资并购到产品迭代等复杂任务[2] - 传统的线性业务流程(如客户反馈、销售转述、研发排期等)依赖人且存在信息损耗和时间消耗,而AI Native组织通过Agent网络重构了这一流程,例如由专门的需求分析Agent自动调研、同步和流转任务[21][22] IOA(智能体互联网)与组织增长 - 提出了IOA(Internet of Agent,智能体互联网)概念,将其类比为继PC互联网(连接信息)、移动互联网(连接人和场景)之后的新时代,其连接的是具备任务能力、记忆能力和执行能力的AI Agent[14][15] - 组织使用AI的指数级增长源于Agent之间形成的网络,使得单个Agent的产出成为其他Agent的输入,从而将个人能力、团队知识及流程进行放大、沉淀和迭代[13] - 一个名为CoCraft的论文协作工具案例表明,当AI大幅降低执行成本后,企业的关键约束从“执行资源”转变为“是否有值得被执行的好想法”以及“能否让好想法快速落地的组织系统”[33][36][37] 人类在AI时代的价值重定位 - 随着AI在推理、分析、生成、总结、执行等方面能力增强,人类的不可替代性转向“品鉴”(Taste),即判断力、取舍能力、价值感、场景理解和方向感[26][28] - 在复杂场景中形成的Context(背景认知)与Taste是AI难以替代的人类独特价值[29] - AI时代并未消解人的价值,而是对其进行了重新定位,核心问题转变为个人和组织是否拥有独特的Context、清晰的Taste以及让这些价值流动并被Agent快速执行的能力[30][31] 领导力与组织形态的进化 - 提出“AI时代没有传统意义上的IC(独立贡献者)”,组织中的每个人都需要管理自己的Agent团队[39] - 领导力被重新定义:一线员工需学会管理AI(如能管理多少“龙虾”),中层管理者需具备识别善用AI人才的能力,创始人及高管则需营造让使用AI成为常态的组织环境[39] - 当每个人身边都有一组Agent时,企业的评价标准、协作方式、激励方式和组织透明度都可能发生根本性变化[41] 理念型组织与AI执行的结合 - 在AI执行力强大的时代,组织更需要理念的引导,缺乏方向的效率提升可能导致更快地走向错误[45] - 理念型组织需要回答“我们到底相信什么”这一根本问题,其理念和共同的Taste是防止AI放大短期目标和局部最优解的关键[46][47] - AI Native组织与理念型组织的结合,构成了“IOA时代的理念型组织”,前者加速执行,后者确保方向的正确性与价值,是组织增长的新范式[48]
小红书做AI,为何从克制到突然加速?
36氪未来消费· 2026-05-07 17:23
作者 | 肖思佳 编辑 | 乔芊 杨轩 所有互联网大中厂都渴望在AI时代博得位置,在这场比赛中,小红书曾是克制的那个。 在一个搜索属性与社区属性并存,以真实经验分享为核心的产品中,活人感与AI、温情和算法,始终像天平的两端。 很长一段时间里,小红书既没有完全缺席技术探索,也没有像许多同行那样高调推进AI产品化。相反,这家公司始终在两股力量的拉锯和平衡中前行:一 边持续投入模型能力,一边谨慎控制AI对社区生态的介入。 但2026年,随着Agent叙事的升温,小红书开始显露出某种急迫。 4月30日,小红书发送全员内部信,宣布成立AI一级部门Dots,"建立从模型研发、基础设施、工程到产品的完整技术体系,整合顶尖AI人才和资 源。"Dots向小红书新任总裁柯南汇报。 小红书近期高调宣布成立AI一级部门,而在此之前,它的AI探索已有一番曲折。 据36氪了解,Dots部门由原人文智能实验室Hi Lab升级而来,下设模型研发、基础设施、工程、产品四个部门。目前小红书内部最重要的AI应用产品"点 点"也被纳入该体系之下。 将AI置于更高优先级的背后,是小红书长期未解的一道命题。多年来,小红书始终握有业内艳羡的社区资产和广告 ...
晚点独家丨月之暗面将完成 20 亿美元新融资,估值破 200 亿美元
晚点LatePost· 2026-05-06 16:36
融资与估值动态 - Kimi(月之暗面)即将完成新一轮20亿美元融资,投后估值突破200亿美元,本轮由美团龙珠领投(出资超2亿美元),中国移动、CPE等参投 [4] - 2025年1月和2月,公司密集完成3轮融资,分别融得5亿美元、7亿美元和7亿美元 [4] - 算上最新一轮,公司在不到半年内融资总额超过39亿美元,最新估值相比2024年11月的约43亿美元翻了4倍有余 [4] - 公司累计融资额已超过376亿人民币,成为中国大模型创业公司中累计融资最多的公司 [5] 财务与业务表现 - Kimi K2.5模型更新后,公司ARR(年度经常性收入)在2026年3月初突破1亿美元,4月继续增长至超过2亿美元,付费订阅和API调用均在加速 [7] - 根据全球支付平台Stripe数据,自2026年1月底以来,公司近20天收入已超越2025年全年总和 [14] - 公司个人订阅用户1月支付订单数环比增长超过8000%,2月环比再涨超过120% [14] - 根据Similarweb数据,公司海外API开放平台在K2.5发布后,日均访问量暴涨10-20倍 [14] 技术与产品进展 - 公司于2026年4月20日晚发布并开源最新模型K2.6,该模型强化了编程能力和Agent集群能力,可支持最多300个子Agent协作,并开始同步测试Claw群组新功能 [7] - 2025年7月开源的K2模型和后续的K2.5、K2.6持续强化编程和Agent能力,K2模型采用MoE与MLA架构,总参数扩展到1T(万亿参数) [9] - K2.5模型首次引入视觉能力,并开始支持智能体群模式 [9] - 公司在2026年3月提出Attention Residuals(注意力残差)技术,旨在解决传统残差连接的信息稀释等问题,该成果获得了马斯克的公开称赞 [14][15] - 在具体技术成果上,公司在16B的Moonlight模型上验证了Muon优化器,后在1T规模的K2上提出改进版MuonClip,该技术被广泛采用 [13] 战略与方向调整 - 2025年春节后,公司战略更加聚焦,明确“生产力场景优先”,选定编程和Agent作为核心方向 [8][9] - 公司将“持续拿到SOTA(模型最佳表现)”设为最高优先级目标,并大幅减少C端投放,同时从闭源走向开源 [10] - 公司于2025年2月15日推出了云端龙虾Kimi Claw,支持低门槛的一键部署 [12] 行业竞争与格局 - 在Artificial Analysis的综合智能指数中,Kimi K2.6低于OpenAI、Anthropic和Google DeepMind的新模型,但高于Meta的Muse和xAI的Grok [11] - 截至2026年5月6日午间休市,同行业公司MiniMax市值约2100亿人民币,智谱约3470亿人民币 [5] - 目前MiniMax和智谱的市值在2000-4000亿人民币之间波动,相比之下估值约1400亿人民币的Kimi成为一个热门投资标的 [16] - 中国大模型创业公司普遍通过两种方式赚取收入:一是通过API按token用量收费;二是基于自有模型做应用,获取订阅付费用户 [17] 人才与激励 - 2026年初,公司创始人杨植麟在全员信中宣布,2026年公司平均激励将是2025年的200%,并计划大幅上调期权回购额度 [16] - 2026年4月初,公司推出了给实习生发期权的“穿越计划”,由于估值在数月内翻了4倍多且未上市,其期权吸引力增强 [17] - 公司在编程、Agent等领域的优异表现引发了白热化竞争,其相关人员已成为竞争对手的重点挖角对象,面临不小的人才压力 [17]
未知机构:申万宏源电子澜起科技Alpha推理与AgentBetaInte-20260506
未知机构· 2026-05-06 09:35
纪要涉及的行业与公司 * **公司**: 澜起科技 [1][2]、英特尔 [1][2]、AMD [1]、Marvell (MRVL) [2]、英伟达 (NV) [2]、谷歌 [2] * **行业**: 半导体行业、AI芯片(特别是服务器CPU、GPU、ASIC)、数据中心、内存接口芯片(MRDIMM)、互连技术(CXL、NVLink) [1][2] 核心观点与论据 * **AI进入推理与Agent时代,驱动服务器CPU量价齐升** * 服务器CPU自年初至今已涨价20%,渠道供货紧张 [1] * Agent应用对CPU的拉动正在逐步得到验证 [1] * 英特尔预测数据中心内CPU与GPU的配比将从1:4(即8颗GPU配2颗CPU)提升至1:1,而ASIC的需求配比可能更多 [1] * 高端CPU的供需错配预计将持续到2027年 [2] * **英特尔自身基本面改善,构成重要行业贝塔** * 英特尔财报亮眼,毛利率提升,技术路线图明确 [1] * 权威媒体预期部分低良率区间的CPU被抢购,预计此情况全年持续 [1] * 英特尔自建的18A制程良率提升,体现了供应弹性 [1] * 英特尔路线图包括18A及后续的14A制程(2026-2030年)[2] * 英特尔或迎来反转(包括华裔CEO上任1年),路线图清晰 [2] * **澜起科技深度绑定英特尔技术路线,享有增长期权** * **MRDIMM(高价值内存方案)**:英特尔强力推动MRDIMM,并绑定澜起科技(2026-2030年)[2]。该方案采用DDR5+DB缓冲芯片,单条模组包含10颗以上DB芯片,其渗透率可视为澜起科技的弹性期权 [2] * **CXL(开放互连标准)**:英特尔联合Marvell等公司推动开放的CXL联盟,与英伟达的专有NVLink形成竞争 [2]。预计训练场景可能用NVLink,而通用/推理场景可用CXL等多方案并行 [2]。英特尔计划在2026年推出CXL 3.0,2027年推出3.1,2028-2030年推出4.0 [2] * **行业产能紧张,供应向AI芯片倾斜** * 目前半导体产能优先配给AI芯片,供应弹性优先 [1] * AMD在2026年的产能已售罄,目前交期拉长 [1] 其他重要内容 * **市场预期与估值**:结合半导体行业成长股平均PE及可比公司一致预期PE,相关逻辑对应**3000亿市值**的预期 [2] * **潜在催化剂**:CPU的量价弹性、英特尔18A制程良率、MRDIMM渗透率、CXL商用进度均可成为股价催化剂 [2]