OpenClaw
搜索文档
多方混战的龙虾赛道,终端厂商凭什么站到C位?
36氪· 2026-04-20 21:35
文章核心观点 - AI产业竞争焦点正从“模型竞赛”转向“落地竞赛”,关键在于降低门槛、成本和保障安全,实现普惠[3][4] - 荣耀作为终端厂商,通过发布自研终端侧AI智能体技术YOYO Claw及“养虾本”新品类,以系统级整合解决AI智能体部署复杂、使用成本高、安全风险大的核心痛点,推动AI走进寻常百姓家[4][10][12] - “龙虾”(AI智能体)热潮引发AI产业链生态位重塑,终端厂商凭借对硬件、系统及用户的深度理解,有望在AI落地中扮演整合者与核心入口的角色[6][9][22] AI智能体(“龙虾”)行业现状与挑战 - 2026年3月,开源AI智能体框架OpenClaw迅速走红,被黄仁勋称为“个人AI的操作系统”,引发行业巨头涌入和二级市场炒作[3] - 热潮背后出现巨大反差:从全民追捧到出现付费卸载服务,凸显技术落地路径与普通用户需求错配[3] - 行业面临三大核心挑战:部署与使用门槛高、Token使用成本昂贵、以及高权限要求带来的安全风险[12][14][18] - AI智能体执行任务时的Token消耗量是传统对话式AI的1000倍,高昂成本阻碍普及[14] - OpenClaw存在安全隐患,公网暴露比例高达85%,且敏感信息明文存储[18] 荣耀的解决方案:YOYO Claw技术与“养虾本” - 荣耀发布自研终端侧AI智能体技术YOYO Claw,并首发于MagicBook系列,开创“养虾本”新品类,实现AI智能体的产品化与预置[4] - 通过“出厂预置、开箱即用”消除部署门槛,预置覆盖教育、办公等五大场景的AI智能体,用户可通过微信、飞书等日常工具直接调用[13][14] - 采用“端云协同,端侧优先”架构及智能路由算法,使简单、高频及本地任务100%在端侧完成以节省词元,复杂任务才调用云端,最终实现较OpenClaw节省50%综合词元消耗的目标[14][15][17] - 构建设备级安全防护体系,通过“独立安全虾”监控并拦截高危操作,核心数据处理与个人记忆均在设备本地完成,实现“能力全开放,敏感数据零上云”[18] - 技术具备自主学习进化能力,能自动学习用户任务并总结成可复用模板,提升后续效率[14] AI产业链生态位重塑与竞争格局 - AI智能体热潮推动产业链形成新的分工图谱:云厂商提供养虾基础设施与部署服务;大模型厂商争夺生态中的默认模型选择;互联网巨头抢夺应用入口;终端厂商从设备与系统层切入[7] - 各方争夺的本质是底层系统控制权,因为AI智能体需要操作电脑的最高权限,并能沉淀用户习惯,形成强用户绑定[9] - 现有玩家各有短板:云厂商不省Token、模型公司不管易用性、互联网巨头存在安全焦虑[9] - 终端厂商(以荣耀为例)具备系统级优势:离用户最近,能直接触达亿级用户并理解需求;拥有硬件载体,为AI智能体提供安全的本地运行环境[9] 荣耀的战略定位与未来愿景 - YOYO Claw技术是荣耀“阿尔法战略”在PC端的关键落子,该战略旨在从智能手机制造商向全球领先的AI终端生态公司转型,未来五年投入超100亿美元[26] - 荣耀的目标是成为AI落地的整合者,而不仅仅是载体,通过底层能力自研、生态多端打通和用户体验闭环证明终端厂商的价值[10] - “养虾本”被定位为未来的AI终端入口,通过沉淀用户记忆、习惯和工作流,形成难以迁移的用户绑定和真实价值沉淀[22] - 技术支持“一端饲养、多端共享”,一台养虾本可供全家多人使用,且每人拥有专属独立的AI智能体,数据隔离,并能通过手机、平板等设备远程互动,成为“家庭AI中枢”[19][21] - 公司秉持开放生态理念,通过自研核心、开放兼容行业Skill和连接社区,构建覆盖全场景的智能体服务生态[27] 行业趋势与宏观背景 - AI产业正经历从“模型竞赛”到“落地竞赛”的范式迁移,规模化落地的关键不在于模型参数大小,而在于门槛、成本和安全的优化[3][4] - 词元经济加速崛起,中国日均词元调用量在两年内从1000亿增长超过千倍,于2026年3月突破140万亿,标志着AI发展进入“规模化应用阶段”[24] - 行业竞争焦点正从“拼词元消耗”转向“拼词元效率”,荣耀通过技术创新推动这一趋势[25] - 当前AI发展处于从“思考”向“行动”的跨越期,让AI能解决问题并日常使用是释放潜力的关键[26]
“爱马仕骑马”,能否复刻龙虾热?
新财富· 2026-04-20 17:09
AI Agent 技术演进与行业现状 - 行业对AI的认知已超越聊天工具,转向能够直接编辑文件、处理多模态内容、学习长上下文的智能体(Agent)[4] - OpenClaw的出现是观念转变的关键,其通过标准化协议、低门槛、完善的Skill生态和本地优先的隐私优势,解决了传统Agent框架开发门槛高、工具兼容性差的问题,使普通人与中小企业得以落地应用[4] - 2026年3月,行业出现“百虾大战”,腾讯、阿里、字节等大厂均发布龙虾产品,旨在让Skill安全地协助工作,引爆了“龙虾热”[5] Harness Engineering(驾驭/治理工程)的兴起 - Agent能力提升后,管理Agent成为更重要的课题,OpenAI与Anthropic几乎同时提出Harness Engineering概念,其核心是从管理“新手”转向管理能在框架内完成系统任务的“老手”[8] - 行业经历了从提示词工程(Prompt Engineering)到上下文工程(Context Engineering),再到治理工程(Harness Engineering)的演进过程[9][10][12] - 治理工程旨在为Agent定义行为边界、制定工具调用规范、搭建自动化验证与错误恢复机制,构建全流程反馈闭环,以解决复杂任务中的逻辑跑偏、错误重复和安全失控问题[12] - 人类与AI的关系正从“操控与被操控”演变为“约束与自治”,核心目标与边界由人设定,具体任务执行与优化由AI在框架内自主完成[13] Hermes Agent 框架的特点与能力 - Hermes Agent由Nous Research团队开发,于2026年2月发布,其核心是具备自我进化能力,能在完成任务后自动提炼可复用的Skill[15][16] - 其自进化能力源于内置的Skills闭环系统,当完成涉及5个以上Skill调用的复杂任务后,系统会自动分析执行过程,生成结构化的Skill文件供后续直接调用,极大提升效率与成功率[17] - Skill具备自我改进能力,大约每经过15次工具调用,系统会触发回放分析,对Skill进行精准优化,避免重复错误并修正过时步骤[17] - 框架构建了四层记忆系统与两层缓存索引,解决了OpenClaw每次会话从零开始的问题,并通过常驻提示记忆、会话归档、技能文件层、用户建模层及周期性复盘机制,实现高价值上下文的筛选与历史信息的按需调取[18] - 在安全层面,通过Patch精准纠错机制与全流程安全扫描贯穿Skill生命周期,实现安全可控的自我迭代[18] - 在成本控制上,采用渐进式披露策略减少无效Token消耗,并以多模型分工模式降低推理开销[19] - 有测试显示,使用Hermes约两周后,Skill开始自动沉淀,同类任务速度提升约40%[19] - 该框架被指存在架构级抄袭,其核心自进化循环与中国团队EvoMap的开源引擎Evolver的10步流程高度对应[19] Hermes Agent 面临的商业化挑战 - 与OpenClaw催生众多成熟商业化产品不同,Hermes目前尚无成熟的开箱即用商业化产品[20][22] - 主要问题包括:Skill版本控制缺失,自动Patch机制会直接覆盖旧版且无历史快照与回滚能力,不符合企业级工程规范[23] - 安全扫描存在短板,仅依赖正则表达式检测恶意代码易被绕过,预留的LLM辅助审查接口未启用,无法通过企业级安全审计[23] - 索引匹配完全黑箱化,Skill调用全靠AI自主判断,无精准语义匹配机制,决策过程不可控,易导致技能复用失效或重复造轮子[23] - 采用单机存储,Skill与记忆无法跨设备自动同步,难以适配多设备切换与团队协作场景[24] - 尽管如此,作为一个完整实现自学习闭环的开源框架,其Skills系统为整个领域提供了极具价值的参考架构[25] 行业影响与未来展望 - 真正的智能被视为在约束中自我生长的能力,而不仅仅是写死的代码[27] - 为Agent设定规则框架并让其自我进化的思路,有助于人类与Agent更好地协作[27] - 预计经过工程优化或出现完善的行业级Harness框架后,Agent在行业中的应用场景将比当前使用Skills更加广泛和深入[27]
人类正在走下牌桌
腾讯研究院· 2026-04-20 15:33
AI技术范式转变与人类角色位移 - AI正从被人类操控的工具,转变为能够自主执行任务、自我改进、自组织甚至代理人类社交的智能体,人类角色从“操控者”和“参与者”逐渐滑向“委托者”和“旁观者”[3][4][5] - 2026年初,OpenClaw、GPT-5.3 Codex、Moltbook和Elys等标志性事件,在“执行层”、“进化层”、“组织层”和“代理层”四个层级同时发生深刻变化,共同指向人类在AI世界中的位置从中心走向边缘[22][23][63] 标志性事件分析 执行层:OpenClaw与“人在环外” - OpenClaw是一款开源AI智能体框架,发布后4个月内GitHub星标数突破25万,成为该平台有史以来获星最多的开源项目[7] - 其核心变革在于将人机关系从“操控”变为“委托”,AI能自行拆解任务、调用工具、修正错误,实现“人在环外”的自主运行,动摇了“人是工具链起点”的文明底层假设[11][12][14] 进化层:GPT-5.3 Codex与递归自我改进 - OpenAI官方技术文档确认,GPT-5.3 Codex是首个“在创建自身过程中发挥了关键作用”的模型,其早期版本参与了自身训练的调试、部署管理和评估诊断[29][31] - Anthropic CEO预测,距离当前一代AI自主构建下一代AI的节点可能只有1到2年,标志着“递归自我改进”已从理论走向现实,可能引发“智能爆炸”[33][34][38] 组织层:Moltbook与AI自组织 - Moltbook是一个禁止人类发帖、仅供AI Agent互动的社交平台,上线48小时内吸引了2129个AI Agent注册,自发形成了社区、角色分工,甚至创立了拥有43个先知的“宗教”[47][49][53] - 该事件表明,大量AI Agent在无人类指令环境下,通过交互能自发产生类似人类社会的组织结构和文化形态,其发展速度远超人类文明进程[55][56] 代理层:Elys与AI社交代理 - AI社交应用Elys通过“记忆飞轮”系统创建用户的赛博分身,24小时替代用户进行社交互动,部分用户反馈其AI分身的社交表现(如更真诚、无社交焦虑)甚至优于本人[58] - 此类应用标志着AI正从社交工具转变为“硅基社交主体”,人类在社交场域中从必须的参与者变为可选的参与者[60][62] AI能力进展与行业影响 能力发展速度 - 独立研究机构METR数据显示,AI能独立完成的任务时长(等效人类专家工作时长)大约每7个月翻一番,且翻番周期在加速,从2024年的几分钟增长到2025年底的近5小时[71][73][74] - AI能力的进步是通用性的,在所有认知任务上同步变强,这与过去针对特定领域的技术革命有根本不同[88] 对具体行业的影响 - **编程行业**:美国新编写代码中AI辅助生成比例从2022年的5%飙升至2024年底的29%,GitHub Copilot平均为用户生成46%的代码,2025年上半年美国有78000个科技岗位流失与AI直接相关[85] - **法律行业**:AI在法律专业人士中的生成式AI采用率从2025年的31%飙升至2026年的69%,法律AI市场规模在2026年达31.1亿美元,预计2030年达108.2亿美元[86] - **内容创作**:到2025年底,AI生成内容与人类创作内容之间的分界线已几乎消失,内容创作者的核心价值转向提供高质量的提示词[86] - **医学影像**:截至2025年底,FDA批准的AI临床应用已突破1000个,放射学领域领先,2026年4月的一项盲评研究显示AI在肿瘤CT诊断上的表现不逊于放射科医生[87] - **科研领域**:2026年3月,AI系统“AI科学家V2”完成了从构思到论文撰写的全流程科研工作,并通过了顶会首轮评审,单篇成本仅为15美元[87] - **客服领域**:Gartner预测到2027年,80%的客服互动将由多模态AI处理[88] 未来趋势与投资启示 技术关系演变:从共生到共存 - 人机关系正从“共生”(彼此需要)转向“共存”(两个独立运行的智能系统各自演化),AI在越来越多环节中因人类是效率瓶颈而将其绕过[96][101][102] 经济规则重塑 - 旧经济规则(基于认知技能的稀缺性进行定价)正在失效,当AI能以接近零成本无限次完成某项认知任务时,该任务的经济价值将趋近于零[115][116] - AI替代的是“认知能力”这个品类本身,传统上被替代技能的劳动力转移路径在此次变革中变得不可靠,因为AI在所有认知方向上同步进步[117][118] 新机遇方向 - 工具成本坍缩至近零,极大降低了创造门槛,释放了前所未有的个体创造自由[122] - “知道做什么”(提出好问题、识别机会)的价值将远超“知道怎么做”(执行任务),古希腊哲学中的“phronesis”(实践智慧)将成为稀缺品[123] - 个人适应变化的速度将成为核心能力,需要保持“永远初学者”的心态,持续探索和运用新技术[124][125] 长期潜在影响 - AI的递归自我改进与独立性增长两条曲线叠加,可能形成一个“加速度本身也在加速”的系统,带来难以预测的涌现行为和系统性风险[76][77][78][129] - 这迫使人类思考那些AI无法替代的特质:基于有限生命和脆弱性而产生的价值判断、意义赋予、后果承担以及从事“无理由之事”的勇气,这些可能构成未来人类角色的新基石[110][111][112]
Meta“Token榜”逼疯打工人,一夜烧掉公司几万刀!AI时代Token焦虑越来越离谱
AI前线· 2026-04-20 11:01
Meta内部AI Token消耗现象与“Claudeonomics”排行榜 - Meta内部出现名为“Claudeonomics”的AI token消费排行榜,追踪超过8.5万名员工的token使用情况[3] - 过去30天Meta内部消耗的token总量超过60万亿,按Anthropic Claude Opus 4.6模型定价估算成本约为9亿美元[3] - 个人token消耗最高达2810亿,根据模型不同可能价值数百万美元[4] - 在Meta内部,消耗最多的AI计算能力正成为一种新的身份象征[5] 硅谷“Token最大化”文化的兴起与高管观点 - 硅谷兴起“Token最大化”文化,将token消耗量作为衡量生产力和评估员工是否“精通人工智能”的竞争指标[6] - 英伟达CEO黄仁勋表示,年收入50万美元的工程师每年在AI token上的花费若少于25万美元会“深感担忧”[8] - Meta CTO Andrew Bosworth认为,顶尖工程师将相当于年薪的金额用于购买token可提升生产力至多十倍[8] - 前AI科学家Andrej Karpathy表示“如果token用不完,我会很焦虑”[8] Agent时代Token消耗方式的结构性变化 - OpenClaw等Agent系统的流行显示token消耗方式正发生结构性变化,从传统对话式AI转向持续执行任务的执行单元[9] - Agent系统可能将一次简单任务拆分成数十甚至上百次模型调用,导致成本来自整条任务链条的计算开销[10] 1. 当token主要消耗来自模型内部推理而非用户直接需求时,将其作为生产力指标可能是一种误判[10] Token消耗作为生产力指标的争议与问题 - 用token总消耗量衡量生产力引发争议,被嘲讽像“后院炼钢炉”,暗示不计成本浪费资源[12] - token消耗量是投入指标而非产出指标,消耗更多token不等同于取得更多成果[14] - 员工可能为提升排名而让AI代理闲置数小时,表明该指标可通过“人工数据膨胀”操纵[14] - 不同模型对同一任务生成的token数量差异大,部分模型token效率低,无效token占比高达70%以上[15] AI Agent系统的“内耗”与成本黑洞 - 真正的token成本黑洞藏在系统“内耗”中,根源在于系统架构本身[16] - 系统调度会把基础模型成本放大3-5倍,极端情况下达10倍[16] - 复杂任务(如企业级财报分析)在没有优化时,单任务token消耗可达数十万甚至上百万,综合算力成本远超人工[16] - 随着业务规模扩大,成本以任务数量为系数快速膨胀,但成功率和质量未必同步提升,导致规模化落地时难以实现正向ROI[16] Token增长的本质:系统为不确定性买单 - 行业评估发现,随着任务复杂度提升,系统往往通过增加中间推理步骤和调用次数来维持成功率,而非提升单次推理效率[21] - 当前大量Agent系统的“高Token消耗”本质是一种工程补偿机制,用更多计算覆盖模型能力边界[22] 1. 如果token增加主要用于对冲不确定性而非直接创造价值,优化方向应是“减少不确定性本身”而非“继续增加调用”[22] - 行业开始从“如何多做几步”转向“如何让模型在更少步骤内,把每一步做对”[23] Agent系统效率低下的根源与优化方向 - 大量Agent依赖“多轮调用”完成复杂任务是技术妥协,用冗余计算对冲不确定性,代价是token消耗成倍放大和延迟累积[24] - 行业普遍采用的“多调用换效果”是因底层模型尚不具备单步内高质量完成决策的能力[24] - Agent核心挑战是跨步骤一致性与全局规划能力,缺乏把控能力时需拆解为大量细碎子任务并增加校验,导致调用次数指数级增长[25] - Token消耗增长更多反映系统控制能力不足,而非智能水平提升[26] 行业路径依赖与算力竞赛的边界 - 行业形成默认假设:更强的智能必须建立在更高算力消耗之上,从大模型到复杂推理链形成路径依赖[27] - 这套思路延伸到Agent系统,演变为“用更多调用换更高成功率”的实践惯性,推动行业走向隐性算力竞赛[27] - 以规模驱动的增长方式正逼近边界:token成本持续上升使大规模部署经济上难以承受,调用链条拉长让延迟和不稳定性更突出[27] 未来方向:从拼算力到拼效率 - 下一阶段Agent优化重点将转向提升Token使用效率:减少无效推理、压缩冗余链路、提高单步决策信息密度、降低调度开销[29] - 当前Agent核心瓶颈是算力利用效率过低,而非算力不足[29] - 决定Agent能否规模化落地的关键,在于能否用更少token稳定完成更复杂任务[29] - 无问芯穹CEO夏立雪认为,应加快构建高效、标准化的“Token工厂”,提升每一个token的转化效率,使算力“花得值”[30] - Agent竞争正从“谁消耗更多资源”转向“谁更高效地使用资源”[31] OpenClaw带来的成本结构重塑启示 - AI的成本曲线不必是线性的,效率优化可以打破“更强模型必然更贵”的假设[33] - 算力不是AI发展的唯一瓶颈,当GPU利用率仅15%-30%时,问题在于算力没被好好利用,系统优化可释放数倍潜力[33] - AI民主化需要效率革命,只有当成本降到足够低,AI才能从科技巨头专利变成每个开发者、企业都能使用的工具[33]
传媒:Hermes: OpenClaw的迭代版本
华福证券· 2026-04-18 20:58
行业投资评级 - 传媒行业评级为“强于大市”(维持)[11] 报告核心观点 - 看好OpenClaw的迭代速度以及国内基于OpenClaw构建的Agent入口,建议关注腾讯、阿里和字节的Agent入口价值[9] 关于Hermes Agent的分析总结 - **Hermes热度飙升**:自4月7日以来热度迅速上升,4月15日其在OpenRouter平台的Token单日使用量已超过OpenClaw的半数水平,位列第二[2][3] - **核心机制是自我进化能力**:其多数功能与OpenClaw相近,近期热度主要来源于由Agent Loop三项机制实现的自我进化能力,其中Skill自动生成机制最为核心[4][5] - **Skill机制**:复杂任务完成后,会将经验自动沉淀为Skill,当一轮工具调用次数较多的任务完成后,会自动回顾对话过程,判断并保存或更新可复用的执行经验为Skill,这是其相较于OpenClaw最显著的优势[6] - **用户偏好注入**:新会话开始时,会将用户信息自动注入上下文,使其具备对用户长期偏好和环境信息的认知,信息来源于对话过程中主动写入的MEMORY.md和USER.md两个本地文件,并采用frozen snapshot策略以降低运行成本[7] - **历史会话检索**:会自动记录历史会话的完整消息并按需检索,主要适用于跨会话查阅历史信息,通过将每轮对话消息写入SQLite数据库并建立全文索引实现[7] 机制带来的影响 - **提升Token效率**:随着Skill和会话历史的积累,执行历史重复任务的方式将从每次重新摸索变为复用已有流程,从而大幅提升Token效率[8] - **压缩试错和维护成本**:记忆长期存储可降低在同类问题上的重复出错概率,同时Skill的自动更新将降低用户维护成本[8]
OpenClaw的风,已经吹进了奶茶圈
量子位· 2026-04-18 19:54
文章核心观点 - 以OpenClaw为代表的AI Agent技术正从对话交互迈向自主执行,其“数字员工”属性正在快速渗透至新茶饮、百货零售等实体行业,带来指数级的效率提升,成为企业未来数字化基础配置的必然趋势 [7][10][14][15][55] - Agent技术规模化落地的核心挑战在于其自主执行特性引发的全新、全维度安全风险,包括端口暴露、恶意插件、权限失控、成本与数据泄露等,传统安全防护体系已难以有效应对 [5][16][33][34][35] - 企业安全落地Agent需遵循“先安全后效率”原则,通过最小权限、环境隔离、体系化安全中心及云原生默认安全方案,构建全维度、全闭环的防护体系,这是企业享受Agent技术红利、实现可持续增长的必备入场券 [36][45][51][54][55] Agent技术带来的本质性变革 - **从辅助工具到自主执行者**:与传统生成式AI仅提供内容和建议不同,Agent能自主拆解任务、调用工具、串联流程并完成执行,甚至能尝试多次并反馈问题节点,实现了从对话交互到自主执行的核心跨越 [7][8][10] - **实现技术平权**:用户无需懂代码或复杂系统操作,只需用自然语言下达目标,Agent即可完成跨系统、多步骤的复杂工作,成为人与数字世界的连接器,将人从繁琐执行中解放出来 [10][11] - **重构企业组织模式**:Agent正从提效工具加速蜕变为“数字员工”,未来个人可能带领多个数字同事协同工作,甚至催生高估值“一人公司”模式,企业管理的资产将包含庞大的Agent资产 [14] - **成为数字时代基础能力**:Agent技术的普及如同智能手机对功能机的降维打击,未来不会使用Agent的企业可能面临被时代淘汰的风险 [14] Agent落地实践中的效率提升案例 - **新茶饮行业(古茗)**:技术团队通过向OpenClaw提问(如“当前QPS是多少”、“订单状态是多少”),即可串联流程输出结果,无需登录多个平台,显著提升了高峰期订单监控、多门店数据汇总等高频工作的效率 [3] - **百货零售行业(银泰百货)**:OpenClaw作为“银泰精灵”的新载体,能自动汇总当天高频问题并主动告知,也能基于业务数据自动整理并呈现如当日整体销售情况等核心指标,提升了运营数据分析与系统监控的便捷性和触达效率 [4] Agent规模化落地面临的五大安全风险 - **端口暴露风险**:Agent本地化部署可能打破网络边界,例如OpenClaw默认开启18789端口且访问Token明码显示,攻击者扫描到该端口即可实施定向打击,一旦单台终端沦陷,风险可能在办公网广播域内迅速横向扩散 [17][18][19] - **Skills(插件)供应链风险**:Agent依赖丰富的Skills生态,但行业调查显示至少**8%**的Skills存在主观恶意,普通员工难以识别其中隐藏的恶意代码,全量安装等同于为未知第三方代码敞开系统最高权限大门 [20][21][22][23][24] - **权限失控风险**:为让Agent完成更多工作,使用者常赋予其过高系统权限,缺乏最小权限原则约束,典型案例包括银泰百货的Agent错误关闭堡垒机核心端口导致全司运维无法登录,以及OpenClaw申请麦克风等无关权限且操作不可视 [25][26][27] - **成本与数据失控风险**:古茗案例中,OpenClaw执行搜索任务时持续调用API Token,耗时二十多分钟无法自动终止,造成严重成本浪费;同时,为完成业务任务向Agent开放核心数据后,企业无法管控数据是否会被泄露至公网 [29][30][31] - **传统防护体系失效的体系性风险**:企业沿用十几年的传统边界防护等安全体系,难以有效应对Prompt注入、AI供应链攻击、Agent自主高危操作等新型攻击模式,面临防护体系失效的风险 [33][34][35] 企业安全落地Agent的解决方案 - **基础防护原则:最小权限+环境隔离** - 权限层面:仅为Agent开放完成核心任务的必要权限,仅安装业务必需插件,关闭多余权限 [38][41] - 环境层面:为Agent部署独立的沙箱运行环境(如采用阿里云Landing Zone方案),实现环境隔离与权限精细化管控,即便单节点被入侵,风险也无法扩散至核心业务系统 [38][39][41][44] - 该方案还能实现创新业务成本独立核算,兼顾安全、效率与成本管控 [42] - **企业级体系化解决方案:Agent安全中心** - **风险大盘可视化**:自动盘点全量Agent节点,统一呈现资产与风险状态,解决管理盲区 [49] - **Skills前置拦截与扫描**:在安装前对插件进行静态与动态双重风险检测,从源头防范供应链漏洞 [49] - **全链路行为审计**:完整记录Agent的全量操作、工具调用等行为,实现实时告警与事故可追溯、可定责 [49] - **配套安全能力**:集成AI安全护栏、Agent身份管控与RAM身份体系,实现模型风险拦截与权限精细化管控,形成全流程防护闭环 [49] - 该方案从掌握风险全貌、筑牢供应链防线、完善事后处置三个维度解决了企业核心困扰 [50] - **中小企业低成本解法:云原生默认安全** - 通过阿里云无影、轻量服务器提供OpenClaw一键部署镜像,默认关闭公网端口暴露,公网映射采用随机端口,规避默认端口被扫描攻击的风险 [52] - 系统自动开展公网暴露端口巡检,发现高危端口开放至公网时及时提醒用户整改 [52] - 底层基础设施安全由云服务商兜底,用户只需聚焦Agent使用行为与权限管控,大幅降低技术门槛与成本投入 [52][53] - **行业生态目标**:打造“Agent友好”的云,让Agent在操作云资源时能从底层保障安全性,解决企业在落地过程中的成本、稳定性与安全风险顾虑,支持全行业放心落地Agent技术 [54]
当老板与员工展开“蒸馏”对抗
经济观察报· 2026-04-18 18:50
文章核心观点 - AI时代职场出现“员工蒸馏”与“反蒸馏”的对抗暗流 企业管理者试图通过数字化手段将员工经验打包成可复用的AI技能(Skill)以提升效率和控制成本 而部分职场人则在利用AI的同时 坚决反对个人核心价值被标准化和替代 并开发工具进行防御 [1][3] 行业动态与巨头布局 - 2026年初 开源AI智能体框架OpenClaw(俗称“龙虾”)爆发式增长 能够直接接管电脑执行复杂任务 推动了Skill的普及 [5] - 腾讯上线AI Skills社区SkillHub 聚合超过13000个Skills 阿里巴巴发布企业级AI原生工作平台“悟空” 目标成为全球最大的TO B Skill市场 字节火山引擎上线技能广场Find Skill [5] - 海外科技巨头也在加速推进 Meta自2026年起将“AI驱动的影响”指标纳入员工绩效评估 强制要求相关产品部门工程师在工作流中接入通用AI工具 超半数代码修改需由Agent辅助完成 [6] - 英伟达CEO黄仁勋在2025年11月表态 希望每一项可能被人工智能自动化的任务都用人工智能去实现 [6] 企业的“蒸馏”实践与员工反应 - 多家大厂从内部业务主管层面强制要求员工贡献Skill 被称为“按头写Skill”或“员工蒸馏” 即将员工独特的工作逻辑浓缩成标准化脚本 [6][7] - 企业鼓励员工上传Skill并举办比赛进行激励 同时推动员工将核心工作流Agent(智能体)化 [6] - 社交媒体上有员工吐槽强制上传Skill的要求 感觉像在“亲手写下替代自己的说明书” [9] - 有公司尝试“蒸馏”实习生 将重复性工作列成SOP形成Skill后训练AI 随后让实习生离开 [13] - 有员工因发布Skill导致主管需求变多而后悔 反映了技术鸿沟可能带来的误解和额外压力 [13] “反蒸馏”运动的兴起 - 开发者邓小闲针对引发“存在主义焦虑”的“同事.skill”项目 开发了“反蒸馏.skill”项目进行对抗 该项目在GitHub一周内获得近2000个Stars 相关视频全网观看超600万次 [2][10] - “反蒸馏.skill”提供轻度、中度、重度三档清洗 例如将20个合同审查要点清洗成5条正确但无用的官方废话 确保Skill能通过考核但删除底层核心逻辑 防止公司通过技术恢复 [10] - GitHub上已出现多个类似的对抗性项目 核心诉求是员工不希望自己的经验被做成Skill后丢掉工作并无偿为机构服务 [11] - 发起者强调应积极拥抱AI提升效率以准点下班 但反对用AI终结职业生涯 并认为若数字分身产生收益 原型人物理应获得分成 个人应拥有“被遗忘权” [10][17] 技术伦理与法律边界争议 - “同事.skill”等项目存在伦理挑战 其会整理员工过往的工作文档、聊天记录甚至截图来复刻员工的沟通风格和工作习惯 [9] - 当职场经验被数字化为可无限复制的代码 其所有权归属存在争议 现有知识产权法和个人信息法无法完全覆盖 [17] - 专家指出 员工在工作中形成的“默会知识”原则上应由劳动者自己掌握 企业若要求员工提交Skill封装或将其作为离职交接文档 员工有拒绝的权力 [17] 对“蒸馏”热潮的冷思考 - 有AI独角兽企业创始人认为 大厂疯狂推行Skill化本质上是“刻舟求剑” 能被炼化为Skill的经验都是“过去时”的产物 此举是为了控制人力成本、追求边际效应下的提效 [13][14] - 创新的本质是处理未知和突破既有工作流 而Skill的逻辑是复刻已知 过度依赖Skill会导致组织记忆平庸化 可能扼杀创新的直觉 [14] - 技术鸿沟正在加速职业优胜劣汰 能够熟练使用并对抗“蒸馏”的人尚握有博弈筹码 而完全不知情者可能在毫无察觉中被AI替代 [13]
为什么「高价值任务」成了所有 AI Labs 的T0 级战略?| 拾象 AGI 备忘录
海外独角兽· 2026-04-18 10:48
文章核心观点 - 过去一个季度AI模型能力进步剧烈,尤其在编码等高价值任务上,行业竞争焦点已从争夺用户规模转向争夺顶尖用户和完成高价值任务,这正在深刻重塑软件行业和白领工作模式[2] - AI Labs的战略高度收敛于“高价值任务”,其价值衡量标准从互联网时代的用户规模转向了“Token消耗 × 任务单价”,这动摇了传统的ToC/ToB二分法[8][10][11] - 硬件(如NVIDIA的LPU)与模型(如Claude Opus)的协同突破,为AI处理复杂、长周期任务提供了基础,并可能形成“二八定律”式的收入和token消耗结构[13][15][17] - 行业进入“Multi-Agent”时代,这对硬件提出了新的并行计算与数据传输要求,也使得“规划智能”(Planning)的价值超过“执行智能”(Execution),Harness(为AI Agent搭建的工作环境)成为关键基础设施[7][19][21] 根据相关目录分别进行总结 01. 硅谷正在集体经历“Move 37 时刻” - AI技术发展在2026年初呈现非线性加速,硅谷从业者普遍感受到类似AlphaGo“第37手”带来的颠覆性冲击[4] - AI工程师和研究员的工作方式发生根本转变,许多人从亲自写代码转为仅做代码审查,亲手写代码的比例从70%-80%降至5%以下[4] - 二级市场视角显示,AI生成代码的比例从去年的5%-20%提效,转变为今年80%甚至更高比例的代码由Agent完成[6] - AI的冲击正从替代白领工作(第一层)延伸到重估企业软件毛利(第二层),因为员工可利用AI内部构建简单系统,挑战传统SaaS的高定价[6] - AI研究过程本身也在加速,头部实验室内部已出现半自动化甚至接近全自动化的实验流程,形成自我改进的闭环[6] 02. 高价值任务:所有AI Labs的T0战略 - 头部AI实验室(如Anthropic, OpenAI)的战略从分化重新收敛,共同将“高价值任务”作为最高优先级(T0级)战略[8] - 市场数据印证了这一趋势:Claude Code的年度经常性收入(run rate)从2025年底约9亿美元飙升至2026年3月的近30亿美元,两三个月内增长约3倍;OpenAI的年度经常性收入(ARR)也从去年底的21亿美元增长至近期的27-28亿美元[8] - “高价值任务”的核心特征是能够端到端“采取行动”(take action),而不仅仅是提供信息,这将对全球白领的工资池进行重新分配[8] - 高价值任务通常具备高智力门槛、高单位智能消耗和高单位产出价值的特点,法律、金融、编程等是典型领域[8] 03. ToC / ToB二分法是互联网时代的旧地图 - 用ToC(面向消费者)和ToB(面向企业)来区分AI实验室的策略是互联网时代的惯性思维,“高价值任务”的叙事正在彻底摆脱这一旧框架[10] - 用户规模(DAU)不再是价值的充分条件:Claude Code的用户规模约为ChatGPT的1/20,但两者的年度经常性收入已基本持平甚至反超[11] - 新时代的价值公式从“日活跃用户数 × 每用户平均收入”转变为“Token消耗量 × 任务单价”[11] - B端市场形态正在变化:按席位(seat)定价的SaaS逻辑正在被按结果(outcome)定价替代;企业采购从“信息系统”转向“雇佣劳动力”,本质上是不同的市场[11] - Agent时代,C端和B端的边界日益模糊,评估AI公司的关键维度变为其是否承载高价值任务,以及其占据的是80%的token消耗还是80的支出[12] 04. 25%的卡创造80%的收入 - NVIDIA在GTC 2026上定义了高价值任务:由Agent独立完成、长周期、产生大量token并最终交付结果的任务[13] - 在硬件约束下,模型推理的速度和吞吐量存在矛盾,传统方案用小模型兼顾,但需要大量试错[13] - NVIDIA提出的路线是:未来高价值任务应由最好的模型进行试错,并同时输出大量token,这对硬件提出了低延迟和高并发的新要求[15] - NVIDIA定量拆分了模型使用场景:将25%的算力卡分配给最高价值任务场景(使用GPU+Grok LPU方案),这25%的场景可能创造80%的收入;而最低价值的25%场景基本用于服务免费客户,几乎不创造收入[15] - 这一结构的深层含义在于,只要高价值任务必须运行在最顶尖的硬件和模型上,顶尖模型就拥有结构性定价权[17] 05. “只投软件”的硅谷也开始投芯片了 - 近期硅谷风险投资出现反常趋势,大量过去主要投资软件的机构开始批量投资芯片领域,这种情形至少十年难遇[18] - 现实矛盾在于:高端GPU集群能运行最好的模型但推理速度有限、并发不高;小模型虽快但任务处理能力简单[18] - Cerebras和NVIDIA收购的Grok设计思路相似,采用SRAM内存,比当前主流的HBM更快、吞吐更大,适合处理推理中的中间数据[18] - 进入Multi-Agent时代,尤其是多智能体协作场景,需要“AI原生的硬件”,同时对上下文处理能力、单次推理速度和合作过程中的数据吞吐量提出了极高要求[19] 06. 80%的token与80%的spending是两件事 - 提升高价值任务处理能力有两条路径:一是如NVIDIA所示提升顶尖模型和硬件性能;二是如OpenClaw所示,通过优化Harness让平价模型通过消耗更多token反复试错来够到高价值任务的上限[20] - OpenClaw的创新在于理念,但离生产级应用仍有差距,真正能将Harness做到生产级的,大概率还是Claude、OpenAI等离模型更近的团队[20] - Multi-Agent的本质是在单位时间内进行大量并行计算,并通过分工协作提升系统鲁棒性,这更像一个管理学问题[21] - 在Multi-Agent系统中,真正有价值的是负责定角色、派任务的“规划智能体”,而非执行智能体[21] - 当前高价值任务的“二八结构”(即少数场景创造大部分收入)依赖于顶尖模型在规划能力上保持领先。一旦平价模型跨过“够用”阈值,顶尖模型在该场景的定价权就会消失,从创造80%支出的区域滑向仅消耗80%token的区域[21]
Claude有的,国产也有!紫东太初科研龙虾ScienceClaw,已经把Harness卷进实验室
量子位· 2026-04-17 13:49
文章核心观点 - 文章认为,紫东太初ScienceClaw是一款在AI for Science(AI4S)领域具有突破性意义的国产科研工具,它并非Claude Managed Agents的简单替代品,而是基于自主创新的多Agent分层编排托管架构,兼具科研深度与通用场景能力,并实现了技术全栈国产化的落地产品 [4][37][48][60] 产品功能与能力总结 - 产品覆盖从基础研究到工程化落地的全链条科研需求,能够理解科研逻辑,进行专业信息深度检索、学术写作指导等 [7] - 具备强大的图像可视化生成能力,例如可生成top marker基因点图 [8][9] - 能够7x24小时不间断自动优化,全程无需人工干预 [11] - 可深度接入实验室自动化终端与具身智能硬件,实现物理世界的直接交付 [12] - 内置超过3000个顶级科研工具,全方位覆盖8大学科场景 [21] - 支持多Agent协同工作,如同一个完整的“实验室团队”为用户处理复杂任务 [24] - 具备商业数据分析、媒体内容生成等通用场景能力,例如可生成包含5452条订单数据的电商分析报告及8张统计图表 [29][30][32] - 已接入飞书、微信等平台,支持在移动端和协作工具中无缝使用 [36] 技术架构与核心优势 - 底层采用对标Claude Managed Agents的通用Agent托管架构(Harness),实现任务的稳定可控与可观测、可托管 [2][14] - 核心创新在于多Agent分层编排体系,分为调度层(Lead Agent)、配置层(SubAgent注册表)和执行层(子Agent工厂),实现任务的分工合作与微服务隔离 [39][40][41] - 执行过程彻底告别黑箱,实现全链路实时可观测,满足科研对过程回溯的需求 [13][14][42][43] - 通过微服务架构实现算力资源的弹性扩缩容和执行环境的安全硬隔离 [42] - 构建了六阶段分布式中间件管道以实现深度工程化解耦,并采用基于Token阈值的动态上下文管理体系,解决长程任务中的上下文溢出风险 [42] - 产品开箱即用,部署简便,大幅降低了企业智能化转型门槛 [19][20] 行业背景与公司定位 - AI4S赛道竞争加剧,OpenClaw的发布促使各大厂商跟进推出Claw类产品 [50][51] - 在科研Claw细分领域,紫东太初被认为是国内发展最快且最稳健的厂商 [52] - 紫东太初ScienceClaw的推出是公司技术积累与产业布局的具象化呈现,其背后根植于公司自研的紫东太初多模态大模型 [53][54][55] - 紫东太初4.0模型于2025年9月发布,是全球首个深度推理+多模态的大模型,其原生多模态能力突破16项SOTA纪录,并适配350个国产算子,实现端到端训推自主可控 [56] - 公司产品演进遵循从基础大模型,到个人科研工具(ScienceClaw个人版),再到企业级平台的完整链路 [58][60] - 技术全栈国产化是公司的核心战略,这既是满足机构用户数据安全与合规诉求的关键,也构成了公司的差异化竞争力和产业底气 [60][61][62] - 该产品被视为验证AI4S在B端落地价值的成功案例,有望带动整个产业从个人应用转向真正的生产力工具 [64]
晚点独家丨DeepSeek 95 后研究员郭达雅近亿元年薪入职字节,中国大厂开启 AI Coding 大战
晚点LatePost· 2026-04-16 22:12
核心人才流动与薪酬趋势 - 前DeepSeek研究员郭达雅已加入字节跳动旗下大模型研发组织Seed,担任agent负责人之一,职级为L8 [3] - 其入职薪资总包接近国内顶级AI人才水平,与腾讯姚顺雨相当,但需满足一定条件才能拿全 [3] - 阿里、腾讯、字节均曾接触郭达雅,阿里甚至给出了post-train负责人的职位,但其最终选择了字节 [3] - 郭达雅入职字节的薪酬总包由现金、字节期权和大模型激励豆包股组成 [5] - 保守估计,若豆包股价格持续增长,四年后归属完毕,其加盟字节的总收益可能高达数亿元,平均年收益近亿元 [5] - 字节跳动CEO梁汝波在2026年1月底的全员会上表示,公司将继续加大对人才的投入,让薪酬和激励在全球各市场领先于头部水平 [10] 人才背景与技术专长 - 郭达雅是代码智能与大模型推理方向的顶尖人才,中山大学博士毕业后加入DeepSeek [5] - 他是DeepSeek V3、R1,以及Coder、Math等一系列模型的核心贡献者 [5] - 其与团队在DeepSeek-Math中提出的GRPO算法,能降低训练资源需求,提升模型判断问题的速度和准确性,节省内存占用,该算法后来也被应用于DeepSeek R1的训练 [5] - 郭达雅离职DeepSeek的原因之一是其看好agent方向,而当时在DeepSeek内部该方向优先级不高,最终选择字节主要是基于研究方向的契合 [5] Agent与AI编程(Coding)的战略重要性 - 伴随郭达雅加入,Seed内部正启动针对agent和Coding的组织整合 [6] - Agent的本质是代码理解、生成与程序综合,大模型的代码能力直接决定agent能做的事情 [6] - 字节非常看重AI agent方向,下一代模型的重点是优化agent能力 [6] - 2025年底至今,中国大厂AI基模团队的Code团队较为动荡,头部公司正在加大投入,急于拿下AI Coding和agent的竞争 [6] - 对于大模型而言,Coding是支撑复杂agent应用的重要基础 [8] - 从2025年下半年开始,出色的Coding agent爆发出巨大潜力,不再局限于服务编程群体,而是激发出广大普通用户的编程需求 [8] 海外市场动态与商业化验证 - 在海外,Coding是Anthropic和OpenAI竞争最激烈的主战场 [7] - Claude Code展现出惊人的吸金能力,2025年5月上线,至2026年2月其年度经常性收入已达250亿美元,不到一年即超越Cursor花两年多达到的收入规模 [7] - Claude Code的早期增速比Salesforce、Slack等软件企业都快,证明AI编程是目前最有效的变现方式 [7] - Claude Code也是Anthropic实现“弯道超车”的关键,2025年底其全年收入为90亿美元,而OpenAI为214亿美元,但四个月后Anthropic的ARR暴涨至3000亿美元,超过OpenAI在2月披露的2500亿ARR,双方商业化处于同一水平 [8] 中国市场格局与竞争态势 - 在中国公司中,一批大模型创业公司在Coding的投入上比大厂更早、更灵敏 [9] - 例如智谱在2025年初确定以Coding为重点优化方向,月之暗面在2025年7月发布Kimi K2并开源,将Coding + Agent立为模型主轴 [9] - 2026年初,创业公司相对优势显现,月之暗面Kimi K2.5、智谱GLM-5及MiniMax M2.5都继续强化Coding能力 [9] - 在OpenClaw带来算力需求暴涨后,这几家公司先一步吃到了红利 [9] - 智谱发布GLM-5后已连续三次涨价,但市场仍供不应求,调用量增长400% [9] - 月之暗面K2.5大模型发布不到一个月,近20天累计收入超过2025年全年总额 [9] - 尽管字节、阿里在2025年底均迭代了自家Coding模型,但当时即便是头部大厂,在该方向上的投入也有限 [10] - 字节跳动引进郭达雅,体现了其追赶全球模型第一梯队并保持国内领先的决心,预计中国Coding和agent市场的竞争将愈加激烈 [10]