Workflow
Opus 4.7
icon
搜索文档
为什么「高价值任务」成了所有 AI Labs 的T0 级战略?| 拾象 AGI 备忘录
海外独角兽· 2026-04-18 10:48
文章核心观点 - 过去一个季度AI模型能力进步剧烈,尤其在编码等高价值任务上,行业竞争焦点已从争夺用户规模转向争夺顶尖用户和完成高价值任务,这正在深刻重塑软件行业和白领工作模式[2] - AI Labs的战略高度收敛于“高价值任务”,其价值衡量标准从互联网时代的用户规模转向了“Token消耗 × 任务单价”,这动摇了传统的ToC/ToB二分法[8][10][11] - 硬件(如NVIDIA的LPU)与模型(如Claude Opus)的协同突破,为AI处理复杂、长周期任务提供了基础,并可能形成“二八定律”式的收入和token消耗结构[13][15][17] - 行业进入“Multi-Agent”时代,这对硬件提出了新的并行计算与数据传输要求,也使得“规划智能”(Planning)的价值超过“执行智能”(Execution),Harness(为AI Agent搭建的工作环境)成为关键基础设施[7][19][21] 根据相关目录分别进行总结 01. 硅谷正在集体经历“Move 37 时刻” - AI技术发展在2026年初呈现非线性加速,硅谷从业者普遍感受到类似AlphaGo“第37手”带来的颠覆性冲击[4] - AI工程师和研究员的工作方式发生根本转变,许多人从亲自写代码转为仅做代码审查,亲手写代码的比例从70%-80%降至5%以下[4] - 二级市场视角显示,AI生成代码的比例从去年的5%-20%提效,转变为今年80%甚至更高比例的代码由Agent完成[6] - AI的冲击正从替代白领工作(第一层)延伸到重估企业软件毛利(第二层),因为员工可利用AI内部构建简单系统,挑战传统SaaS的高定价[6] - AI研究过程本身也在加速,头部实验室内部已出现半自动化甚至接近全自动化的实验流程,形成自我改进的闭环[6] 02. 高价值任务:所有AI Labs的T0战略 - 头部AI实验室(如Anthropic, OpenAI)的战略从分化重新收敛,共同将“高价值任务”作为最高优先级(T0级)战略[8] - 市场数据印证了这一趋势:Claude Code的年度经常性收入(run rate)从2025年底约9亿美元飙升至2026年3月的近30亿美元,两三个月内增长约3倍;OpenAI的年度经常性收入(ARR)也从去年底的21亿美元增长至近期的27-28亿美元[8] - “高价值任务”的核心特征是能够端到端“采取行动”(take action),而不仅仅是提供信息,这将对全球白领的工资池进行重新分配[8] - 高价值任务通常具备高智力门槛、高单位智能消耗和高单位产出价值的特点,法律、金融、编程等是典型领域[8] 03. ToC / ToB二分法是互联网时代的旧地图 - 用ToC(面向消费者)和ToB(面向企业)来区分AI实验室的策略是互联网时代的惯性思维,“高价值任务”的叙事正在彻底摆脱这一旧框架[10] - 用户规模(DAU)不再是价值的充分条件:Claude Code的用户规模约为ChatGPT的1/20,但两者的年度经常性收入已基本持平甚至反超[11] - 新时代的价值公式从“日活跃用户数 × 每用户平均收入”转变为“Token消耗量 × 任务单价”[11] - B端市场形态正在变化:按席位(seat)定价的SaaS逻辑正在被按结果(outcome)定价替代;企业采购从“信息系统”转向“雇佣劳动力”,本质上是不同的市场[11] - Agent时代,C端和B端的边界日益模糊,评估AI公司的关键维度变为其是否承载高价值任务,以及其占据的是80%的token消耗还是80的支出[12] 04. 25%的卡创造80%的收入 - NVIDIA在GTC 2026上定义了高价值任务:由Agent独立完成、长周期、产生大量token并最终交付结果的任务[13] - 在硬件约束下,模型推理的速度和吞吐量存在矛盾,传统方案用小模型兼顾,但需要大量试错[13] - NVIDIA提出的路线是:未来高价值任务应由最好的模型进行试错,并同时输出大量token,这对硬件提出了低延迟和高并发的新要求[15] - NVIDIA定量拆分了模型使用场景:将25%的算力卡分配给最高价值任务场景(使用GPU+Grok LPU方案),这25%的场景可能创造80%的收入;而最低价值的25%场景基本用于服务免费客户,几乎不创造收入[15] - 这一结构的深层含义在于,只要高价值任务必须运行在最顶尖的硬件和模型上,顶尖模型就拥有结构性定价权[17] 05. “只投软件”的硅谷也开始投芯片了 - 近期硅谷风险投资出现反常趋势,大量过去主要投资软件的机构开始批量投资芯片领域,这种情形至少十年难遇[18] - 现实矛盾在于:高端GPU集群能运行最好的模型但推理速度有限、并发不高;小模型虽快但任务处理能力简单[18] - Cerebras和NVIDIA收购的Grok设计思路相似,采用SRAM内存,比当前主流的HBM更快、吞吐更大,适合处理推理中的中间数据[18] - 进入Multi-Agent时代,尤其是多智能体协作场景,需要“AI原生的硬件”,同时对上下文处理能力、单次推理速度和合作过程中的数据吞吐量提出了极高要求[19] 06. 80%的token与80%的spending是两件事 - 提升高价值任务处理能力有两条路径:一是如NVIDIA所示提升顶尖模型和硬件性能;二是如OpenClaw所示,通过优化Harness让平价模型通过消耗更多token反复试错来够到高价值任务的上限[20] - OpenClaw的创新在于理念,但离生产级应用仍有差距,真正能将Harness做到生产级的,大概率还是Claude、OpenAI等离模型更近的团队[20] - Multi-Agent的本质是在单位时间内进行大量并行计算,并通过分工协作提升系统鲁棒性,这更像一个管理学问题[21] - 在Multi-Agent系统中,真正有价值的是负责定角色、派任务的“规划智能体”,而非执行智能体[21] - 当前高价值任务的“二八结构”(即少数场景创造大部分收入)依赖于顶尖模型在规划能力上保持领先。一旦平价模型跨过“够用”阈值,顶尖模型在该场景的定价权就会消失,从创造80%支出的区域滑向仅消耗80%token的区域[21]
Anthropic Introduces First Design Tool to Claude
CNET· 2026-04-17 23:16
公司新产品发布 - Anthropic公司推出其首个专有AI设计工具Claude Design 标志着公司正式进入设计业务领域 [1] - Claude Design并非典型的AI图像生成器 其主要功能是创建幻灯片、社交媒体素材、应用程序和网页界面以及其他视觉原型 [1] - 该工具目前处于研究预览阶段 属于实验性质 现已向Pro、Max、Team和Enterprise订阅用户开放 [4] 产品功能与特性 - Claude Design提供精细化的控制选项 允许用户调整间距、配色和布局 并支持用户间或与Claude AI本身进行评论和编辑协作 [2] - 在编码项目中 该工具能够扫描代码库和设计文件以理解品牌的风格指南 确保其产出符合品牌规范 [2] - 该工具由Opus 4.7模型驱动 这是一个新发布的AI模型 据称具有更优的视觉智能以更好地理解图像 [5] 市场定位与行业背景 - Anthropic公司的市场策略聚焦于为企业和程序员构建先进AI 因此其进入设计领域的重点在于工作场所活动 如制作幻灯片而非娱乐内容 [6] - 创意AI领域存在争议 尽管AI爱好者利用不同模型优化工作流 但艺术家和创作者对该技术的制作方式及其对创意工作的影响存在重大担忧 [6] - Adobe公司近期宣布将其创意AI代理引入Claude平台 这与Claude Design是互补但独立的 [5]
Anthropic发布主力AI模型Opus 4.7,软件工程能力更出色,网络攻防被专门削弱
硬AI· 2026-04-17 22:31
公司动态:Anthropic推出Opus 4.7模型 - 在限制性发布其最先进模型Mythos仅一周后,Anthropic推出了其主力模型的升级版本Opus 4.7 [2][3] - Opus 4.7的核心改进集中于软件工程领域,包括处理高难度编程任务,其图像识别能力也有所提升,能够识别复杂图表或图片中的细节信息 [4][7] - 公司主动对Opus 4.7的网络攻防能力进行了“差异化削减”,并内置了自动检测与拦截系统以阻断高风险网络安全请求 [5][8][9] - 此次部署策略是公司在模型能力与安全边界之间的审慎取舍,旨在为最终实现Mythos级模型的广泛商业化探路 [6][11] 模型能力对比与安全考量 - Mythos模型被披露具备高度危险的网络攻击能力,能够识别并利用主流操作系统和浏览器中的安全漏洞 [9] - 出于安全考量,Anthropic决定仅向部分精选企业客户开放Mythos,专门用于帮助客户加固自身软件系统,而非面向大众发布 [10] - Opus 4.7在软件工程和图像识别方面表现更出色,但其在网络安全等方面的综合能力弱于Mythos [4][5][7] - 公司通过Opus 4.7的部署来积累安全防护措施的实际经验,以推进Mythos级模型的最终广泛发布目标 [9][11] 行业竞争与公司融资 - Anthropic正与OpenAI展开激烈竞争,双方均致力于部署更先进的AI模型并争取更多企业客户 [13] - Anthropic的AI编程产品势头强劲,消费者端持续获得更多关注,尽管公司与五角大楼在AI安全标准上存在分歧 [14] - 公司最近一轮估值为3800亿美元,目前正就新一轮融资征集报价,估值或达约8000亿美元乃至更高,较上轮翻倍有余 [3][14]
陆家嘴财经早餐2026年4月17日星期五
Wind万得· 2026-04-17 06:45AI 处理中...
中国经济宏观数据 - 一季度GDP为33.42万亿元,同比增长5%,增速较上年四季度加快0.5个百分点,超出市场预期 [3] - 3月份规模以上工业增加值同比增长5.7%,社会消费品零售总额增长1.7% [3] - 一季度全国固定资产投资同比增长1.7%,房地产开发投资下滑11.2% [3] - 1-3月全国新建商品房销售面积同比下降10.4%,销售额下降16.7%,但降幅分别比1-2月收窄3.1和3.5个百分点 [14] - 3月末商品房待售面积同比下降0.1%,为51个月来首次下降 [14] 房地产市场动态 - 3月70城房价数据显示,有14城新房价格环比上涨,13城二手房价格环比上涨,分别比上月增加4个和11个 [3] - 四大一线城市二手房价格全面环比上涨,上海已连续两个月上涨 [3] - 二、三线城市二手房价格环比降幅收窄,新房降幅企稳 [3] - 南京优化住房公积金政策,将公积金异地贷款范围扩大至安徽省全域,并降低委托逐月提取还贷业务的公积金个人账户留存金额 [14] 政策与产业动向 - 财政部、住建部将遴选不超过15个地级及以上城市,开展2026年中央财政支持实施城市更新工作,东部、中部、西部地区每城补助上限分别为8亿元、10亿元、12亿元 [5] - 国务院国资委召开中央企业低空经济产业发展专题推进会,要求加大投资力度,加快装备创新迭代,推动基础设施协同布局 [14] - 国家发改委主任调研能源科技创新工作,强调保障能源供应安全,推动油气消费替代,加快新型能源体系建设 [5] - 市场监管总局部署开展CCC认证守底线专项行动,聚焦充电宝、电动自行车等重点领域 [14] - 四川省开展生猪龙头企业成本收益专题调研,旨在服务生猪产业高质量发展 [14] A股与港股市场表现 - A股单边大涨,创业板指收涨3.17%刷新近11年新高,上证指数涨0.7%,深证成指涨2.05%,市场成交额2.35万亿元 [8] - 锂电池、能源金属、算力租赁、AI应用、存储芯片等概念板块涨幅居前 [8] - 恒生指数收涨1.72%,恒生科技指数大涨3.67%,科网股全线走强,南向资金净买入近43亿港元 [8] - 国家网信办依法处置一批公开推荐个股、诱导荐股等违规金融信息账号 [9] 外资动向与公司调研 - 2026年以来外资机构对A股上市公司调研持续升温,截至4月10日合计调研沪市公司近1400次,覆盖约190家公司 [9] - 外资调研重点集中在半导体、高端装备、智能硬件、创新药等领域,科创板公司尤其是AI与芯片相关领域备受青睐 [9] 科技与半导体行业 - 台积电第一季度营收359亿美元,同比增长40.6%,净利润增长58%至182亿美元,毛利率升至66.2% [9] - 台积电认为AI相关需求依然非常强劲,将启动全球3nm产能扩张计划,预计全年销售额同比增长30%以上 [9] - 群核科技香港公开发售获1591倍认购,国际发售获14.46倍认购,暗盘交易收涨170%,将于4月17日登陆港交所 [10] - 先正达集团计划最早于今年6月以保密方式向港交所提交上市申请,此前传闻集资或高达100亿美元 [10] 人工智能与互联网 - 腾讯发布并开源混元3D世界模型2.0,能根据多种输入自动生成、重建和模拟3D世界,支持与游戏工作流对接 [16] - 阿里巴巴发布开放式世界模型“Happy Oyster”,主打实时世界创建与交互,可用于影视及游戏制作 [16] - 阿里旗下具身模型ABot-PhysWorld登顶Agibot World Challenge与World Arena评测 [16] - OpenAI发布Codex升级版,现可使用用户电脑上所有APP,并推出面向生命科学研究的GPT-Rosalind模型 [17] - Anthropic推出更新版Opus 4.7模型,旨在提升软件工程能力 [17] - 谷歌正与美国国防部谈判,拟允许五角大楼在机密场景中部署Gemini AI模型 [17] - 欧盟委员会要求谷歌向第三方开放其积累数十年的核心搜索数据 [16] 重点公司业绩与公告 - 贵州茅台2025年实现营业收入1688.38亿元,同比下降1.21%,净利润823.2亿元,同比下降4.53%,为上市以来首次年度业绩下滑 [10] - 贵州茅台2025年度拟每股派27.993元,合计派现约350.33亿元,叠加中期分红全年累计分红650.33亿元创历史新高,公司2026年将实施“全面向C”战略 [10] - 中际旭创季度净利润同比增长262% [12] - 宏和科技季度净利润同比增长354% [12] - 赣锋锂业季度预盈16亿元-21亿元,同比扭亏 [12] - 华友钴业季度净利润同比增长99% [12] - 湖南黄金季度净利润同比预增60%至90% [12] - 永辉超市季度净利润同比增长94% [12] - 通富微电2025年净利润同比增长80% [12] - 大族激光2025年净利润同比下降30% [12] - 晶科科技拟245亿投建1GW算力中心,收到上交所监管函 [12] - 当升科技拟携手云天化投资44.93亿元加码新能源电池材料 [12] - 爱旭股份拟投资16.65亿元技改义乌及滁州ABC电池产能 [12] - 福达股份拟逾8亿元布局机器人与新能源电驱齿轮业务 [12] - 东方盛虹控股股东拟增持9.8亿元至19.6亿元股份 [12] - 佰维存储股东拟合计减持不超2%股份 [13] - 纳思达起诉太盟投资索赔4.7亿美元 [13] - 实达集团、网达软件、GQY视讯下修业绩预期,可能被实施退市风险警示 [13] 全球市场与宏观经济 - 美国上周初请失业金人数减少1.1万至20.7万人,创自2月以来最大单周降幅 [20] - 美国3月工业产出环比下降0.5%,低于市场预期的增长0.1% [20] - 英国至2月GDP环比增长0.5%,远超经济学家预期的增长0.1%,为2024年以来最强单月表现 [20] - 国际货币基金组织大幅下调中东多国经济增长预期,预计今年卡塔尔经济将萎缩8.6%,伊拉克与伊朗经济将分别收缩6.8%和6.1% [20] - 美国三大股指小幅收涨,纳指连续12日上涨,标普500指数和纳指续创新高 [21] - 纳斯达克中国金龙指数涨1.74% [21] - 日经225指数收盘大涨2.38%报59518.34点创历史新高,韩国综合指数涨2.2% [21] - 欧洲三大股指收盘涨跌不一 [21] 大宗商品与外汇市场 - 美油主力合约收涨1.72%报89.65美元/桶,布油主力合约涨3.46%报98.21美元/桶 [26] - COMEX黄金期货跌0.26%报4810.90美元/盎司,COMEX白银期货跌1.47%报78.46美元/盎司 [26] - 伦敦基本金属多数上涨,LME期锡涨1.10%,期镍涨0.89% [26] - 世界白银协会预计2026年全球白银市场短缺将扩大15%至4630万盎司 [27] - 美元指数涨0.13%报98.20,离岸人民币对美元跌47个基点报6.8232 [28] - 美国商品期货交易委员会正在调查疑似发生在美伊政策转向前的石油期货内幕交易 [27] 金融与监管动态 - 监管部门4月以来已两次召集主要评级公司开会,重点关注评级虚高、恶意低价竞争等行业乱象 [24] - 中国银行间债市延续偏强表现,主要利率债收益率多数下行 [24] - 财政部将于4月22日在香港招标发行155亿元人民币国债 [25] - 美债收益率集体上涨,10年期美债收益率涨3.17个基点报4.313% [25] - 英国金融行为监管局推出全新卖空监管制度,放宽对冲基金等卖空投资者的行政与申报要求,新框架将于7月13日生效 [22] - 英国央行正评估AI可能对金融体系带来的风险,并研究AI智能体对金融市场交易的影响 [20]
Anthropic Unveils Updated Opus 4.7 Model | Bloomberg Tech 4/16/2026
Youtube· 2026-04-17 04:51
人工智能模型更新 - Anthropic公司发布了其广泛可用的人工智能模型Opus的更新版本,性能提升了4.7%,而上一版本为4.6% [1][4][6] - 新版本在广泛的能力上有所提升,特别是在处理过去需要分解成多个部分的任务(如软件工程)方面表现更佳 [4][5] - 模型的计算机视觉能力得到增强,能够处理更高分辨率的图像并从中更好地提取信息,这为数据分析等应用开辟了可能性 [5][6] - 此次更新是在其更先进的模型Mythos进行有限发布仅一周后推出的 [1][4] 先进模型Mythos与网络安全 - Anthropic的Mythos模型被设计用于发现网络安全漏洞,以便进行修复,公司已将其提供给少数选定的公司进行早期使用 [7][8] - 该模型在测试中表现出不仅能帮助发现漏洞,还能自主利用这些漏洞的能力,这促使公司决定限制其发布范围 [42][43] - 出于对模型强大能力可能被滥用的担忧,Anthropic采取了有意的、限制性的发布策略,而非大规模发布 [38][39][46] - 公司计划在未来几周内将Mythos的访问权限扩展到英国的金融机构 [34][35] 芯片制造与供应链动态 - 台积电(TSMC)利润大幅增长,受人工智能芯片强劲需求驱动 [2] - 台积电将营收增长预测上调至超过30%,并预计将接近560亿美元营收区间的上限 [22] - 埃隆·马斯克正在积极推进其芯片制造项目,已联系东京电子、应用材料等设备供应商询价和交货时间 [13] - 行业对马斯克的项目持保留态度,现有芯片制造专家和设备供应商可能不愿将专业知识或有限产能分配给一个新手 [15][19][20] - 芯片制造是一个竞争激烈且困难的市場,分析师估计需要投入5万亿至13万亿美元,且大规模生产预计要到2029年才开始 [15][16] 人工智能驱动的市场与行业趋势 - 以科技股为主导,美国股市连续12天上涨,创下自2017年以来最长的连涨纪录 [2][3][25] - 人工智能被视为下一个重大技术浪潮,其带来的生产力提升规模被比作国家的电气化,市场仍在试图为人工智能定价 [26] - 人工智能需求非常强劲,但也存在内存芯片供应紧张等瓶颈,限制了部分公司获取供应 [22][23] - 人工智能的采用正在加速,不仅限于编码,还扩展到市场营销、人力资源和财务等公司运营的各个层面 [78][79][80] 数据中心扩张与监管挑战 - 数据中心建设热潮导致电力需求激增和电价上涨,这在美国已成为一个政治议题,影响了州长选举 [54][55] - 为应对反对意见,一种解决方案是要求数据中心开发商自建发电设施或签署购电协议,以承担其能源消耗 [55][56] - 美国缅因州已成为第一个暂停数据中心建设的州,以评估所需的监管措施 [57] - 在欧洲,西班牙正将自己定位为欧洲的人工智能中心,大力推动基础设施建设,但也面临土地征用和当地居民反对的挑战 [60][61][62] - 欧盟和西班牙预计将出台新的法规,将未来的数据中心建设许可与满足可持续性标准挂钩 [65][66] 初创公司与融资动态 - 金融科技初创公司Slash完成了1亿美元的融资,该公司为特定行业提供定制化银行服务 [81][84] - Slash公司年经常性收入达到3亿美元,自去年5月以来一直保持盈利,其运营高度依赖人工智能实现自动化 [84][85][87][88] - 公司超过50%的工程时间用于构建内部软件工具,以自动化从文件归档到处理争议等后台任务 [88] - 通风与过滤系统公司Madison Air正在进行首次公开募股,发行价每股27美元,预计开盘价为每股30至31美元,其需求增长部分得益于数据中心建设的繁荣 [92]
Anthropic CPO leaves Figma's board after reports he will offer a competing product
TechCrunch· 2026-04-17 02:28
核心事件 - 人工智能公司Anthropic的首席产品官Mike Krieger于4月14日从界面设计公司Figma的董事会辞职 [1] - 这一离职消息由市值100亿美元的上市公司Figma在同日向美国证券交易委员会披露 [1] - 消息披露当天,有报道称Anthropic即将发布的新模型Opus 4.7将包含可能与Figma核心产品竞争的设计工具 [1] 相关公司与人物背景 - Figma是一家为网站和应用程序构建界面的用户体验设计师提供流行工具的开发商 [2] - Figma此前与Anthropic密切合作,将后者的人工智能模型集成到其产品中作为用户助手 [2] - Mike Krieger曾联合创立Instagram和人工智能新闻应用Artifact,于2024年成为Anthropic的首席产品官,并在不到一年前加入Figma董事会 [2] 市场影响与投资者观点 - Krieger的离职及即将推出的设计工具,为那些担忧“SaaSpocalypse”(即大型AI实验室将主导软件业务)的投资者提供了新的佐证 [3] - 这一观点今年已数次冲击公开市场,例如iShares的主要软件ETF(IGV)今年已下跌近18% [3] - Figma的股价自Krieger离职消息披露后上涨了5% [4] 行业竞争与公司动态 - Anthropic正在拒绝投资者以8000亿美元估值入股公司的提议,此估值是其年初最近一轮融资估值的两倍多 [4] - 像Anthropic和OpenAI这样的公司仍需证明,其能力超强的模型能够真正复制成熟软件品牌的领域经验和客户关系 [4]
Anthropic Updates Its Most Powerful AI Model Opus 4.7
Youtube· 2026-04-16 23:33
模型更新与性能 - Anthropic发布了Opus 4.7% 这是一个现有模型的更新版本 而非全新模型[1] - 该模型在编程和视觉内容生成两方面能力显著提升[2][3] - 在编程方面 模型能更准确地遵循指令 处理复杂的编程任务[2] - 在视觉方面 模型能处理更高分辨率的图像并严格遵循指令 可生成高质量的演示文稿[3][4] 技术进步与采用率 - 技术进步速度极快 仅几个月内 开发者对AI辅助编程的态度从怀疑转变为完全依赖[5] - 一位开发者表示 现在其100%的编码工作都使用AI工具[5] - 模型更新解决了“内存墙”问题 这对于尖端计算至关重要[6] - 新版本在理解和处理现有代码库方面表现更好 降低了相关风险[7] 行业影响与市场动态 - 模型能力的提升正在对Figma、Adobe等传统软件公司构成颠覆性影响[3][4] - 在软件工程行业 此类模型的价值在于处理繁重的编程工作量[2][3] - 目前约90%的新代码由AI编写 但现有代码库的AI使用率约为50% 主要因调试和风险问题[7] - 熟练工程师的角色正从编写代码转变为观察和审查AI生成的代码[14][15] - 行业争论在于 审查AI生成代码的时间可能仍与自行编写相当 但支持者认为耗时部分在于实时编写和调试而非审查[16] 模型安全与发布策略 - Anthropic强调在确保安全护栏有效前 不会发布新模型[8] - 此次Opus 4.7%的更新也意在向市场传达其安全护栏运行良好[8] - 随着模型能力越强 被恶意滥用或行为超出预设参数的风险也越高[9] 资本支出与商业价值 - 公司资本支出用于购买芯片以训练新模型 并使其可供外界使用[11][12] - 这些模型正变得更具实际用途[12] - 市场关注的核心问题是 巨大的资本支出是否能转化为所覆盖公司篮子相应的收入增长 目前两者之间仍存在脱节[12]