Workflow
提示词工程、上下文工程都过时了,现在是 Harness Engineering 的时代
Founder Park· 2026-03-13 21:04
Harness Engineering的兴起与定义 - 2026年开年,开发者社区最热关键词为Harness Engineering,由HashiCorp联合创始人Mitchell Hashimoto在2月5日命名[2] - 一个月内,该概念从一篇博客文章发展为开发者社区高频词[3] - 行业新共识:在AI Agent编码领域,决定结果好坏的最大变量是模型所处的环境,而非模型本身[4] - 核心观点:模型能力竞赛持续,但决定Agent工程产出质量的杠杆已转移到“环境”一侧,这个环境就是Harness[5][6] 从Prompt到Context再到Harness的认知演进 - **2023年:Prompt Engineering全盛期**,焦点是写好单条提示词,但处理复杂任务时局限性暴露[9] - **2025年中:Context Engineering兴起**,焦点从“写好一条指令”扩展到“设计动态系统来组装上下文”,包括RAG、对话历史等编排[9] - **2026年2月:Harness Engineering正式命名**,解决了Context Engineering的不足,即上下文无法阻止Agent“做不该做的事”[11][12] - 三阶段关系总结:Prompt Engineering管“说什么”,Context Engineering管“知道什么”,Harness Engineering管“在什么环境里做事”[13] OpenAI实验的核心发现与工程实践 - **实验设定**:5名工程师在五个月内,通过Codex Agent协作交付了超过100万行代码的生产级软件产品,无一行人类手写代码[4][15] - **效率数据**:平均每名工程师每日合并3.5个Pull Request,代码审查通过Agent对Agent循环实现大规模自动化[15] - **关键挑战**:最困难的挑战集中在设计环境、反馈回路和控制系统上[15] - **文档工程进化**:从将所有信息塞进庞大AGENTS.md文件的错误,演变为**渐进式披露模型**,AGENTS.md精简为约100行的“目录”,指向结构化docs/目录[16][17] - **超越文档**:将可观测性数据(日志、指标、追踪)直接暴露给Agent,使其能通过LogQL和PromQL查询验证运行时状态,甚至通过Chrome DevTools Protocol操作浏览器以重现Bug[18][19] - **机械化架构围栏**:通过确定性Linter(错误输出格式专为Agent设计)和基于LLM的审计Agent,严格拦截违反分层架构依赖流向的代码[21][22] Harness Engineering的三维框架(Böckeler解读) - **维度一:上下文工程**:确保Agent在正确时机获得正确信息,包括渐进式文档披露、动态可观测性数据接入[24] - **维度二:架构约束**:通过机械化手段(如专为Agent设计的Linter)强制执行架构边界,使“违规→检测→修复”循环可在Agent内部闭环完成[25] - **维度三:熵管理/垃圾回收**:部署专用清理Agent定期扫描文档漂移、模式违规和依赖问题,防止Harness自身随时间腐化[26] - 三者关系:上下文工程让Agent“知道该做什么”,架构约束确保“只在边界内行事”,熵管理保障“整个系统不随时间退化”[26] 行业实践与验证 - **Stripe的工业级实践**:其Minions体系每周合并超过1,300个由AI完全编写的Pull Request[28]。每个Agent任务在独立预热devbox中运行(约10秒启动),通过名为Toolshed的中心化MCP服务器访问近500个工具[28]。采用“蓝图”模式,混合确定性节点与Agent节点,将LLM限制在“可控盒子”里以提升可预测性[28] - **LangChain的对照实验**:其编码Agent在Terminal Bench 2.0基准测试上,仅通过优化Harness(不修改模型),得分从52.8%提升至66.5%,排名从第30跃升至第5[4][29]。这是“环境比模型更重要”的直接证据[30] - **行业采用**:Anthropic将Claude Code定位为“灵活的Agent线束”[31]。MCP(模型控制协议)月SDK下载量超过9,700万,获OpenAI、Google、Microsoft和AWS采用,正成为Agent工具访问的通用标准[31] - **行业数据**:LangChain报告显示,89%的受访者已为其Agent实施可观测性,但仅有52%实施了评估(Evals)[32] 工程师角色与组织结构的转变 - **工程师核心工作转变**:从写代码转向设计让Agent可靠运行的环境,具体包括构建文档与上下文体系、以机器可处理的方式定义业务意图、构建自动化的防呆验证机制[33] - **新工作模式**:工程师如软件架构师,只讨论高层架构和重大决策,不涉及具体代码实现[34]。系统理解的深度比写代码的速度更重要[35] - **组织结构变化**:OpenAI的3-7人团队完成了以前需数十人规模的工程输出[35]。Stripe让单名工程师可同时向多个Agent分配任务,团队结构向两三人甚至单人团队收敛[35] - **“学徒缺口”挑战**:初级开发者若过早进入Agent驱动循环,可能缺乏构建健壮Harness所需的深度系统直觉,需设计保留手动开发直觉的学习路径[35] 开发者行动建议与采用路径 - **起步**:把同一个任务做两遍(先手动,再让Agent做),以建立对Agent能力边界的直觉[36] - **养成习惯**:每天下班前30分钟启动Agent,处理深度调研、并行探索、Issue和PR分诊等任务[36] - **关键跃迁**:在项目中建立一份AGENTS.md文档,从最基本内容开始,每次Agent犯错就补充一条规则,使其逐渐长成Harness[36] - **心态建议**:关掉Agent的桌面通知,由人类控制中断时机[36] - **对技术负责人的建议**:选择新项目做试点,并建立Evals(评估体系)能力[37]
Beyond the Track: Sunday Swagger and Pennzoil Launch Performance-Inspired Lifestyle Collection Featuring Team Penske
Businesswire· 2026-03-13 21:03
文章核心观点 - 高尔夫及生活方式服饰公司Sunday Swagger与领先的机油品牌Pennzoil合作推出联名系列 该系列灵感源自Pennzoil在赛车运动中的长期传承、与Team Penske的合作以及对赛道内外性能与耐力的追求 系列包含**21款**新产品 涵盖男装、女装及青少年服饰 旨在让赛车迷和高尔夫爱好者将赛道能量带入日常风格 [1] - 此次合作恰逢本周末由Jiffy Lube呈现的Pennzoil 400赛事 联名系列产品已于发布当日通过sundayswagger.com开售 [1] 公司业务与战略 - Sunday Swagger是一家高性能高尔夫及生活方式服饰公司 其核心理念是不为个性牺牲舒适 自**2019年**成立以来 公司每年均实现**三位数增长** 已设计推出**超过300款**独特产品 涵盖男女及青少年Polo衫、T恤、帽子和外套 [1] - 公司采用灵活的产品策略 当特定印花产品售罄后 会迅速转向推出新款式 其标志性Polo衫系列(如Splatter, Stylin', The Gambler)在社交媒体上广受欢迎 并受到多位名人青睐 [1] - 公司拥有名为“The Sunday Club”的忠诚会员计划 会员年费**20美元** 可享受新品独家购买权、免运费、更高折扣、购物**10%**现金返还以及免费迎新礼 [1] - Sunday Swagger积极通过品牌联名拓展业务 除本次与Pennzoil合作外 近期还与Dole Food Company、Guinness®以及Uncrustables® Brand等知名消费品牌推出了联名系列 [1][2] 产品与联名系列详情 - Pennzoil x Sunday Swagger联名系列包含**21款**新产品 产品类型包括Polo衫、外套、纽扣衬衫以及**6款**新帽子(平檐或按扣式设计) [1] - 系列中的Polo衫采用透气、四向拉伸的聚酯-氨纶混纺面料 具有吸湿排汗和抗皱特性 部分款式提供家庭搭配选择 部分精选产品融入了Team Penske车手Joey Logano的形象及其**22号**赛车元素 [1] - 除服装外 该合作系列还包括两款新毛巾设计 以及一款灵感源自Pennzoil标志性机油罐造型的高尔夫球杆头套 以此向品牌赛车传统致敬 [1] - 联名系列的设计理念融入了Pennzoil标志性宣传语“Long May We Drive”所体现的性能承诺与驾驶激情 该精神体现在精选的外套和帽子产品上 [1] 行业与市场定位 - Sunday Swagger定位于高尔夫时尚与生活方式服饰领域 致力于重新定义并突破高尔夫服饰的边界 其产品在强调舒适(四向拉伸、吸湿排汗、透气面料)的同时 也注重鲜明的个性与设计感 [1] - Pennzoil作为拥有超过**百年**历史的品牌 数十年来一直处于赛车运动的中心 此次合作旨在让粉丝通过正宗的赛车灵感单品 将赛道边的活力融入日常风格 [1] - 公司通过其官网sundayswagger.com进行直销 并已加入Awin和SkimLinks的联盟营销计划 以拓展销售渠道 [1]
Emerald Holding, Inc. 2025 Q4 - Results - Earnings Call Presentation (NYSE:EEX) 2026-03-13
Seeking Alpha· 2026-03-13 21:02
公司业务与运营 - 公司负责所有与文字记录相关的项目开发工作 [1] - 公司目前每季度在其网站上发布数千份季度财报电话会议文字记录 [1] - 公司业务持续增长并扩大其覆盖范围 [1] 公司沟通与信息披露 - 公司设立此简介的目的是为了与读者分享文字记录相关的新进展 [1]
US economic growth revised lower in fourth quarter
Fox Business· 2026-03-13 21:02
美国第四季度GDP增长数据修正 - 美国商务部发布了对第四季度实际国内生产总值增长的首次修正 数据显示经济增长速度较此前预期有所放缓 [1] - 美国经济分析局发布的第四季度GDP第二次估值为增长0.7% [2] - 该0.7%的增长率低于伦敦证券交易所集团调查经济学家预期的1.4% [2] - 该0.7%的增长率也低于美国商务部最初发布的第四季度GDP预估增长率1.4% [2]
Fed's favored inflation gauge remained stubbornly high in January as consumer price pressures persist
Fox Business· 2026-03-13 21:02
2026年1月PCE通胀报告核心数据 - 美联储首选通胀指标PCE指数在1月份环比上涨0.3%,同比上涨2.8% [2] - 剔除食品和能源价格的核心PCE指数在1月份环比上涨0.4%,同比上涨3.1% [3] - 同比数据方面,整体PCE通胀率从12月的2.9%微降至2.8%,而核心PCE通胀率则从12月的3%上升至3.1% [4] 分项价格表现 - 商品价格同比上涨1.3%,低于12月的1.7% [5] - 耐用品价格同比上涨2.2%,高于12月的2.1%,非耐用品价格同比仅上涨0.8%,低于12月的1.6%,为去年8月以来最低读数 [6] - 服务价格同比上涨3.5%,略高于去年9月至12月期间持续的3.4%通胀率 [6] 消费者储蓄情况 - 1月份个人储蓄占可支配个人收入的比例为4.5% [7] - 该储蓄率高于去年10月至12月普遍的4%,也是自去年7月录得4.5%以来的最高水平 [7] 政策背景与市场预期 - 美联储政策制定者正试图将通胀带回其2%的长期目标 [4] - 1月份整体PCE月度环比数据符合LSEG调查的经济学家预期,年度同比数据则略低于预期的2.9% [2] - 1月份核心PCE的月度环比和年度同比数据均符合LSEG调查的经济学家预期 [3]
熬过最难一年后,今年或是理想的反弹之年
雷峰网· 2026-03-13 21:01
文章核心观点 2026年,公司战略聚焦于产品技术升级与销售渠道改革双线并行,旨在突破增长瓶颈并重获市场领先地位[1]。公司通过加大具身智能研发投入、推动核心产品换代、优化纯电车型布局来构建技术壁垒,同时通过“门店合伙人计划”等渠道变革激活销售体系,以应对激烈的存量市场竞争并实现销量增长目标[4][13][18]。 根据相关目录分别进行总结 01 每三天花一个亿,从产品定义转向技术竞争 - **2025年财务表现与挑战**:公司2025年营收1123.1亿元,同比减少22.3%,汽车销售收入1066.8亿元;全年毛利209.9亿元,综合毛利率和汽车毛利率分别降至18.7%和17.9%;全年盈利11亿元[2][3] - **研发投入与战略转型**:过去三年累计研发投入达330亿元,相当于每三天花费一亿元;2025年将一半研发费用投入AI领域,全力向具身智能企业转型[2][11] - **2026年销量目标与竞争压力**:2026年销量目标为48万辆,需实现同比20%的增长;主力车型理想L9在2026年2月仅交付1082辆,面临问界M9(3085辆)和蔚来ES8(11260辆)等竞品的激烈竞争[6] - **L9换代升级重点**:换代L9是决定L系列市场上限的关键;将首次搭载自研M100芯片,其有效算力达到Thor-U的5-6倍;采用800V全主动悬架和全线控底盘,电池电量超70度,纯电续航超400公里[6][7] - **纯电车型布局与供应链管理**:纯电车型i6上市初期产能受限于零部件短缺,目前供应链问题已解决,月交付能力将达2万台;电池供应采取开放合作战略,同时使用自产电池与宁德时代电池;因合作伙伴欣旺达陷入质量纠纷,公司强调掌握电池方案设计主动权[8][9] - **产品策略与组织架构调整**:计划减少SKU数量,将每款车的单一配置做到极致;按照基座模型、软件本体、硬件本体重构研发组织,大量启用90后、95后乃至00后年轻骨干担任负责人,推动组织年轻化[9][11] - **前沿技术探索**:在AI眼镜、机器人等前沿项目上以创业团队方式谨慎探索;AI眼镜Livis上市三天销量突破两个月产能[11][12] 02 权力下放,培养年薪百万的店长 - **渠道改革核心措施**:撤销“五大战区”,改为总部直管的“大区+战区”模式;2026年3月正式启动“门店合伙人计划”,赋予一线门店更大经营自主权和利润分成,旨在激活销售、解决直营体系在价格战中反应迟缓的问题[13][14] - **门店优化策略**:渠道优化核心是提升门店质量而非数量,将对少量低效门店进行更换或经营优化;新增门店将布局在头部商场和优质汽车城,并随着纯电车型销量提升重点加码高线城市布局[16] - **人才激励与体系竞争力**:公司计划培养年薪百万的店长,使优秀店长收入达到行业的两到三倍,坚信有效管理的直营体系将形成长期核心竞争力[17] - **辅助增长战略**:除产品与渠道外,公司增长还依赖持续的智能化战略和海外市场开拓;2026年被定义为正式出海第一年,已在香港设立海外总部、在德国慕尼黑建设研发中心,并在中亚等地建设零售服务网络[17][18]
1.6万亿美元市值蒸发背后:三位实战派深谈 AI「杀死」旧软件的真相与出路
雷峰网· 2026-03-13 21:01
文章核心观点 旧的SaaS(软件即服务)范式正在瓦解,AI Native(人工智能原生)的黄金时代刚刚开启。AI Agent(智能体)能力的突破性进展,尤其是其能够绕过图形界面直接操作软件并串联业务流程,对传统SaaS的估值逻辑、商业模式、产品形态和竞争壁垒构成了根本性冲击。行业正处于一场深刻的战略、产品和组织的全面转型之中。 近期 SaaS 股价暴跌:预期遭受降维打击 - 北美软件股在短短两个月内蒸发了超过1.6万亿美元市值,暴跌主因并非财务收入不及预期,而是市场预期遭受“降维打击”[2][5] - 核心冲击在于:AI Agent(如Claude Cowork)能够自主操控电脑、接管业务流程,使得传统“流程化软件”可能退化为“智能Agent的插件”,这动摇了SaaS厂商通过掌握业务流程“出入口”获得溢价权的根基[5] - 企业付费预算正大规模从应用层向LLM(大语言模型)基础设施转移,例如Anthropic等AI公司收入增长迅猛,市场此前预计OpenAI和Anthropic到2026年的年度经常性收入(ARR)为200亿美元,但实际很可能远超此数[5][24] - SaaS的估值体系(尤其是市销率PS)正在松动,许多北美SaaS公司的净收入留存率(NDR)已回踩至100%,若继续下探,PS估值模型将失效[5][25] - 以Salesforce为例,尽管其持续强调AI,但2025年财报中AI相关收入占比可能仅百分之几,其股价从2024年开始下跌,2025年全年跌幅约30%,反映出市场对AI如何转化为实际ToB收入的疑虑[6][26] SaaS 护城河:部分被击穿,仍存底牌 - AI对SaaS的冲击本质是对传统护城河的重构,核心力量“转换成本”与“网络效应”受到挑战[8] - 冲击体现为两点:一是“打劫逻辑”,即AI Native公司以更敏捷的架构、更低成本和更好体验抢夺传统SaaS存量市场;二是功能“被动折叠”,即AI Skills或自然语言交互可能使传统图形界面(GUI)体验优势消失[8][28] - 传统SaaS厂商仍握有重要底牌:1)企业经营数据沉淀形成的“数据半透膜”;2)长期积累的客户关系与品牌认同[8] - 从业务价值看,SaaS厂商的壁垒依然存在,主要体现在:与企业业务流程的深度耦合、长期沉淀的行业知识(know-how)、以及厂商与客户之间持续的服务关系[9][30] - “专业分工”规律不会改变,AI(如AI编程)带来的是“岗位上移”而非岗位消失,同时软件开发成本下降可能激发更大量的软件需求[9][29] - AI将催生新的行业壁垒,如更强的架构设计能力、更深入的客户需求理解以及更高效的产品交付与系统集成能力[30] 商业模式:按坐席收费模式难以为继 - 三位嘉宾一致认为,未来按坐席(Seats-based)收费的SaaS逻辑在AI时代很难继续成立[12] - 原因在于:1)企业因AI应用可能导致裁员缩编,组织规模变小,直接导致按席位收费的收入缩水(例如1万人的公司裁员至8000人,相关SaaS收入直接减少20%)[12][41];2)“一个人的公司”正在兴起,个人借助AI可完成过去团队的工作[41] - 未来的商业模式将转向按tokens使用量、消耗量或按结果/价值计费[12][34] - 关于利润分配的争论:一种观点认为顶尖模型厂商因智能质量的显著差异(SOTA模型与普通模型是“零与一”的区别)将拥有很强溢价权,利润可能向上游集中[13][45];另一种观点认为大模型厂商可能“管道化”,利润将留在更贴近业务价值的应用层,因为管道(模型)可随时切换,且专业分工将长期存在[13][46] - SaaS公司自身形态正在向“制造业”演变:1)商业模式从“订阅制”转向“消耗制”,收入与产出规模直接挂钩;2)成本结构从“人力为主”变为“人+Token”,业务规模不再完全依赖人力线性增长[14][45] 产品形态:GUI意义消解,Agent编排能力崛起 - AI正在重塑软件形态,GUI(图形界面)的意义正在消解,未来软件设计将更多考虑“让Agent好用”,而非“让人爽”[16] - 未来的SaaS产品可能深度集成到飞书、钉钉等工作平台中,以API形式提供能力,用户通过统一入口(如Chat界面)调用[16][49] - 当软件使用主体从人变为Agent时,评价标准将重构,重点从功能多寡、界面美观转向任务完成成本、效率和Token消耗[17][52] - 传统SaaS公司需要将原有API能力重新封装成“Skill”(能力模块),供Agent调用和编排,这种编排能力将愈发重要[17][53] - 软件正从“操作界面”变为“任务黑盒”,用户只需提出目标,AI Agent自动完成背后复杂的流程编排,许多工作流将被产品化封装[17][54] 实践与未来:战略、产品、组织的全面转型 - 对于传统SaaS公司,转型涉及缩短协作链条、提升组织密度,例如将技术团队拆分为更小单元,让市场、销售、产品、研发的协作链条缩短一半[19][57] - 产品经理职能需迁移,不仅要懂功能设计,还要懂叙事、销售和影响客户使用[19][57] - 海外市场呈现两条路径分化:一类是纯粹的AI Native公司,从原有体系分裂,打法激进;另一类是传统SaaS厂商,需要在组织、人才、战略、产品层面进行深度调整以适应AI[20][58] - AI时代SaaS公司的新打法包括:1)小团队探索,利用10%-15%的资源支持单人或双人团队进行规模化创新;2)快速试错迭代,尝试周期缩短至3-6个月评估;3)组织逻辑变革,投资决策需更灵活,支持规模化快速验证[20][60] - 内部采用AI已带来显著效率提升,例如有技术团队内部效率提升了约40%-50%[60] - 共识是AI不会杀死SaaS,但会彻底改变定义成功的方式,行业需要拥抱AI Native的新世界[20][21][62]
美团王兴强调业务重点:CLC是核心主战场,国际化业务持续投入
雷峰网· 2026-03-13 21:01
" 打完2025年这一战,美团管理层首次对外释放态度。 " 作者丨应梅 编辑丨刘伟 雷峰网获悉,3月13日,美团进行了一场管理层沟通会,所有S-team高管及2000多名管理者、骨干参 与。 此次会议上,王兴表示,美团对国际化业务的态度是坚定的,战略清晰,但不会盲目扩张,聚焦在即时零 售这个赛道上坚定投入。对于AI,唯一能做的就是更积极地拥抱,"哪怕像学游泳一样,呛了水,并不舒 适,也一定得跳下去。" 而食杂零售层面,跟美团"吃得更好,生活更好"的使命紧密相关,态度更加坚决,"一定要做好,一定 赢"。美团的食杂零售主要包含小象超市、快驴、快乐猴等零售业务,此前美团宣布以初始对价7.17亿美 元收购在华东市场有多年根基的叮咚买菜。 "越是时代加速变化,越要抓住不变",王兴认为,不变的东西一个是变化本身,面对无时无刻的变化,必 须调整自己,更加主动地适应和拥抱变化。另外,不变的就是美团的使命,美团所身处的这个行业本身的 价值,吃是一个人最基本的需求,是最普世的需求。 王兴自身想做的第一个变化是让大家改变对他的称呼,"虽然兴哥的叫法已经30年,但从现在开始请叫我 王兴。"王兴笑谈,公司应该努力减少"登味",大家都可 ...
港交所消息:3月10日,摩根大通公司持有的宁德时代H股多头头寸从8.25%增至9
新浪财经· 2026-03-13 21:01
摩根大通增持宁德时代H股 - 摩根大通公司持有的宁德时代H股多头头寸从8.25%增至9% [1] - 此次增持发生在3月10日 [1]
中国平安发布行业首个商业航天综合金融解决方案,首站落地长三角
新浪财经· 2026-03-13 21:01
中国平安发布商业航天综合金融解决方案 - 公司于3月12日在上海商业航天大会暨展览会主论坛上,发布了行业首个“保险保障+资金供血+资本助推”的综合金融解决方案,旨在为商业航天发展提供全方位支持 [1] 方案推出的背景与行业现状 - 商业航天在技术、需求、政策“三驾马车”的加持下,已经走上了快车道 [1] - 商业航天目前依然处于发展初期,仍面临一些问题和困难 [1] 方案的具体目标与协同机制 - 该方案旨在解决商业航天“怕失败、等不起、长不大”三大痛点,助力产业实现高质量发展 [1] - 公司通过该方案打通产险、银行、证券等多家机构,打造“一个入口、全域响应”的协同机制 [1] 方案的落地与核心能力 - 方案首站落地长三角产业集聚区 [1] - 平安产险上海分公司将联动平安银行、平安证券上海分支机构在上海首创商业航天服务专班模式 [1] - 该模式旨在打造“属地化定制+全国性资源+全生态协同”三大核心能力,构建“全生命周期”的精准服务图谱,快速调配集团内相应资源,服务不同发展阶段的产业需求 [1]