Workflow
Agent
icon
搜索文档
巨头博弈下,Agent 的机会和价值究竟在哪里?
海外独角兽· 2025-06-14 19:42
核心观点 - 2025年是Agent技术加速发展的关键年份,但真正实现用户价值闭环的产品仍稀缺 [6] - Agent的真正门槛在于基础设施而非模型能力,包括记忆系统、上下文感知、工具调用和可控环境等模块 [6] - Coding被视为衡量AGI最关键的先验指标,可能占据大模型产业阶段性90%的价值 [6][45] - AI Native产品需要构建同时服务于AI和人类的双向机制 [34] - Agent商业模式正从按token/调用次数计费向按结果/工作流计费演进,未来可能出现直接雇佣Agent的模式 [6][39] 01 通用Agent是大模型公司主战场 - 通用Agent领域表现最佳的是"模型即Agent"(Model as Agent)模式,如OpenAI的Deep Research和o3模型 [12] - 通用Agent市场已成为大模型公司的主战场,创业公司难以仅靠通用需求做大 [13] - 垂直领域Agent分为前台(与人交互)和后台(重复性工作)两类,典型案例包括HappyRobot(物流沟通)和AI for Science创业公司 [14][15] 02 Cursor是从Copilot发展到Agent - Cursor通过三个阶段完成从Copilot到Agent的转型:自动补全→代码重构→后台异步执行 [22][23] - 关键策略是先从Copilot切入收集用户数据,逐步过渡到Agent形态,而非一开始就追求完全自动化 [18] - 产品设计注重用户交互心智,通过同步交互收集反馈数据,为后续Agent能力奠定基础 [23] 03 Coding是衡量AGI最关键的先验指标 - Coding数据具有干净、可验证、易闭环的特性,最可能率先实现数据飞轮 [24] - 数字世界是实现AGI的第一环境,Coding能力提升将带动指令遵循等核心能力 [25] - 若AI无法规模化完成端到端应用开发,在其他领域进展会更缓慢 [25] 04 做一个好的Agent需要什么条件 - 需要构建可验证的反馈机制和数据飞轮环境,如代码和数学领域 [26] - 产品需同时考虑人和Agent的需求,实现AI Native设计 [28] - 评估标准包括任务完成率(行业及格线约50%)、成本效率(计算/时间成本)和用户指标(留存/付费率) [30][32][33] 05 Agent定价会从基于成本转向基于价值 - 商业模式演进路径:按成本→按动作→按工作流→按结果→按Agent本身 [39] - 典型案例Hippocratic AI的AI护士成本仅为人类护士的1/4 [39] - 未来可能出现智能合约模式,通过Crypto技术实现Agent经济价值分配 [40] 06 人与Agent该如何交互协作 - 交互模式分为Human in the loop(持续参与)和Human on the loop(关键节点介入) [41] - 未来高重复性任务将实现高度自动化,人类仅需复核摘要 [42] - 新的异步协同方式将出现,需要探索Agent与Agent之间的交互机制 [43] 07 Agent爆发离不开Infra - 环境(虚拟机/浏览器)是Agent开发早期80%问题的根源 [55] - 关键基础设施包括上下文管理(记忆/检索)、工具发现平台和安全机制 [57][58] - 未来机器搜索需求可能达万亿次/天,远超人类搜索规模(200亿次/天) [59] - 大厂分化明显:Anthropic专注Coding,OpenAI布局多方向,Google具备端到端能力 [52][53]
字节选择背水一战
虎嗅APP· 2025-06-14 11:24
字节跳动AI战略与火山引擎发展 - 字节跳动CEO梁汝波首次公开为豆包站台,强调公司坚定长期投入AI并追求智能突破,服务产业应用[3][7] - 火山引擎2024年营收预计超110亿元,同比增速翻番,2025年目标230亿元,有望超越百度智能云(2024年营收218亿元)[10][11] - 豆包1.6模型在复杂推理、数学竞赛等测试集跻身全球前列,视频生成模型Seedance 1.0 pro在Artificial Analysis榜单文生视频、图生视频任务排名第一[5] 大模型价格战与成本优化 - 火山引擎2024年通过模型结构优化将大模型价格降低99%,行业称其为"价格屠夫"[7] - 豆包1.6相比1.5版本企业使用成本下降63%,相同请求成本从7元降至2.6元[16][17] - 通过ServingKit方案优化推理成本,方舟平台实现按区间调度,将高频使用区间(32K以内输入)成本定向优化[16][19] Agent技术生态布局 - 火山引擎提出AI时代开发范式从PC/Web、Mobile/APP转向AI/Agent,需配套大模型+Agent开发平台[13] - 豆包1.6已接入字节AI编程产品TRAE,80%工程师使用该工具辅助开发,TRAE月活超100万[21] - 发布AI云原生方案,涵盖Prompt Pilot、Coding Agent、多模态数据湖等,构建完整Agent开发生态[14][15] 字节跳动云计算竞争策略 - 依托抖音系超10亿用户日均2小时使用的算力需求,通过闲时资源租赁摊薄云计算成本[23] - 通过Top Seed计划全球招募大模型人才,豆包大模型日均Token使用量达16.4万亿,较发布初期增长137倍[25] - 坚持自研路线,豆包大模型在中国公有云市场份额达46.4%,超过二三名总和[25][28] 公司战略定位升级 - 火山引擎承载字节跳动从娱乐平台向科技公司转型的使命,目标对标亚马逊"广告+云"双轮模式[29][30] - 管理层明确不投资外部大模型团队,集中资源构建服务器、芯片、SaaS等完整自研体系[26][28] - 通过技术开放策略反哺内部竞争力,2021-2024年商业化营收从10亿元跃升至110亿元[7][10]
字节选择背水一战
虎嗅APP· 2025-06-14 11:23
字节跳动AI战略与火山引擎发展 核心观点 - 字节跳动通过火山引擎全面押注AI云服务,以豆包大模型为核心构建技术壁垒,目标争夺中国AI云市场主导地位 [5][7][11] - 公司采取差异化策略:坚持自研大模型、优化工程架构降低成本、聚焦Agent生态,形成"技术开放-市场反馈-迭代升级"闭环 [7][13][16] - 火山引擎营收呈现爆发式增长:2021年超10亿元→2022年20亿元→2023年50亿元→2024年110亿元(同比增速均超100%),2025年目标230亿元将超越百度智能云 [10][11] 技术突破与产品优势 豆包大模型性能 - 豆包1.6-thinking在复杂推理/数学/多轮对话等测试集跻身全球前列,视频生成模型Seedance 1.0 pro在Artificial Analysis榜单文生视频、图生视频任务超越Veo3、可灵2.0 [5] - 日均Token使用量达16.4万亿(较2023年5月增长137倍),中国公有云大模型市场份额46.4% [25] - 编程能力显著提升:接入TRAE编程产品后,超80%字节工程师使用,月活超100万 [21] 成本优化策略 - 通过ServingKit方案优化推理成本,方舟平台实现区间调度,将企业常用场景综合成本降低63%(示例:同等请求下成本从7元降至2.6元) [16][17] - 统一深度思考/图文理解定价标准,消除传统模型的不合理溢价 [16] - 2024年豆包1.0发布时率先降价99%,推动行业价格战但自身毛利率保持健康 [7][8] 行业趋势与战略布局 Agent生态构建 - 提出互联网三时代演化理论:PC/Web→Mobile/APP→AI/Agent,开发范式转向大模型+Agent平台 [13] - 发布AI云原生方案,包含Prompt Pilot、Coding Agent、多模态数据湖等组件,形成完整企业服务生态 [14][15] - 类比AI为"水电基础设施",强调通过服务利润而非单位技术利润驱动行业变革 [20] 竞争壁垒分析 - 规模效应:抖音系产品日均超10亿用户/2小时使用时长,支撑算力资源调度优化 [23] - 人才战略:Top Seed计划不限预算招募全球大模型人才,技术差距快速缩小 [25] - 拒绝外部投资聚焦自研,避免资源分散,强化"科技公司"定位而非娱乐平台 [26][28][29] 市场影响与未来目标 - 2026年有望超越百度智能云(2024年百度云营收218亿元),争夺云服务第一梯队席位 [11] - 技术开放策略反哺内部竞争力,形成"抖音流量-火山引擎变现-AI技术迭代"飞轮 [7][23] - 长期对标亚马逊模式,构建"广告+云服务"双引擎,重塑公司科技基因 [29][30]
张鹏对谈李广密:Agent 的真问题与真机会,究竟藏在哪里?
Founder Park· 2025-06-14 10:32
Agent行业现状与趋势 - 2025年成为Agent技术加速发展关键年,DeepSeek、GPT-4o和Claude 3.5等推动大模型边界扩展,但行业焦点转向具备自我调度能力的智能体[1] - Agent成为继大模型后全球科技圈最快形成共识的风口,巨头战略重构与创业赛道跟进同步进行,但多数产品陷入"用老需求套新技术"的困境[2] - 行业面临核心挑战:底层设施缺位(可控运行环境/记忆系统/上下文感知/工具调用)制约Agent从演示走向实用[2] 技术路径与产品形态 - 通用Agent领域最佳实践是"模型即Agent"(Model as Agent),如GPT-4o整合LLM/上下文/工具使用/环境等组件端到端训练[14] - 垂直领域Agent分为ToB前台(如HappyRobot的物流电话Agent)和后台(AI for Science多智能体系统)两类[15][16] - Coding Agent发展路径:从Cursor的Copilot(Tab键补全90%准确率)逐步演进至后台异步运行的完整Agent形态[19][22] AGI发展关键领域 - 编程(Coding)被视为通往AGI的"价值高地":数据干净闭环可验证,可能占据大模型产业90%价值[24][47] - 数字世界优先实现AGI的逻辑:端到端软件开发能力是基础,未来两年Agent或能完成人类在数字设备上的所有操作[25] - 评估Agent核心指标:任务完成率+成功率(行业及格线50%)、成本效率(计算/时间成本)、用户粘性(DAU/MAU/留存)[30] 商业模式创新 - 收费模式演进:从基于成本定价→按动作收费(如物流电话单次几毛钱)→按工作流收费→按结果付费→未来可能按Agent本身付费[37][42] - 市场渗透策略变化:自下而上(如Cursor)替代传统SaaS销售模式,医疗领域OpenEvidence通过医生群体切入再植入商业广告[35] - 价值捕获方向:Coding可能服务全球3000万程序员后,通过"氛围编程"拓展至5亿平民开发者,激发应用软件大爆发[47][48] 基础设施需求 - 环境(Environment)构成最大挑战:需要虚拟机/沙盒(如E2B)保障安全执行,专用浏览器(如Browserbase)支持信息检索[56][59] - 上下文系统关键组件:信息检索(MemGPT)、工具发现平台、记忆管理系统[62] - 未来基础设施规模:万亿级Agent任务执行将重构云计算,机器搜索需求或达人类搜索量的50倍(日万亿次)[61] 未来技术演进 - 多模态大一统:理解与生成能力一体化将打开产品想象力,模型持续遵循Scaling Law和"思维链"双范式[63] - 自主学习突破:AI通过在线任务体验提升能力,进入"经验的时代",记忆系统完善将显著提升产品粘性[64] - 交互方式革新:从文字输入转向"永远在线"的异步交互,形成人机新型协作关系(Human on/in the loop)[44][45]
模型上新、降价,火山引擎急推AI应用落地
21世纪经济报道· 2025-06-14 08:55
行业趋势 - 2024年是中国大模型应用元年 2025年可能是中国Agent落地元年 技术主体从PC时代的web 移动时代的APP 转向AI时代的Agent [4] - Agent正逐步进入企业各个业务流程 规模化落地需要解决堵点 [5] 定价策略 - 首创按输入长度区间定价模式 0-32K输入区间每百万tokens输入0 8元 输出8元 综合成本是豆包1 5深度思考模型的三分之一 [5][6] - 豆包1 6使企业成本下降63% 仅需原价三分之一即可使用新模型 [7] - 视频生成模型Seedance 1 0 pro每千tokens 0 015元 生成5秒1080P视频仅需3 67元 1万元预算可制作超2700条 [11][12] 技术升级 - 模型进化聚焦三个方向 深度思考 多模态理解和工具自主调用 [8] - 豆包1 6全系列原生支持多模态思考能力 具备图形界面操作行动力 可自动操作浏览器完成酒店预订 识别购物小票整理Excel [9][10] - Seedance 1 0 pro支持文字与图片输入 生成多镜头无缝切换1080P视频 [10] 市场表现 - 豆包大模型日均tokens使用量超16 4万亿 较去年5月发布时增长137倍 [13] - 服务全球TOP10手机厂商中9家 8成主流汽车品牌 70%系统重要性银行及超5成985高校 [14] - 大模型收入增速最快 毛利位居前列 客户拓展目标激进 [14] 战略定位 - 推动Agent普及的关键是做好模型 降低成本 完善落地工具 [15] - 不以免费低质模型赚吆喝 坚持通过技术价值获取行业认可 [15]
梁汝波首次公开站台,为什么给了豆包?
虎嗅· 2025-06-14 06:29
核心观点 - 字节跳动CEO梁汝波首次公开为豆包站台,凸显公司对AI大模型及火山引擎业务的战略重视 [1][6][29] - 火山引擎通过技术优化实现大模型成本大幅下降(降幅达99%),推动行业价格战并加速AI普及 [9][22] - 公司提出"AI云原生"概念,构建从开发范式到基础设施的完整解决方案,聚焦Agent技术落地 [17][19][20] - 火山引擎营收呈现爆发式增长:2021年超10亿元→2022年20亿元→2023年50亿元→2024年110亿元,2025年目标230亿元 [12][14][15] - 字节跳动坚持大模型自研路线,豆包在中国公有云大模型市场份额达46.4%,日均Token使用量16.4万亿(较首发增长137倍) [34][38] 产品与技术突破 - 豆包1.6-thinking在复杂推理、数学竞赛等测试集跻身全球前列,视频生成模型Seedance 1.0 pro在Artificial Analysis评测中超越Veo3等竞品 [5] - 工程优化实现企业成本下降63%(同任务成本从7元降至2.6元),关键技术包括Serve key方案和方舟调度系统 [22][24] - 编程能力显著提升:豆包1.6接入TRAE编程产品,超80%字节工程师使用,月活突破100万 [28] 战略布局 - 公司定位从娱乐平台向科技公司转型,火山引擎承载构建完整自研体系(服务器/操作系统/芯片/SaaS)的使命 [40][43][44] - 采用差异化竞争策略:不参与大模型投资并购,通过Top Seed计划全球招募顶尖人才 [33][37][41] - 依托抖音生态优势:10亿用户日均2小时使用时长为云计算提供规模效应和算力调优空间 [31] 行业影响 - 价格战改变行业格局:2024年豆包1.0降价99%触发连锁反应,加速中国大模型发展 [9] - Agent技术被视为下一代开发范式,将重构互联网入口(PC→移动→AI对应Web→APP→Agents) [17][25] - 安全需求升级:推出大模型防火墙、模型投毒防护等新产品,应对多模态数据安全挑战 [18]
张鹏对谈李广密:Agent 的真问题与真机会,究竟藏在哪里?
Founder Park· 2025-06-14 04:27
Agent行业核心观点 - 2025年成为Agent技术加速发展的关键年份,从大模型性能迭代转向自我调度的智能体范式[1] - Agent被视为继大模型后全球科技圈最快形成共识的风口,但多数产品陷入"用老需求套新技术"的困境[2] - 行业面临的核心矛盾是底层设施缺位,包括可控运行环境、记忆系统等基础模块的不足[2] - Coding领域被视作实现AGI的关键试炼场,可能占据大模型产业90%的阶段性价值[24][47] 技术路径与产品演进 - "模型即Agent"成为通用Agent最佳实践,如GPT-4o整合LLM、上下文等组件实现端到端训练[14] - 垂直领域Agent分化为ToB前台/后台两类:后台侧重SOP自动化(如AI for Science多智能体系统),前台聚焦人机交互(如医疗电话回访Agent)[15][16] - 从Copilot到Agent的渐进路径:Cursor通过代码补全(90%准确率)、重构功能分阶段过渡至异步后台Agent[22][23] - 多模态技术、自主学习和记忆系统构成未来技术突破三大方向[64] 商业模式创新 - 定价模式从成本导向转向价值导向,出现按动作/工作流/结果/Agent本身等五级计价体系[37][42] - ToB领域出现自下而上的渗透模式,如Cursor绕过CIO直接获取开发者认可[35] - 智能合约可能成为Agent经济新基础设施,实现任务完成后的自动价值分配[42] 行业竞争格局 - 巨头技术路线分化:Anthropic专注Coding Agent,OpenAI布局ChatGPT+多模态+o系列模型,Google整合TPU+Android全栈能力[54][55] - 创业公司机会存在于垂直领域(如HappyRobot物流Agent)和Infra层(虚拟机/浏览器环境)[16][56] - Agent Infra四大组件:环境(E2B等虚拟机服务)、上下文(MemGPT等记忆工具)、工具平台、安全系统[56][62] 用户交互范式 - "Human on/in the loop"形成协作光谱:高重复性任务趋向自动化,关键决策保留人工干预[44] - 上下文感知成为体验核心,需整合代码库、通讯记录等多维数据提升任务完成率[48][51] - AI Native产品需构建双向服务机制,同时满足人类和AI的需求[31] 市场供需现状 - 供给端能力过剩(Cursor将编码效率提升10-100倍),需求端尚未突破"落地页开发"等初级场景[47] - 杀手级应用缺失类比推荐引擎早期,等待类似"信息流"的产品形态突破[47] - 应用大爆发潜力存在于降低开发门槛后激发的长尾需求,可能催生新创意平台[48]
一粒「扣子」,开启了Agent的全生命周期进化
机器之心· 2025-06-13 17:22
Agent行业发展趋势 - 2025年被视为Agent爆发元年,将显著改变PC、移动端人机交互范式并提升多任务自动执行能力[1] - 互联网大厂和AI初创企业将Agent作为竞争焦点,通过MCP、A2A等协议扩展能力边界[2] - 火山引擎Force 2025大会将Agent列为焦点,展示其重塑生产力的潜力[3][4] 扣子平台升级 - 扣子平台从单一开发平台进化为覆盖Agent全生命周期的四大组件体系[5] - 四大组件包括:低代码开发平台、Eino开源框架、效果调优罗盘、Agent协作空间[7] - 平台适应大模型时代多样化需求,提供智能化开发体验[5] 扣子开发平台功能 - 支持零代码开发并一键发布至飞书、微信等主流渠道[8] - 提供智能体IDE、应用IDE、插件模板和企业级安全四大赋能模块[9] - 预置上千插件和工作流模板,支持搭建知识库并连接火山方舟多模型[9] - 应用IDE支持拖拉拽GUI开发,企业级安全支持VPC私网连接[10] - 提供开箱即用的智能客服、文章转换等预置模板[12] Eino开源框架 - 采用Go语言编写,融合LangChain等社区框架优点[13] - 标准化Chat Template、文档解析等核心模块为可调用组件[14] - 支持可视化编排复杂任务流程,具备流处理能力和工具链[15] - 字节内部已有300+系统采用,GitHub获4.3k星标[16] - 抖音电商智能客服应用效率提升50%以上[16] 扣子罗盘全生命周期管理 - 贯穿开发、评测、观测、优化四阶段闭环[16] - 评测阶段支持Prompt/Agent量化评估,首家商业化支持轨迹评估[22] - 观测阶段实时分析token消耗、请求量等运行数据[19] - 支持自动上报数据,适配LongChain等框架数据接入[19] - 与火山方舟Prompt优化和模型微调能力贯通[23] 扣子空间协作平台 - 国内AI产品增速榜首,整合多领域专家Agent协同[25] - 支持市场分析、高考咨询等场景,通过MCP协议扩展能力[26] - 未来将上线更多行业专家Agent强化生态[26] 行业基础设施展望 - 扣子平台有望成为大模型时代Agent发展的基础支撑[27]
AI的百亿套壳:做船不做柱子
36氪· 2025-06-13 14:35
AI应用投资趋势 - AI应用投资活跃度显著提升 套壳概念从贬义转向中性甚至褒义 市场出现百亿美金套壳案例[1] - 套壳应用分为"柱子"和"船"两类 前者随模型能力提升被淘汰 后者能水涨船高[1] - 2023-2024年AI应用集中在六个方向:Chatbot变形体 AI coding变形体 角色扮演变形体 图片生成变形体 视频生成变形体 Agent概念产品[4][5][6] 头部AI应用案例 - Cursor估值99亿美金 ARR达5亿美金 创始人25岁MIT毕业生 从AI CAD转型AI coding 2024年8月因Claude 3.5代码能力突破而爆火[8][11][12][14] - Perplexity估值140亿美金 ARR数亿美金 CEO28岁伯克利博士 从自然语言转SQL工具转型AI搜索 借助ChatGPT实时联网需求快速崛起[8][16][17][19] - 典型AI应用公司CEO普遍年轻:Cursor25岁 Perplexity28岁 Devin27岁 Manus30岁 多具备快速转型能力[8][31] AI应用发展方向 - 2023-2024年同质化严重 主要受限于模型能力仅解锁六个方向[7] - 2025年方向扩展 出现AI播客 视频剪辑 资讯 理财投资 Marketing等新领域[8] - Agent能力提升将解锁更多应用场景[8] 成功AI应用特征 - 产品需提前布局模型能力 在能力临界点到来时爆发 Cursor和Manus均提前准备壳等待模型能力突破[21][22][23] - 需构建"船"型产品而非"柱子"型 确保模型能力提升能带动产品体验升级[26] - 转型是常态 多数成功案例经历重大业务转向[28][29] - 团队规模小 1亿美金ARR时约20人 依赖PLG增长模式和AI提效[35] AI应用增长模式 - 依赖Magic moment引发自来水流量 通过大V体验传播形成病毒式增长[23][36] - 当前主要采用订阅制商业模式 未来可能出现更适合AI的独特商业模式[37][39] - 行业处于供给不足阶段 需求明确且形态已被科幻作品预设[36]
对话谭待:AI云竞争,火山引擎选择这样突围
21世纪经济报道· 2025-06-12 21:30
火山引擎的战略定位与差异化优势 - 公司以"后来者"姿态进入AI赛道,凭借豆包大模型快速迭代和AI云原生全栈能力加速突围 [1] - 差异化优势体现在规模效应(抖音、头条等内部业务支撑使其成为中国计算规模最大的云厂商之一)和AI原生能力(B端与C端协同)[2][3] - 在大模型服务市场份额达46.4%,远超行业第二、三名总和 [3] 产品与技术布局 - 发布豆包大模型1.6、视频生成模型Seedance1.0 pro,升级Agent开发平台 [2] - 采用"区间定价"策略:0-32K输入区间(覆盖80%企业需求)综合成本仅为豆包1.5或DeepSeek R1的三分之一(输入0.8元/百万Tokens,输出8元/百万Tokens)[2] - 通过模型结构优化(如20B激活技术)、GPU推理优化(软硬分离、量化技术)降低算力成本 [5] 市场拓展与客户策略 - 坚持"公有云优先"和"AI优先"战略,利用豆包APP的C端用户基础加速B端合作 [4] - 针对中小企业推出低成本试错方案,开源AI应用代码(如视频通话原型)和开发框架(如v eRL强化学习框架)[6] - 在金融领域建立标杆案例(华泰证券、招商银行、泰康保险),通过AICC机密计算保障数据安全 [9] 行业生态建设 - 成立手机、汽车等行业联盟(如上海车展合作),与金蝶、汉得等集成模型能力 [8] - 孵化AI原生初创企业,提供代金券和技术支持,目标推动中国AI企业服务"弯道超车" [8] - 未来重点深化零售、金融行业共创,构建AIFirst企业生态 [8] 产业趋势判断与应对 - 行业从PC/移动互联网向AI时代演进,技术主体从APP转向智能体(Agent),开发范式转向模型自主规划 [10] - 2024年可能是"Agent应用元年",大模型将从效率工具升级为生产力主体(客服、销售、科研等闭环场景)[11] - 算力需求长期旺盛,公司聚焦模型优化与Agent技术提升算力使用效率 [12]