Workflow
Agent
icon
搜索文档
赵何娟对话张宏江:世界模型已是兵家必争之地|2025 T-EDGE全球对话
钛媒体APP· 2025-12-22 22:52
文章核心观点 - 人工智能发展进入新阶段,超级智能的出现将首次导致技术革命“消灭工作”而非仅替代岗位,对社会经济结构构成根本性挑战 [2][8][78][79] - 大模型技术发展远未到顶,预训练模型的Scaling Law仍有空间,而推理模型的Scaling Law则刚刚开始,技术演进正沿着“预训练模型-推理模型-智能体”的主线快速推进 [12][13][16][17] - 行业竞争格局未定,OpenAI与Google各有优势,未来可能多种生态共存,而下一代模型(如世界模型、AI科学家)的探索已吸引巨额资本押注 [4][20][34][41] - AI基础设施(算力、能源、数据中心)的投入是构建下一代数字时代的基石,当前不存在整体性泡沫,但算力仍是核心瓶颈 [42][44][47][48][51] - 应用层面,编程和内容生成已成为明确的爆款方向,具备强自主运营能力的智能体(Agent)预计将在2026年开始大量涌现 [52][53][54][55] 技术发展趋势与模型演进 - **发展主线**:过去三年AI发展呈现清晰的三部曲:预训练模型、推理模型、智能体,模型能力持续向上突破,推理模型与智能体的边界正在模糊 [13][14][15][18] - **Scaling Law 现状**:预训练模型的Scaling Law还远远没有到达顶点,其效率虽不如三五年前,曲线变平缓,但投入产出依然成正比,而推理模型的Scaling Law其实还有很长的路要走 [16][17][19] - **下一代模型探索**:行业正在寻找Transformer之外的新架构突破口,世界模型和“AI科学家”(用AI改善AI)是重要方向,硅谷已有相关初创公司在人未到齐、网站未上线时估值就达40亿至50亿美元 [4][20][22][23] - **模型能力评估**:评判模型能力不能只看传统“跑分”,需更关注其完成实际任务的生产力,推理模型能够“慢思考”的时长是衡量智力上限的重要标志 [24][25][26] 行业竞争与市场格局 - **OpenAI vs Google**:两者竞争激烈,各有优势。Google凭借全栈能力、强大执行力在Gemini 3.0上实现了爆发,其AI三要素(算法、人才、数据)结合良好;OpenAI则拥有约8亿周活跃用户的ChatGPT应用生态和先发优势,但面临内部动荡及在预训练模型上投入不足的挑战 [34][35][36][37] - **生态模式**:未来AI时代可能像移动互联网时代一样,封闭的全栈生态(如苹果)与开放的生态体系(如安卓)共存,现在给OpenAI、英伟达下结论为时过早 [40][41] - **芯片竞争**:Google使用自研TPU训练出Gemini 3.0,引发了TPU是否会打败GPU的讨论,给英伟达股价带来压力,但最终哪种体系胜出尚待观察 [40] 基础设施与资源瓶颈 - **核心瓶颈**:算力依然是AI发展的根本瓶颈,电力、数据中心(IDC)建设是满足算力需求的前提 [42][44][47] - **美国基建挑战**:美国IDC建设速度慢,从立项到运行需约三年,电网能力是主要卡脖子环节,而非能源本身短缺 [43][44] - **算力密度单位**:行业开始用“兆瓦”作为算力集群的新单位,1兆瓦电力约对应50万张GPU(H200)的算力 [44] - **中国算力制约**:DeepSeek团队明确表示其模型性能受限主要因为算力不足,加算力后模型能力仍有持续提升空间 [46][47] 应用落地与投资热点 - **已确认的爆款应用**:To C端的ChatGPT和To B端的AI编程(如Cursor)已成为明确爆款,AI生成内容在金融、体育等领域的新闻报道占比已超过50% [52][53][60] - **智能体(Agent)爆发点**:随着推理模型能力提高,预计在未来12到24个月内AI会有非常大突破,2026年将出现大量具备强自主运营能力的Agent [54][55][56] - **垂类机会**:编程、客服、媒体内容生成、企业工作流自动化是可能快速发展的垂类赛道 [57][59][60][62] - **端侧AI现状**:当前的AI手机、AI眼镜等硬件主要聚焦于智能交互,真正的智能仍在云端,端侧生成式模型驱动尚未成熟,自动驾驶是特例因其车载算力充足 [63] 机器人赛道与具身智能 - **存在泡沫**:中国的机器人赛道被认为是AI领域泡沫最多的,中国可能有上百家机器人公司,而美国仅约十家左右 [65][66] - **发展挑战**:在世界模型取得突破之前,具身智能很难做到通用,这不是三到五年的事,而是五到十年的事 [66][73] - **中美差异**:中国在机器人本体制造和供应链上有显著优势(一次升级仅需一周,美国需两个月),但大部分本体仍处于遥控状态,缺乏自主执行通用任务的泛化能力 [67][72] - **务实路径**:特斯拉机器人可能实现百万台量产,因其专注于工业场景中的“一类任务”机器人,而非通用机器人,这在特定领域已具重大意义 [68][69][75] 社会经济影响与未来挑战 - **就业冲击本质**:超级智能将“消灭工作”本身,而不仅仅是替代某个岗位,这是人类首次面临技术革命减少整体工作机会的挑战 [2][78][79] - **创造与消灭的循环**:AI会创造新工作机会(如图片需求增加),但这些新机会最终可能仍由AI自身满足,而非转移给人类 [78] - **贫富差距与超级个体**:在大模型驱动的Agentic Economy时代,会出现“一人的独角兽”式超级个体,个人能力和收入差距将进一步拉大 [9][85] - **潜在解决方案探索**:社会开始探讨全民基本收入(UBI)、新的税收体系(向机器人或公司利润征税)以及让公民分享技术成长红利的投资账户等方案 [82][83] - **未来职业形态**:自由职业者、非全职工人招聘可能成为主流,人们需要具备机器难以替代的特定技能,并保持好奇心和创造力以应对变化 [86][88][89]
LangChain Agent 年度报告:输出质量仍是 Agent 最大障碍,客服、研究是最快落地场景
Founder Park· 2025-12-22 20:02
行业核心观点 - 2025年,AI Agent大规模应用的主要障碍已从成本转向输出质量,确保其输出可靠、准确是最大挑战[1] - 进入2026年,行业讨论焦点已从“是否采用Agent”全面转向“如何规模化、可靠且高效地应用”[2] Agent采用现状与趋势 - 超过一半(57.3%)的受访者已将Agent投入实际生产,另有30.4%正在开发且有明确上线计划,行业正从“概念验证”快速迈向“价值实现”阶段[4][5] - 规模越大的企业,Agent落地速度越快:万人以上大型企业中,67%已将Agent投入生产,24%正在积极开发;而百人以下小公司的比例分别为50%和36%[6] - 客户服务(26.5%)与研究及数据分析(24.4%)是目前最主流的Agent应用场景,两者合计占据所有应用场景的一半以上[10] - 在万人以上的大企业中,提升内部生产力(26.8%)反超客户服务,成为第一大应用场景[13] - 今年的应用场景分布更广,表明Agent应用正从早期领域向更多元化方向渗透[12] 应用挑战与障碍 - 输出质量(准确性、相关性、一致性、遵循规范的能力)是阻碍Agent大规模应用的最大障碍,三分之一的受访者视其为主要瓶颈[14] - 延迟(20%)是第二大挑战,尤其在客服或代码生成等实时交互场景中,响应速度直接影响用户体验[17] - 对于员工超过2000人的企业,安全问题(24.9%)的关注度超过延迟,成为仅次于质量的第二大挑战[18] - 对于万人以上企业,“幻觉”和生成内容的一致性被提及为保障质量的最大挑战,同时在上下文工程及大规模管理上下文方面也困难重重[20] - 随着模型价格下降和技术优化,成本已不再是大家最头疼的问题,行业关注点正从“省钱”转向如何让Agent运行得更好、更快[17] 技术实施与评估 - Agent执行流程的可观测性已成为行业标配:89%的企业已为其Agent实施某种形式的可观察性,其中62%拥有详细的追踪能力[21][23] - 在已有Agent投入生产的受访者中,可观测性部署比例更高:94%部署了可观察性,其中71.5%具备完整的追踪能力[23] - 超过半数(52.4%)的企业会通过测试集进行离线评估,而在线评估的采用率较低(37.3%),但后者比例正在增长[25][26] - 当Agent进入生产环境后,“不进行任何评估”的团队比例从29.5%下降至22.8%,进行在线评估的比例则上升至44.8%[28] - 在评估方法上,行业呈现混合模式:近四分之一的团队同时采用离线和在线评估,普遍依赖人机结合方法,如采用LLM-as-judge(53.3%)和人工审查(59.8%)[31][33] - 传统机器学习指标(如ROUGE和BLEU)采用率较低,因其不适合评估开放式、存在多个合规答案的Agent交互场景[34] 模型使用与开发模式 - OpenAI的GPT模型在采用率上占主导,超过三分之二的企业正在使用[36] - 超过四分之三的团队在生产或开发中会使用多种模型,倾向于根据任务复杂度、成本和延迟灵活分配任务,而非绑定单一平台[36] - 超过三分之一的组织仍在投资部署开源模型,主要出于成本优化、数据主权或行业监管合规的考虑[38] - 微调尚未成为主流:57%的组织没有进行微调,而是更依赖于提示工程和RAG技术[38] 日常使用与工具类别 - 编程类Agent是日常工作中使用最频繁的类别,如Claude Code、Cursor、GitHub Copilot等工具被广泛用于代码生成、调试和测试[40] - 研究类Agent是第二大常用类别,由ChatGPT、Claude、Gemini、Perplexity等工具驱动,用于探索新领域、总结文档及整合跨源信息[41] - 基于LangChain和LangGraph构建的自定义Agent也广受欢迎,用于QA测试、知识库搜索、工作流自动化等内部场景[42] - 仍有相当一部分受访者表示,除了聊天或编程助手,还没用过其他类型的Agent,表明“一切皆可Agent”的愿景仍处于非常早期阶段[44]
恒生电子首席科学家白硕:Agent之难,无关算力、模型与平台
雷峰网· 2025-12-22 13:52
文章核心观点 - 金融行业AI Agent落地的核心壁垒并非算力成本或通用平台,而在于业务接口的“厚度”,即封装了丰富业务逻辑、能理解自然语言指令的原子化服务能力 [4][8][12] - 通用Agent编排平台的价值正在弱化,其市场份额被高估,真正的竞争力在于垂直领域深厚的资源积累与丰富的原子化服务 [4][14][17] - 金融Agent的发展将走向稳态与敏态业务分离的终局,由AI中台连接,其中敏态业务由Agent负责,这依赖于深厚且贴近业务的接口体系 [5][33] Agent发展的核心壁垒与价值判断 - **接口“厚度”是关键壁垒**:构建Agent的核心挑战在于原有IT系统开放的业务接口“厚度”不足,无法让Agent理解用业务语言表达的复杂意图,导致技术与业务之间存在鸿沟 [8][10] - **“厚度”体现为丰富的原子化服务**:判断厂商接口开放“厚度”的标准,在于其能提供多少种封装良好、可通过自然语言方便调用和发现的“菜谱”式服务,而非底层的标准化编排框架 [12] - **需重视领域“黑话”治理**:垂直领域存在大量行业术语,需进行大模型友好的数据治理,使垂域数据与通用AI技术能有效对接 [9] - **预算构成中算力仍是大头**:在预算构成中,算力成本仍占主要部分,但行业对算力价格持续下降抱有信心,例如DeepSeek等模型正在冲击算力下限 [13] - **开源模型已成主流**:在以私有化部署为主的金融领域,开源大模型(如千问)已广泛应用,付费私有化部署模型竞争力不强,Llama等模型的时代已经过去 [13] 金融Agent的发展路径与现状 - **发展历经三阶段**:从硬编码自动化,到通过“拖拉拽”图形界面配置流程的半自动化,再到当前利用自然语言描述步骤并自动映射资源能力的阶段 [19][20] - **当前阶段依赖ReAct模式调试**:当前AI无法保证流程拆解完全正确,需通过ReAct模式进行动态修改和回滚,确保系统操作可逆,避免不可逆的错误改变 [21] - **金融机构需求从单域走向平台化**:2023-2024年,金融机构的Agent构建多集中在单一业务域;2025年,开始出现平台化需求,旨在共享底层算力与模型资源,实现跨系统数据拉通与业务创新 [22][23] - **实施采用“边用边备”策略**:业务适配的“厚度”积累是长线任务,金融机构倾向于从简单场景入手,通过实现短期目标来逐步推进接口开放与优化,而非一次性大量投入 [24] - **多Agent应用有其特定场景**:在一个法人机构内部,多Agent的必要性较弱,简单的串联流程可合并为一个大Agent;多Agent更适用于需要长期运行、持续探测并通知的跨机构或性质不同的任务 [29] 行业终局与厂商实践 - **终局是稳态与敏态业务分离**:未来的系统架构可能是敏态业务由Agent负责,稳态业务转变为后台的工具、资源或物料,中间由必须与垂域资源配套的AI中台进行连接 [5][33] - **通用Agent平台被高估**:脱离垂直领域深厚积累的通用Agent开发平台只是一个“空架子”,市场价值不高,其市场份额被夸大到几万亿的说法完全不正确 [4][17][35] - **幻觉问题在金融场景可控**:在用于实际“干事”的金融Agent场景中,幻觉问题(如编造接口)能够被控制,因为不存在的接口调用会失败,规划错误可通过ReAct模式修正 [25] - **恒生电子的AI落地实践**:公司AI落地包括客户侧与自身内部应用 [30] - **客户侧**:与国内头部金融机构合作,在投研、投顾、运营等场景落地专业Agent;研发基于实体地图增强的金融垂域智能体开发平台;子公司通过“语控万数”平台为Agent提供精准数据物料 [30] - **内部应用**:升级客服系统为AI自助平台「U+」;为工程实施人员提供AI知识库工具赋能;内部研发AI编程能力工具以提升效率 [30][31] - **Agent的本质是“智能地干事”**:与以往聊天或嵌入系统的copilot不同,Agent是独立存在,能够将自然语言指令作为复杂意图拆解,并调用后台不同系统、资源和数据源完成一系列动作 [32]
活动报名:25 年一二级市场年终复盘和 26 年展望|42章经
42章经· 2025-12-21 21:32
活动背景与形式 - 该讨论会由深耕国内一级市场的资深人士与熟悉硅谷二级市场的资深从业者共同主持[3] - 自2023年底起保持每隔几个月复盘一次AI市场的节奏 通过跨视角对照碰撞出超前且准确的结论[5] - 过去一年已录制三期相关播客 主题涵盖二级市场热潮、硅谷AI转向及AI泡沫探讨[5] - 自2024年秋季起 将季度复盘延伸为更小范围、更高密度的线上讨论会形式[5] - 每期活动由多位长期研究产业与投资的朋友共同主持 围绕近期重点主题进行小范围交流[5] 活动核心议题与展望 - 2025年末场活动旨在对当年一、二级市场进行复盘 并对2026年进行展望[6] - 计划共同探讨今明两年的AI关键词 包括Agent、多模态、AI硬件、具身智能、自动驾驶、大模型泡沫、OAI下一个观测点以及港股模型上市[6] - 活动时间定于北京时间2025年12月27日上午11:00[7]
2025 文章、播客合集 | 42章经
42章经· 2025-12-21 21:32
公司年度内容回顾与成果 - 2025年是公司“All in AI”战略的第三年,全年共更新22期播客和18篇文章 [2] - 公司播客订阅数增长至近11万,节目3次被小宇宙首页推荐 [2] - 公司播客“42章经”两年内粉丝突破十万,被认为是垂类播客中的头部,已发布51期节目,平均播放量达25000 [36][37] - 公司坚持深度、垂直的内容定位,不接广告,专注于服务对信息密度和认知有高要求的受众 [37][38] 行业核心观点与趋势判断 - 组织能力被严重低估,被认为是AI公司真正的核心壁垒 [3] - AI基础设施不仅是降本的后台支持,更是决定AI公司发展上限的核心战斗力 [6] - 对2025年AI发展持极度乐观态度,认为早入场和乐观的参与者往往会获得回报 [8] - 2024年末市场出现“AI有泡沫”的讨论,但认为泡沫的存在并不重要,关键在于其他因素 [34] - 创业公司在AI时代最大的机会在于设计不同的交互方式 [36] 热门技术领域探讨 - Agent是年初由Manus带火的热门赛道,但其开发的上半场焦点在于环境、工具和上下文如何决定Agent [9] - 强化学习因DeepSeek的发布成为AI从业者必修模块,其原理与人生过程有类比性 [11] - AI发展进入下半场,定义和评估的重要性日益凸显,Benchmark与Evaluation成为关键议题 [24] - Agent基础设施是继Agent应用之后的新热点领域,其中蕴藏着大量机会 [28] 公司增长与商业化路径 - 海外增长方法论强调在每个阶段聚焦做最关键的一件事 [17] - 全球化是AI创业者从第一天起就必须面对的问题,其中包含已验证的方法论和经验教训 [30] - 业务在3个月内实现10倍增长,其关键可能在于“信念感” [21] - 世界上赚钱的方式有两种:组合与拆分,这为分析AI时代提供了有趣的路径 [36] - 对250家公司的AI产品定价经验进行了总结 [36] 市场竞争与案例分析 - 复盘了2018至2020年抖音超越快手的关键三年,涉及关键决策、组织文化和一线交锋 [15] - Dify从被低估的项目成长为全球顶级的开源项目,其成功路径提供了完整答案 [22] - Mercor作为当年的明星公司,其高速增长秘诀和人才策略值得关注 [25] - Figma战胜Adobe的本质、在线强化学习的进展以及AI产品留存率等案例被深入分析 [36]
深度|DeepMind CEO Demis: AGI还需5-10年,还需要1-2个关键性突破
搜狐财经· 2025-12-21 14:05
公司战略与核心优势 - 公司将其独特优势归结为将世界级的研究、工程能力和基础设施三者结合 在AI前沿领域 同时具备这三者的机构非常少 [8] - 公司采用科学方法作为核心思维方式 并将其应用于研究、工程乃至商业领域 这构成了其工作的严谨性与精确性的来源 [7][8] - 公司在发展路径上保持务实 会追随实证证据的指引 例如在看到scaling laws显现效果后 逐步将更多资源投入到该研究路径上 [27][28] 产品与技术路线图 - 公司的核心基础模型Gemini从一开始就是多模态的 能够同时处理图像、视频、文本和音频 并越来越多地生成这些类型的输出 [10] - 接下来12个月的重点方向包括:多模态能力融合取得显著进展、视频能力与语言模型融合产生有趣的能力组合、以及开发更可靠的基于Agent的系统 [10] - 公司的长期愿景是将Gemini打造成“通用助手” 使其出现在更多设备上 并成为用户日常生活结构的一部分 提升工作效率和改善个人生活 [11] - 最新发布的Gemini 3模型在推理深度、细腻度以及“性格”上表现出色 能够简洁直接地回答 并在观点不合理时温和提出异议 [24] - Gemini 3展现出对高层次指令的深度理解能力 以及生成高度细节化输出的能力 在前端开发、网站构建和一次性生成游戏方面表现突出 [25][26] - 公司有一个名为Genie 3的“世界模型”或交互式视频模型 用户可以在生成的视频中“行走” 并在一分钟内保持整体一致性 [10] 行业竞争格局 - 在AI领域 美国和西方整体在基准测试和最先进系统方面仍处于领先地位 但这种领先优势可能仅以“月”为单位 而非“年” [21] - 中国在AI领域并未落后太多 拥有出色的模型和有能力的团队 但在算法创新和原创性方面 西方目前仍然具有优势 [21] - AI行业正经历一场可能是科技史上最激烈的竞争 [8] - AI产业某些部分可能存在泡沫 例如一些规模极其夸张的早期融资 但从长期看 AI被认为是人类历史上最具变革性的技术之一 投入将被证明是值得的 [31] - 行业人才争夺战相当激烈 但最优秀的科学家和工程师希望参与最前沿的工作 持续的技术领先地位将形成吸引力正反馈 [31] 通用人工智能发展预测 - 通用人工智能可能还需要五到十年的时间才能实现 [6][29] - 对AGI的标准设定很高 要求系统能展现出人类所具备的全部认知能力 包括发明和创造能力 并在各个维度上具备一致性 而非当前“锯齿状”的智能形态 [29] - 实现AGI可能不仅需要将现有系统的scaling能力推到极限 还需要一到两个类似Transformer或AlphaGo的范式级关键突破 [29][30] - 当前系统缺乏一些关键能力 如持续学习、在线学习、长期规划和推理能力 这些能力最终会具备 但可能需要关键性突破 [6][29] 技术应用与市场潜力 - AI在网络安全领域的应用受到高度重视 旨在用AI强化防御体系以应对网络威胁 [17] - 在商业和企业领域 随着AI变得重要 企业客户会对Agent的行为保障提出明确要求 这可能会自然地奖励那些更负责任的供应商 [18] - AI在体育领域有巨大应用潜力 因为体育拥有丰富数据并追求极致精英表现 例如AI可以优化角球进攻中球员的精确站位以增加头球进球 [35][36] - 多模态理解能力 尤其是视频理解能力被严重低估 例如Gemini能够对视频内容进行概念层面的理解和哲学解读 [22] - 像Gemini Live这样的功能 允许用户用手机摄像头对准物体获得实时协助 其多模态能力的强大尚未被充分认识 [23] 技术发展现状与挑战 - 目前基于Agent的系统还不够可靠 无法独立完成完整任务 但预计一年后会开始看到接近这一能力水平的Agent出现 [10][12] - 创新和进步的速度非常快 以至于模型的创造者可能都来不及探索现有系统十分之一的潜力 用户常常将模型能力发挥到远超内部测试的程度 [27] - 随着AI系统变得更复杂和更具自主性 存在偏离最初设定指令或目标的空间 如何确保其始终保持在安全边界内是一个活跃的研究领域 [18] - 存在AI被恶意行为者滥用的风险 例如制造病原体或对关键基础设施发动网络攻击 这是必须严密防范的场景 [15][16][17]
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 18:55
火山引擎AI业务增长与市场地位 - 截至2025年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍[1] - 在MaaS(模型即服务)市场,火山引擎已成为国内市场份额第一,全球排名第三[2] - 公司营收规模快速增长,2024年营收超过110亿元,增速远超60%;2025年营收已超过200亿元[6] 2025年AI市场核心趋势 - 多模态和Agent是2025年AI市场的关键趋势[3] - 视频生成模型的竞争焦点已从参数、时长转向能否直接产出“可发布的完整作品”,声画同步成为重要竞争因素[7][11] - 行业迭代速度极快,模型正从技术工具演变为具备社交平台潜力的创作工具[9][22] 火山引擎Force大会核心产品发布 - 模型侧发布豆包旗舰模型1.8和视频生成模型Seedance 1.5 pro[3] - 围绕Agent生态发布企业推理代工服务、强化学习平台、企业级AI Agent平台AgentKit以及HiAgent“1+N+X”智能体工作站[3] - 豆包大模型1.8采用集成策略,将LLM、VLM、Thinking等能力整合进单一模型接口,简化客户选择与集成流程[26][27] Seedance 1.5 pro视频模型的技术与商业突破 - 核心主打声画同步功能,可实现开箱即用,生成视频的嘴型匹配、情绪捕捉与画面配合度达到高可用水平[8][13] - 在中文适配、电影级运镜、动态张力及环境沉浸感方面表现突出,优于部分海外模型[13][14][15] - 通过多阶段蒸馏、量化等工程优化,模型端到端推理速度提升超过10倍,极大降低了生成成本[17][31] - 模型支持多种方言和强表演场景,适合生成可供二次创作的社交内容,与豆包、即梦等C端产品联动潜力大[21][22] 火山引擎的AI发展战略与系统工程 - 公司定位为AI Native,其基础设施、产品架构及商业模式均围绕AI云原生设计,视AI为弯道超车的关键[34] - 竞争已从模型能力比拼转向系统工程较量,重点解决企业“用不起来”的问题,涉及数据接入、任务编排、效果评估等[35] - 同步建设模型的“脑”(豆包大模型)与“手”(AgentKit),旨在降低开发门槛,提供从开发到运营的闭环解决方案[37] - 演示中企业级电商客服Agent从搭建到上线用时不足半小时,展现了效率的飞跃[38] 商业模式与成本优化创新 - 推出“AI节省计划”,通过阶梯式折扣帮助企业最高节省47%的成本[32] - 探索按“智能”交付物价值或按思考长度分段付费等新型计费模式,超越单纯的Token计费[33] - 通过工程优化不断提升MaaS服务“密度”,即在同等成本下提供更多价值[30][31] 市场渗透现状与未来展望 - 国内大约10%-20%的头部企业消耗了超过90%的Token,大模型服务渗透率不高,头部效应明显[24][25] - 预计到2030年,豆包大模型的Token调用量将比2025年末增长约100倍[24] - 公司目标是构建完整的AI基础设施和服务体系,让每个企业都能低门槛、低成本地使用先进AI能力[38]
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 18:31
火山引擎AI业务增长与市场地位 - 截至2025年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍 [3] - 2025年日均token使用量为16.4万亿 [4] - 火山引擎在MaaS(模型即服务)市场已成为国内份额第一,全球排名第三 [4] - 公司2024年营收规模超过110亿元,增速远超60%;2025年营收已超过200亿元 [8] - 预计到2030年,豆包大模型的Token调用量将比2025年末增长约100倍 [36] 大模型发展趋势:从单点能力到系统工程 - 大模型竞争已从单点能力较量进入系统工程的较量 [2] - 行业头部效应明显,约10%-20%的头部企业消耗了超过90%的Token,大模型服务渗透率不高 [36][37] - 公司提出在模型上做“减法”,将LLM、VLM、Thinking等所有模型能力集成进一个API接口,降低客户选择与集成复杂度 [38] - 模型能力的集成对基础模型要求更高,需要领先的基模作为支撑 [39] - 基础模型的能力直接决定下游应用天花板,例如豆包基础模型支撑了Seedance在语义理解、情感识别等方面的细致表现 [40][41] 视频生成模型的竞争维度与进展 - 2025年视频模型竞争焦点从卷参数、秒数,转向能否直接产出“可发布的完整作品” [10] - “声画同出”(声画同步)成为关键竞争因素,是客户的核心诉求之一 [15][28] - 火山引擎发布的视频生成模型Seedance 1.5 pro主打声画同步、开箱即用 [11] - 该模型在中文对口型匹配度、声音与人物环境适配度、沉浸感方面表现突出 [18][19] - 模型强化了对电影级运镜和动态张力的遵循,动作幅度及多镜头、多主体呈现高于行业水平 [20][25] - 通过多阶段蒸馏、量化等工程优化,Seedance 1.5 pro的端到端推理速度提升超过10倍,降低了生成成本 [28][46] Agent(智能体)工具链与生态建设 - 公司重点发布围绕Agent的工具链和生态服务,包括企业模型推理代工、强化学习平台、企业级AI Agent平台AgentKit及智能体工作站HiAgent [6] - AgentKit旨在降低开发者门槛,封装prompt工程、工具调用等底层能力,让开发者聚焦业务逻辑,并提供从创建、测试、部署到监控的完整运营闭环 [53] - 公司自身在客服、内容审核等业务中积累了Agent实践经验,并通过AgentKit对外输出 [53] - 演示案例显示,从零搭建并上线一个企业级电商客服Agent用时不到半小时 [54] - 公司目标是让每个企业都能拥有自己的AI助手,构建完整的AI基础设施和服务体系 [54] 商业化、工程优化与计费创新 - 行业通过工程优化提升MaaS服务“密度”,即在同等成本下提供更多价值 [45] - 公司推出“AI节省计划”计费模式,通过阶梯式折扣,帮助企业最高节省47%的成本 [47] - 公司认为未来计费方式不应仅按Token,而可能按交付的“智能”或思考长度分段付费 [47][48] - 公司从成立起就围绕AI云原生设计基础设施、产品架构和商业模式,将AI视为弯道超车的关键 [49][50] - AI基础设施竞争已演变为系统工程的较量,企业需要解决数据接入、任务编排、效果评估、成本控制等系列问题 [51] 内容生态与模型应用潜力 - Seedance 1.5 pro支持方言、对白和强表演场景,适合在豆包、即梦等C端产品中生成可供二次创作和分享的内容 [32] - 公司对“什么内容能火”的理解已转化为模型的训练目标 [33] - 随着视频生成模型成熟,AI生产视频将与C端产品联动,模型不仅作为技术工具,更具备演变为社交平台的潜力 [33]
AI 产业速递:从字节原动力大会看国内 AI 应用落地趋势
长江证券· 2025-12-19 17:27
报告行业投资评级 - 投资评级:看好,维持 [6] 报告的核心观点 - 从火山引擎原动力大会观察到明确的下游需求爆发趋势和模型能力的持续迭代,供需共振下看好明年行业token用量再上台阶 [2][9] - 重点关注多模态(如生图、生视频)、端侧(如AI玩具、眼镜等)、Agent等赛道的应用机会 [2][9] 事件描述与数据表现 - 2025年12月18日,火山引擎举办冬季Force原动力大会,正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro,同时发布多款新产品 [2][4] - 截至2025年12月,豆包大模型日均token使用量突破50万亿,自发布以来增长471倍,较去年同期增长超过10倍 [9] - 已有超过100家企业客户累计token使用量超过一万亿 [9] 模型能力迭代升级 - **豆包大模型1.8**:拥有更强多模态Agent能力 [9] - 升级多模态理解,单视频理解帧数从640提升至1280 [9] - 更强Agent能力,加强工具调用、长文和多轮指令遵循,同时支持OS Agent落地 [9] - 更灵活的上下文管理:支持256K,具备原生API上下文管理 [9] - **豆包视频生成模型Seedance 1.5 pro**:主要进步在于音画高精同步、支持多人多语言对白及具备影视级叙事张力 [9] 新产品与架构发布 - 全面升级AI云原生架构 [9] - 推出企业级AI Agent平台AgentKit,帮助企业打造多样的Agent,解决权限、集成等工作 [9] - 推出智能体工作站HiAgent,帮助企业管理和调度未来的数字员工 [9] - 发布多款封装完成的通用Agent,如“内容审核Agent”、“内容洞察Agent”、“客服Agent”,以降低企业特定任务的部署难度 [9] 商业模式与定价策略 - 火山引擎推出模型“节省计划”,提供阶梯折扣最高节省47% [2][9] - 模型定价思路从最初的技术调优实现单token降价,演进为根据Context区间定价,再到针对客户使用多款模型解决不同任务的习惯推出整体节省计划 [9] - 定价策略旨在使客户在token用量增大的情况下享受更优惠价格,降低创新成本 [9]
火山引擎总裁谭待:谈论Agent与APP冲突还太早
第一财经· 2025-12-19 14:51
豆包大模型业务进展 - 火山引擎发布豆包大模型1.8与音视频创作模型Seedance 1.5 pro [2] - 豆包大模型日均tokens调用量已超过50万亿,较2024年9月的30万亿有显著增长 [2] AI Agent的发展阶段与行业观点 - 行业将互联网APP对AI的针对性限制解读为“Agent时代与APP时代之间的冲突”,但公司认为行业发展仍处早期,本质是观察视角问题 [2] - AI的核心价值在于更便利、更低成本地满足用户需求,从而创造增量,例如便捷配送服务可能将咖啡需求从一天一杯升级为两杯 [2] - Agent不会淘汰Web或APP,而是会与现有载体共存互补,通过需求扩容和用户时长增加形成新格局 [2] - 当前行业对AI与Agent的探索仍处于摸索阶段,市场需求已存在但模型尚不完善,企业实践各具特色,这种状态预计还会持续三年左右 [3] - 行业“是否准备就绪”的核心在于Agent工具的完善,公司内部正投入精力将存量功能转化为Agent可识别、可调用的工具 [3] Agent的技术挑战与多模态发展 - 无论是豆包AI助手还是APP,本质都是由众多复杂Agent构成的集合,不同功能背后对应不同逻辑的Agent [4] - Agent待突破的两大核心挑战包括基础能力支撑与满足真实线上落地的健全性、运行时稳定性、弹性伸缩、数据安全等高标准要求 [4] - 多模态大模型(如Seedance 1.5 pro)的迭代标志着AI应用向更深场景发展,使AI能“看、听、说、做”,处理视觉输入与输出 [4] - 多模态模型的应用场景包括驾驶时的路况识别、产品质检以及餐饮服务中的需求响应 [4] - 多模态模型较去年已能解决非常多问题,模型进步并解锁一个领域的更迭速度非常快 [4] - 厂商之间最重要的是先将市场做大,帮助各行业AI落地更快 [4] AI时代云服务的价值与趋势 - 作为云平台,火山引擎持续强调AI时代云服务的价值 [5] - AWS管理层曾表示其生成式AI平台Bedrock目标是成为“全球最大的推理引擎”,长期潜力可与规模约400亿美元的EC2服务媲美 [5] - 公司认可该趋势,并将MaaS(模型即服务)业务发展趋势类比芯片业务:GPU出货量已超过CPU,MaaS也将从训练转向推理 [5] - 以2025年初DeepSeek带火一体机销售但最终很多人“砸”手里为例,佐证AI时代云业务的重要性 [5] - 核心原因在于AI与大模型技术快速迭代(约三个月更新一代),且Agent、AgentKit、RAG等技术产品无法私有化部署,固定算力的一体机难以支撑丰富的AI应用落地 [5] - 基于此,公司判断软件时代的私有化一体机模式在AI时代将被淘汰 [5]