AgentKit
搜索文档
OpenAI的2026:要么封神,要么破产
美股研究社· 2026-01-05 20:54
公司战略与扩张 - 公司掌舵人正通过持续抛出新概念来维持投资者与市场的亢奋,这些概念包括自研芯片、电商整合、企业咨询以及由乔尼·艾维操刀的消费级硬件 [2] - 公司正在向传统科技巨头转型,通过多种方式填补财务窟窿,包括植入广告、与Etsy和沃尔玛合作将聊天框变为收银台、进行垂直整合、开发定制芯片、推出消费级硬件以及建立企业咨询部门 [31][32][34][35][36] 财务状况与融资 - 根据泄露的财务预测,公司预计在2026年将烧掉170亿美元现金,较2025年的90亿美元大幅增加 [7] - 亏损态势预计在随后三年内不会收敛,反而继续叠加,到2029年可能累计烧掉1150亿美元 [8][20] - 自ChatGPT推出以来,公司已筹集超过600亿美元,创下私营公司历史纪录 [11] - 公司正计划在2026年进行新一轮融资,目标高达1000亿美元,可能将估值推至8300亿美元,作为对比,其2025年10月的估值约为5000亿美元 [12][13] - 潜在投资者包括亚马逊(洽谈投入100亿美元)和英伟达(暗示可能分批注资1000亿美元) [13] 营收增长与成本压力 - 2025年,公司营收据报道已触及130亿美元,年底年化率冲向200亿美元 [15] - 公司仅用两年就达成了谷歌和Facebook分别花费五年和六年达成的营收里程碑 [16] - 公司的算力需求已从2023年的200兆瓦激增至2025年的1.9吉瓦 [18] - 为满足未来野心,公司签署意向书计划增加30吉瓦算力容量,相关账单高达1.4万亿美元 [19] - 2025年上半年,公司的推理成本(运行模型回答用户问题的成本)超过了其收入,意味着用户用得越多,公司亏得越快 [29] 市场竞争与用户增长 - 斯坦福HAI研究所基准测试显示,顶尖模型间性能差距急剧缩小,谷歌发布的Gemini 3模型在多项指标上已反超公司的GPT-5.1 [25][26] - 开源模型正步步紧逼,对闭源模型构成压力 [27] - 截至12月中旬,ChatGPT月活跃用户为9.1亿,大幅领先Gemini的3.45亿,但增长引擎似乎出现熄火迹象 [27] - 德意志银行研究指出,在欧洲主要国家,ChatGPT的消费者订阅量在夏天陷入停滞 [28] - 公司管理层在12月初启动“红色警报”行动,全力修补ChatGPT的护城河 [29] 业务构成与变现 - 目前消费者业务仍是收入大头,但来自企业端(B端)的收入比例正在攀升 [37] - 尽管“红色警报”行动暂时搁置了广告项目,但内部人士确认2026年在ChatGPT中植入广告已是板上钉钉 [33] - 公司正试图通过企业咨询和AgentKit等工具,从竞争对手Anthropic那里抢夺黏性更高的企业客户 [36] 市场看法与风险隐喻 - 有投资竞争对手的风投负责人将公司比作“打了类固醇的WeWork”,暗示其在巨额债务和不切实际的增长预期下可能崩塌 [39] - 如果企业级销售不及预期,且ChatGPT无法找到更高效的变现途径,这个千亿帝国可能会迅速解体 [41] - 资本市场已开始用脚投票,与公司深度绑定的上市公司在股市和债市上遭遇惩罚 [42] - 但在一级市场,融资狂热仍在继续 [43]
《经济学人》:2026年对OpenAI来说成败攸关
美股IPO· 2025-12-30 12:48
公司财务状况与融资需求 - 公司预计2026年将烧掉170亿美元现金,高于2025年的90亿美元,且未来三年亏损将持续累积[3] - 公司已从投资者处筹集超过600亿美元资金,几乎所有资金都在ChatGPT于2022年底成名后筹集[3] - 公司“几乎肯定”会在2026年再次筹集大量资金,据报道正寻求高达1000亿美元融资,估值可能达8300亿美元,高于去年10月的5000亿美元[5] - 亚马逊正单独洽谈向公司投资至多100亿美元,英伟达也可能分批投资至多1000亿美元以帮助其采购芯片[5] - 公司已摆脱与微软的独家合作关系[5] 营收增长与成本压力 - 公司2023年营收突破10亿美元,据报道2025年营收将达到130亿美元,到年底年化营收将达到200亿美元[6] - 谷歌和Facebook分别用了五年和六年时间才实现年营收200亿美元的成就[6] - 公司计算需求从2023年的200兆瓦增长到2025年的1.9吉瓦,并已签署意向书计划未来几年新增30吉瓦计算能力,总成本约为1.4万亿美元[6] - 公司最大的成本是计算能力,且需求与收入紧密挂钩[6] - 有泄露的微软数据显示,公司2025年上半年的推理成本超过了其收入[8] 市场竞争与产品表现 - 过去一年来,最先进模型之间的性能差距已显著缩小[7] - 谷歌于去年11月发布的Gemini 3模型在许多指标上都优于公司的GPT-5.1,公司随后推出的GPT-5.2远未取得决定性胜利[7] - 开放模型(可免费获取)正在不断缩小与封闭模型之间的性能差距[7] - 截至12月中旬,ChatGPT的月活跃用户数为9.1亿,而Gemini为3.45亿,但Gemini正在迎头赶上[8] - 德意志银行研究发现,消费者对ChatGPT服务的订阅量在夏季“几乎停滞”,此后几乎没有增长[8] - 公司面临来自Anthropic等竞争对手的激烈竞争,其Claude聊天机器人尤其受程序员欢迎[9] 业务多元化与商业化战略 - 公司业务范围不断扩展,目标包括定制芯片、电子商务、商业咨询和消费设备[3] - 公司战略的一部分是开发新的技术盈利途径,计划在2026年将广告整合到ChatGPT中[9] - 公司已允许包括Etsy和沃尔玛在内的美国公司通过聊天机器人销售产品并收取费用[9] - 公司希望拓展来自企业客户的收入,建立了咨询部门帮助大型企业部署技术,并开发了如AgentKit等企业级工具[9] - 公司与芯片设计公司博通签署协议共同开发定制芯片,并聘请了乔纳森·艾维爵士开发消费级设备[10] - 公司战略包含垂直整合,灵感来源于谷歌[10] 发展势头与内部挑战 - 公司老板在12月初启动了临时“红色警报”,要求员工暂停其他项目,优先改进ChatGPT[8] - 为了减少亏损,公司可以提高价格或限制访问权限,但这将面临拖累增长的风险[8] - 公司老板曾认为随着公司发展壮大其经济效益会改善,但由于面临激烈竞争,训练成本持续攀升[7] - 一些投资者开始担忧,有风险投资家指出公司的亏损额堪比许多国家政府的财政赤字[11] - 有投资者问及公司将如何支付2025年相当于其收入100倍左右的支出承诺时,公司老板恼火地回怼[11] - 批评者将公司比作“打了兴奋剂的WeWork故事”[11]
从创新到实施:生态系统的重要性
新浪财经· 2025-12-23 13:04
Salesforce的战略重心与产品方向 - Dreamforce 2024的核心主题是“关于代理的一切”,公司将Agentforce及其最新人工智能创新置于中心舞台,以深入推动企业自动化[1][8] - 活动强调了向互操作性、连接数据、平台和工作流的战略转变,而非推出独立功能,旨在让人工智能产品组合与客户现有系统无缝协作[3][10] - 公司认识到信任、数据质量和互操作性是企业成功的关键决定因素,并将此理念融入Einstein和Agentforce等产品[4][11] 关键收购与整合举措 - 公司以约80亿美元收购Informatica,此举增加了数据管理和集成功能,旨在增强其跨系统统一客户信息的能力[4][11] - 今年早些时候对Genesys进行了后续投资,扩大了CX Cloud合作伙伴关系,该合作已支持超过250个共享客户[4][11] - 这些收购与投资表明公司专注于构建“连接层”,以使人工智能能够在复杂的企业环境中有效运行[4][11] 合作伙伴生态系统的重要性 - 公司的生态系统包括Zendesk等合作伙伴,其集成为组织提供了跨服务和销售的客户数据共享视图,这些伙伴关系扩大了公司的影响力[4][11] - 人工智能的采用取决于能够连接客户体验、数据和工作流执行的合作伙伴,从客户体验编排到数据管理,这些伙伴关系构成了使企业人工智能成为现实的连接组织[4][11] - 公司经常依靠合作伙伴来弥合基础设施和集成差距,这些差距仍有待客户解决[6][13] 行业趋势:“生态系统效应” - Omdia渠道、合作伙伴和生态系统首席分析师Jay McBain指出,一小群合作伙伴现在推动了全球IT实施收入的大部分,这被称为“生态系统效应”[5][12] - 根据Omdia全球合作伙伴1000的数据,前30家公司(包括埃森哲、德勤、IBM等)年收入约为5350亿美元,与后续970家合作伙伴的总和大致相同[5][12] - 这1000家公司合计占全球IT和专业服务收入1.07万亿美元以上,反映了企业技术价值创造方式向依赖整合与交付的转变[5][12] 行业挑战与应对 - 从合作伙伴角度看,关键问题之一是人工智能技能差距,部分合作伙伴无法向要求人工智能驱动解决方案的客户交付成果[6][13] - 行业正通过工具(如OpenAI的AgentKit)进行应对,使开发人员和合作伙伴更容易连接工具并构建能在企业环境中实际工作的代理[6][13] - 行业重点已从推出新功能转向实现可衡量的成果,这突显了合作伙伴准备和集成成熟度日益增长的重要性[5][12]
2家“中国OpenAI”排队上市
36氪· 2025-12-22 20:02
行业资本化进程 - 中国大模型公司智谱于12月19日通过港交所聆讯,正式冲击IPO [1] - 两天后,另一家大模型公司MiniMax(稀宇科技)也通过聆讯,争夺全球大模型第一股 [2] - 无论哪家先上市,都将在资本化程度上领先于OpenAI等美国大模型巨头 [3] 行业估值逻辑与对比 - 市场存在一种估值逻辑,即国产大模型有1%的概率成为OpenAI,其估值可参照OpenAI估值的1% [4] - OpenAI正洽谈千亿美元融资,估值可能达8300亿美元,其1%为83亿美元(约584亿元人民币) [7] - MiniMax在2024年7月完成近3亿美元融资后估值约300亿元人民币;智谱累计融资数十轮,2024年融资超30亿元,估值在300-400亿元人民币区间,均远低于OpenAI估值的1% [7] - 差距巨大的原因在于OpenAI是技术定义者和领导者,创造了多个新赛道,覆盖全模态,且商业化能力强劲 [7] - OpenAI预计2024年总营收达130亿美元(约915.1亿元人民币),覆盖全球200多个国家,拥有8亿周活用户、超5000万付费用户、100万家企业用户 [7] 公司业务模式与市场地位 - 智谱成立于2019年,核心团队来自清华大学,于2022年推出千亿级大模型GLM-130B [10] - 智谱营收主要来自B端和G端客户,通过MaaS平台提供AI模型服务 [11] - 本地化部署服务面向大型企业和政府机构,占总营收的84.5% [12] - 云端部署服务按使用量收费,适合中小企业 [13] - 截至2025年上半年,智谱拥有超8000家机构客户,包括金山办公、智联招聘、蒙牛等,并承接了杭州城投、京西智谷等政府项目 [14] - 2024年智谱总营收3.12亿元人民币,在中国大语言模型厂商中排名第二,市占率6.6%,超过阿里巴巴 [15] - OpenAI在一份分析报告中明确将智谱定义为AI产业全球化的对手 [16] - MiniMax成立于2021年,团队385人,平均年龄29岁,押注文本、语音、视觉和视频四大模态研发 [18] - MiniMax形成B端和C端两大业务线,C端产品包括海螺AI和星野(talkie) [18] - 海螺AI在2025年3月的全球Top 50 AI应用榜单(Web端)中位列第12名,登顶AI视频赛道 [18] - 星野的海外版talkie全球月活达1100万,其中50%用户来自美国 [20] - MiniMax的路线与OpenAI更相似,都押注多模态、走全球化路线、侧重C端 [20] 公司财务表现与竞争态势 - 2025年上半年,智谱收入1.9亿元人民币,超过2023年全年水平,但净亏损达23.58亿元人民币 [21] - 2025年前三季度,MiniMax总营收5344万美元(约3.76亿元人民币),同比暴涨175%,净亏损5.12亿美元(约36亿元人民币) [21] - 智谱优势在于依赖B端大客户,营收稳定,但易受政府政策影响及面临项目延期风险 [21] - MiniMax优势在于C端产品变现渠道更多元,全球化潜力大,但需与字节、阿里、腾讯等巨头竞争 [21] - 到2025年底,中国大模型“六小虎”战略重心发生变化,普遍放弃全栈通用幻想,转向细分赛道落地 [22] - 除智谱和MiniMax外,Kimi回归技术深耕,百川智能转向医疗垂直领域,阶跃星辰聚焦终端Agent,零一万物转向企业定制化部署解决方案 [21][22]
科创板块全线回暖!广发基金科创50、科创100、科创200及科创成长等ETF全产品矩阵,助力布局科创板硬科技龙头标的
新浪财经· 2025-12-22 14:34
市场表现与资金动向 - 2025年12月22日早盘,三大指数集体高开,海南自贸区、CPO、半导体等板块领涨 [1] - 截至2025年12月22日午间收盘,上证科创板50成份指数强势上涨1.95% [4] - 科创50ETF龙头(588060)上涨1.80%,盘中最高涨超2% [4] - 科创100ETF广发(588980)上涨2.13% [4] - 科创200ETF广发(588140)上涨2.25% [5] - 科创成长ETF(588110)上涨2.11% [6] - 双创50ETF增强(588320)上涨2.28% [6] - 成分股表现突出:拓荆科技上涨6.98%,中芯国际上涨6.49%,盛美上海上涨6.11%,微导纳米上涨10.62%,精智达上涨17.22%,鼎通科技上涨10.22% [4][5][6] - 截至2025年12月19日,科创50ETF龙头近2周规模增长1.77亿元,最新份额达91.75亿份创近3月新高,最新资金净流入2508.16万元,近5个交易日内有4日资金净流入合计1.11亿元 [4] 宏观与政策环境 - 中长期来看中国权益市场具备结构性机遇,企业盈利改善、资金配置转移及政策制度优化将成为主要驱动力 [1] - 美国11月失业率小幅攀升至4.6%,创下2021年9月以来最高水平,10月非农就业人数减少10.5万人 [1] - 美国就业数据印证了此前降息25个基点的决策是合理的,随着货币宽松、财政政策以及贸易不确定性的缓解,加上AI支出作为新增长引擎,预示着2026年宏观背景或将更加有利 [1] - 12月政治局会议、中央经济工作会议陆续召开部署2026年经济工作,延续“坚定信心、用好优势、应对挑战”总基调,2026年经济工作有8大重点任务,扩内需重回首位 [3] 行业趋势与投资主题 - 全球百年未有之大变局加速演进,国内经济底层逻辑转向新质生产力,人工智能、具身智能、新能源、可控核聚变、量子科技、航空航天等“十五五”重点领域值得关注 [1] - AI算力需求持续扩张推动光模块产业景气度上行,800G产品已进入量产放量期,1.6T产品正成为数据中心突破系统瓶颈的关键路径 [2] - 自2025年起,1.6T将从验证期进入规模化部署阶段,其带宽翻倍、光纤减半、TCO下降等优势使其成为下一代算力网络主流方向,有望开启高速互联产业链的第二轮价值重估周期 [2] - 全球云厂商资本开支延续上行通道,叠加AI集群扩容与新一代算力平台放量,构成核心驱动力 [2] - 科技行业更受益于政策导向,中央经济工作会议明确将科技发展“更交给市场”,重点聚焦京津冀、长三角、粤港澳三大区域,并长期投资于人才 [3] - 科技领域需关注平台经济催生的新需求、新就业形态,以及科技金融服务创新,科技(尤其是AI强产业趋势)被列为十五五规划第一任务中的重点细分领域 [3] 公司动态与产品进展 - 火山引擎在2025冬季FORCE原动力大会上围绕智能体(Agent)的规模化生产与应用落地进行了系统化升级,推出新一代Responses API、上线Serverless RL平台,并增强VikingDB向量数据库及记忆库功能,同时发布并升级了企业级AI Agent平台底座AgentKit [2] - 该全链路支撑体系有效降低企业拼装与集成成本,清晰界定工程边界,确立可预期的上线路径,助力开发团队更聚焦于业务价值创造 [2] ETF产品概况 - 科创50ETF龙头(588060)紧密跟踪上证科创板50成份指数,由科创板中市值大、流动性好的50只证券组成,定位科创板“硬科技龙头”标杆 [7] - 科创100ETF广发(588980)、科创100ETF增强指数基金(588680)紧密跟踪上证科创板100指数,聚焦科创板中市值中等、流动性较好的100家企业,与科创50形成互补,定位科创板“中盘成长新锐”代表,其中科创100ETF增强指数基金(588680)采用量化增强策略力求实现超额收益 [7] - 科创200ETF广发(588140)紧密跟踪上证科创板200指数,选取市值较小且流动性较好的200只证券,反映科创板中小市值企业的整体表现,行业高度集中于信息技术、工业和医药卫生等硬科技领域 [7] - 科创成长ETF(588110)紧密跟踪上证科创板成长指数,选取业绩指标增长率较高的50只上市公司证券,反映科创板具有高成长特征的上市公司证券的整体表现,聚焦“业绩高增长”优质标的 [8] - 双创50ETF增强(588320)紧密跟踪中证科创创业50指数,一键布局科创板与创业板50只头部科技公司,采用量化优化策略争取超越基准 [8] - 市场普遍认为科创板块ETF具有打包投资一篮子科创板龙头股票、当日涨跌幅限制±20%、开户门槛低、盘中交易便利等特点 [6]
火山引擎FORCE大会追踪(2):Agent规模化落地,方舟与企业底座升级
海通国际证券· 2025-12-21 22:15
报告行业投资评级 - 报告未明确给出对火山引擎或其所属行业的投资评级 [1] 报告核心观点 - 火山引擎通过其产品组合将智能体(Agent)从概念探讨转向工程化与规模化落地,构建了覆盖模型服务、训练优化、上下文与记忆管理、企业级底座与治理以及开发提效工具的全链路支撑体系 [2] - 该平台化整合方案为企业客户提供了明确价值:有效降低拼装与集成成本,清晰界定工程边界,并确立可预期的上线路径,从而助力开发团队更聚焦于业务价值创造 [2] - 火山引擎正通过日益完善的产品矩阵与体系化的生态运营,在技术快速迭代的窗口期内,助力开发者将创新高效、稳健地转化为可衡量的业务价值 [6] 根据相关目录分别进行总结 火山方舟平台关键升级 - 发布新一代Responses API,支持单次请求内完成多轮上下文承接、多工具协调与结果归总,显著减少了传统方案中多次交互与复杂胶合代码带来的开销 [3] - 发布开发者模式,通过节点化、可追踪、可展开的工具调用链路,将智能体决策过程由黑箱转为可观测、可调试的资产,提升了问题定位效率 [3] - 现场披露的量化效果显示,在部分场景中,平均回复时延降低约20%,失败率下降约75% [3] - 借助上下文缓存,端到端时延可降低约50%,成本节约超过80%,会话缓存命中率可达85%–93% [3] 企业级规模化落地支持体系 - 发布并升级AgentKit企业级AI Agent平台底座,以模块化架构覆盖开发、部署、运维、监控与安全等环节 [1][4] - AgentKit突出零信任身份管控、存量API资产工具化、既有知识向智能体体系迁移及开箱即用评测能力,旨在解决企业当前的核心瓶颈——在不重构系统的前提下,实现既有资产安全、可控、可评估地被智能体调度 [4] - 发布TRAE CN企业版,为企业AI编码提供稳定性、适配性与安全性更强的工程底座,支持超大规模代码库索引、毫秒级响应及全链路加密传输,并以云端零存储策略保障数据合规 [1][4] - 增强VikingDB向量数据库及Viking记忆库的功能,结合其递进式检索、图文记忆与知识整合能力,为企业实现知识高效入模、上下文精准供给、抑制幻觉及结果可溯源提供了系统化的工程落地路径 [1][4] 开发者生态与增长动能 - 产品层面,扣子平台月活跃开发者已超300万,TRAE月活用户突破160万,表明其开发者生态已具备显著的规模基础与用户粘性 [5] - 生态运营层面,将原有开发者社区升级为专注Agent的开发者社区,并同步上线动手实验室、核心开发者计划及城市社区等系列生态支持举措 [1][5] - 城市社区已在北京、上海、深圳、成都四地试点,并计划于2026年扩展至全国十余城,旨在将发布会上的短期热度转化为持久的开发与实践闭环 [5]
OpenAI,65倍,8300亿美元
格隆汇· 2025-12-20 19:39
核心观点 - OpenAI计划进行新一轮1000亿美元融资,若成功其估值将飙升至8300亿美元,较两天前的5000亿美元估值大幅提升[1] - 公司估值基于其技术护城河、爆发式增长的变现能力、对通用人工智能的长期预期以及巨额资本开支需求,呈现典型的“买未来”逻辑[3][7][11][12] 估值与财务表现 - 按8300亿美元估值和2025年预计127亿美元营收计算,公司市销率高达65倍[2][3] - 2024年公司营收为37亿美元,预计2025年营收将达127亿美元,同比增长243%[6] - 乐观预计到2029年公司营收将达到1000亿美元,凯基亚洲预测2030年营收可能达到2000亿美元[7][8] - 若以2029年1000亿美元营收预期为基准,8300亿美元估值对应的市销率仅为8.3倍[9] - 公司预计2026年将亏损140亿美元,2023-2028年累计亏损可能高达440亿美元[23] 技术优势与护城河 - GPT-5采用自适应多模型系统,通过双轨设计和实时路由器,将算力浪费降低了40%[3] - GPT-5的输入token价格比GPT-4o降低了50%,结合折扣缓存机制使B端API调用成本减半,推动Codex代码模型使用量在两个月内暴涨10倍[3] - 正在研发的“递归自改进”技术旨在让模型自主优化升级,无需人类标注即可迭代[3] - 巴克莱银行测算,“递归自改进”技术落地后,GPT-6的训练效率将提升10倍[3] 收入构成与增长动力 - **C端订阅**:8.1亿月活用户中,5%的付费率贡献了近80亿美元收入,付费率有望继续上升[7] - 印度市场有7300万免费日活用户,若后期10%转化为付费用户,年营收可再增加17.5亿美元[7] - **B端服务**:拥有100万家企业客户、700万个商业席位,同比增长9倍[7] - 企业版定价已从2万美元/年飙升至20万美元/年,仍供不应求[7] - **生态抽成**:通过ChatGPT即时结账功能抽取1%-3%佣金,预计2026-2030年仅免费用户带来的商业抽成就能达1100亿美元[7] 资本需求与支出规划 - 新一轮融资目标为1000亿美元,其中430亿美元(占43%)将作为“递归自改进”技术的专项基金[3][14] - 训练前沿模型的成本已飙升至数十亿甚至上百亿美元级别[13] - GPT-6的算力需求是GPT-5的5倍,需要至少12.5万个H200 GPU,硬件成本高达50亿美元[14] - Sora 3视频模型的训练数据量计划从1000万小时增至1亿小时,数据采购成本至少80亿美元[14] - 计划投入近1000亿美元自建数据中心,打造“AI超级工厂”,目标在2030年实现算力自给自足[16] - 自建数据中心预计能将PUE值压到1.1以下,比向云厂商采购节省30%成本[16] - 巴克莱测算,OpenAI 2024-2030年算力总支出将超过4500亿美元,2028年峰值达1100亿美元[16] - 未来可能效仿AWS出租算力,按2030年全球算力需求测算,该业务能新增500亿美元营收[16] 人才竞争与激励 - 谷歌给AI研究员的年薪达150万美元,比OpenAI高25%[21] - 公司计划砸200亿美元用于股票薪酬,为核心工程师补发股票以弥补限制性股票单位兑现价较估值倒挂30%的差额[21] - 为新挖来的DeepMind前研究员提供高达1000万美元的签字费[21] - 按计划到2030年,员工持股总价值将达500亿美元[21] 投资者与战略考量 - 传闻软银承诺投资300亿美元,甚至不惜卖掉英伟达股票来筹钱[25] - 中东石油资本(如阿联酋MGX)也在寻求投资,将其视为对未来科技话语权的布局[25] - 微软已拥有OpenAI 49%的利润分红权,此次融资可能也是公司管理层进行“去微软化”博弈、引入更多巨头以稀释微软控制权的举措[26]
豆包大模型日均调用量突破50万亿tokens 火山引擎深化AI时代Agent生态变革
新浪财经· 2025-12-20 04:27
核心观点 - 火山引擎发布豆包大模型1.8与音视频创作模型Seedance 1.5 pro,其大模型在多模态理解、生成及Agent能力上已跻身全球第一梯队,并展示了强劲的用户增长与商业化进展 [3] - 公司通过技术创新与成本优化,致力于降低人工智能技术门槛,推动AI普惠化落地,并认为大模型市场未来增长空间广阔,焦点在于共同开拓而非存量竞争 [3][6] - 公司正构建从模型能力到AI云原生基础设施的全面能力,以支持企业级Agent从开发到规模化运营,加速AI在各行各业的深度落地 [9][10] 豆包大模型1.8的技术升级与能力 - 模型定位从知识库转向执行器,针对多模态Agent场景进行定向优化,增强了工具调用、复杂指令遵循及OS Agent能力 [3][4] - 多模态理解能力实现飞跃,单次视频理解帧数从640帧提升至1280帧,支持以低帧率理解超长视频并调用工具进行高帧率关键片段分析 [4] - 在视频运动理解、复杂空间理解、文档OCR能力方面均有提升 [5] - 支持256K长上下文窗口,可通过API进行上下文管理,以更好地支持长程Agent任务 [5] - 通过更大的图片转tokens压缩比和思考长度可调节优化,在提升效果的同时进一步优化了成本 [5] - 在多项公开评测中表现强劲,在视觉推理、通用视觉问答、空间理解及视频理解等任务中获最佳或接近最佳成绩,在通用智能体测评集BrowseComp上全球领先,数学与推理等基础能力接近全球顶尖通用模型 [6] 豆包大模型的商业化进展与市场策略 - 截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍 [3] - 目前已有超过100家企业客户累计token使用量超过1万亿 [3] - 公司认为大模型市场明年规模能再扩大10倍,各方焦点在于携手开拓增长空间而非存量竞争 [6] - 发布了豆包助手API,将对话、思考、搜索等核心能力开放,帮助企业开箱即用或构建自定义豆包 [10] - 推出了业内首个全模型参与抵扣的AI节省计划,基于承诺用量提供阶梯式折扣,最高能帮助企业节省47%的成本 [10] 音视频创作模型Seedance 1.5 pro的创新 - 采用创新的原生音视频联合生成架构,能同时处理环境音、背景音乐和人声对白,实现毫秒级音画同步,解决了口型对不上、音画脱节的问题 [7] - 支持多人多语言对话,口型对齐精准,覆盖中文方言、英文及小语种 [7] - 在运动细节捕捉和人物情绪呈现上达到影视级标准,具备自发的镜头调度能力,可执行长镜头跟随、希区柯克变焦等高难度专业运镜 [7] - 即将上线“Draft样片”功能,可生成低分辨率样片预览,据测算可帮助创作者提升65%的整体效率,并减少60%的无效创作成本 [8] - 个人用户已在豆包、即梦AI等平台可体验,企业用户自12月23日起可通过火山引擎API接入服务 [8] AI云原生架构与企业级Agent生态 - 传统的IT架构已无法满足Agent时代需求,以模型为中心的AI云原生架构正在形成并围绕Agent开发与运营进行重构 [9] - 在企业Agent开发层面,全面升级了企业级AI Agent平台AgentKit,覆盖Agent从开发、部署到管控的全生命周期 [9] - 在企业Agent运营层面,推出了HiAgent智能体工作站,构建统一的企业AI任务调度中心,提供开箱即用的通用智能体并支持个性化定制,2025年累计服务数百家行业头部企业 [9] - 企业Agent应用正发生关键跨越:平均一家企业投产的智能体数量从2024年的几十个增至2025年的200多个,个别企业甚至超过千个;应用场景从to C娱乐延伸到to B的严肃生产场景 [10] - 小米集团案例显示,AI云原生架构帮助其手机业务将资源交付周期从一周缩短到10分钟以内,并帮助汽车业务提升训练稳定性和仿真效率,缩短算法迭代和上车周期 [9]
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 18:55
火山引擎AI业务增长与市场地位 - 截至2025年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍[1] - 在MaaS(模型即服务)市场,火山引擎已成为国内市场份额第一,全球排名第三[2] - 公司营收规模快速增长,2024年营收超过110亿元,增速远超60%;2025年营收已超过200亿元[6] 2025年AI市场核心趋势 - 多模态和Agent是2025年AI市场的关键趋势[3] - 视频生成模型的竞争焦点已从参数、时长转向能否直接产出“可发布的完整作品”,声画同步成为重要竞争因素[7][11] - 行业迭代速度极快,模型正从技术工具演变为具备社交平台潜力的创作工具[9][22] 火山引擎Force大会核心产品发布 - 模型侧发布豆包旗舰模型1.8和视频生成模型Seedance 1.5 pro[3] - 围绕Agent生态发布企业推理代工服务、强化学习平台、企业级AI Agent平台AgentKit以及HiAgent“1+N+X”智能体工作站[3] - 豆包大模型1.8采用集成策略,将LLM、VLM、Thinking等能力整合进单一模型接口,简化客户选择与集成流程[26][27] Seedance 1.5 pro视频模型的技术与商业突破 - 核心主打声画同步功能,可实现开箱即用,生成视频的嘴型匹配、情绪捕捉与画面配合度达到高可用水平[8][13] - 在中文适配、电影级运镜、动态张力及环境沉浸感方面表现突出,优于部分海外模型[13][14][15] - 通过多阶段蒸馏、量化等工程优化,模型端到端推理速度提升超过10倍,极大降低了生成成本[17][31] - 模型支持多种方言和强表演场景,适合生成可供二次创作的社交内容,与豆包、即梦等C端产品联动潜力大[21][22] 火山引擎的AI发展战略与系统工程 - 公司定位为AI Native,其基础设施、产品架构及商业模式均围绕AI云原生设计,视AI为弯道超车的关键[34] - 竞争已从模型能力比拼转向系统工程较量,重点解决企业“用不起来”的问题,涉及数据接入、任务编排、效果评估等[35] - 同步建设模型的“脑”(豆包大模型)与“手”(AgentKit),旨在降低开发门槛,提供从开发到运营的闭环解决方案[37] - 演示中企业级电商客服Agent从搭建到上线用时不足半小时,展现了效率的飞跃[38] 商业模式与成本优化创新 - 推出“AI节省计划”,通过阶梯式折扣帮助企业最高节省47%的成本[32] - 探索按“智能”交付物价值或按思考长度分段付费等新型计费模式,超越单纯的Token计费[33] - 通过工程优化不断提升MaaS服务“密度”,即在同等成本下提供更多价值[30][31] 市场渗透现状与未来展望 - 国内大约10%-20%的头部企业消耗了超过90%的Token,大模型服务渗透率不高,头部效应明显[24][25] - 预计到2030年,豆包大模型的Token调用量将比2025年末增长约100倍[24] - 公司目标是构建完整的AI基础设施和服务体系,让每个企业都能低门槛、低成本地使用先进AI能力[38]
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 18:31
火山引擎AI业务增长与市场地位 - 截至2025年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍 [3] - 2025年日均token使用量为16.4万亿 [4] - 火山引擎在MaaS(模型即服务)市场已成为国内份额第一,全球排名第三 [4] - 公司2024年营收规模超过110亿元,增速远超60%;2025年营收已超过200亿元 [8] - 预计到2030年,豆包大模型的Token调用量将比2025年末增长约100倍 [36] 大模型发展趋势:从单点能力到系统工程 - 大模型竞争已从单点能力较量进入系统工程的较量 [2] - 行业头部效应明显,约10%-20%的头部企业消耗了超过90%的Token,大模型服务渗透率不高 [36][37] - 公司提出在模型上做“减法”,将LLM、VLM、Thinking等所有模型能力集成进一个API接口,降低客户选择与集成复杂度 [38] - 模型能力的集成对基础模型要求更高,需要领先的基模作为支撑 [39] - 基础模型的能力直接决定下游应用天花板,例如豆包基础模型支撑了Seedance在语义理解、情感识别等方面的细致表现 [40][41] 视频生成模型的竞争维度与进展 - 2025年视频模型竞争焦点从卷参数、秒数,转向能否直接产出“可发布的完整作品” [10] - “声画同出”(声画同步)成为关键竞争因素,是客户的核心诉求之一 [15][28] - 火山引擎发布的视频生成模型Seedance 1.5 pro主打声画同步、开箱即用 [11] - 该模型在中文对口型匹配度、声音与人物环境适配度、沉浸感方面表现突出 [18][19] - 模型强化了对电影级运镜和动态张力的遵循,动作幅度及多镜头、多主体呈现高于行业水平 [20][25] - 通过多阶段蒸馏、量化等工程优化,Seedance 1.5 pro的端到端推理速度提升超过10倍,降低了生成成本 [28][46] Agent(智能体)工具链与生态建设 - 公司重点发布围绕Agent的工具链和生态服务,包括企业模型推理代工、强化学习平台、企业级AI Agent平台AgentKit及智能体工作站HiAgent [6] - AgentKit旨在降低开发者门槛,封装prompt工程、工具调用等底层能力,让开发者聚焦业务逻辑,并提供从创建、测试、部署到监控的完整运营闭环 [53] - 公司自身在客服、内容审核等业务中积累了Agent实践经验,并通过AgentKit对外输出 [53] - 演示案例显示,从零搭建并上线一个企业级电商客服Agent用时不到半小时 [54] - 公司目标是让每个企业都能拥有自己的AI助手,构建完整的AI基础设施和服务体系 [54] 商业化、工程优化与计费创新 - 行业通过工程优化提升MaaS服务“密度”,即在同等成本下提供更多价值 [45] - 公司推出“AI节省计划”计费模式,通过阶梯式折扣,帮助企业最高节省47%的成本 [47] - 公司认为未来计费方式不应仅按Token,而可能按交付的“智能”或思考长度分段付费 [47][48] - 公司从成立起就围绕AI云原生设计基础设施、产品架构和商业模式,将AI视为弯道超车的关键 [49][50] - AI基础设施竞争已演变为系统工程的较量,企业需要解决数据接入、任务编排、效果评估、成本控制等系列问题 [51] 内容生态与模型应用潜力 - Seedance 1.5 pro支持方言、对白和强表演场景,适合在豆包、即梦等C端产品中生成可供二次创作和分享的内容 [32] - 公司对“什么内容能火”的理解已转化为模型的训练目标 [33] - 随着视频生成模型成熟,AI生产视频将与C端产品联动,模型不仅作为技术工具,更具备演变为社交平台的潜力 [33]