Workflow
豆包助手API
icon
搜索文档
盘点2025:模型服务,成为基础设施
第一财经· 2025-12-30 18:15
全球MaaS市场格局与火山引擎的崛起 - 截至2025年10月,全球MaaS市场前三名为OpenAI、谷歌云、火山引擎,市场份额分别为31%、19%、15%,三家合计占据全球市场65%的份额[1] - 火山引擎以30万亿日均Tokens调用量位居全球第三,仅次于OpenAI的70万亿和谷歌云的43万亿[3] - 火山引擎是前三名中唯一的中国厂商,正凭借MaaS服务在AI云市场快速突围[3] 火山引擎的增长与市场地位 - 2025年,火山引擎实现100%的同比增长,营收超过200亿人民币[6] - 由于MaaS商业化和模型迭代超预期,公司原计划于2030年实现的1000亿营收目标被上调了百分之几十[6] - 2025年上半年,火山引擎在中国公有云大模型服务市场份额扩大至49.2%,意味着中国公有云上每产生两个tokens就有一个由其生产[14] - 在Gartner 2025年度全球《AI应用开发平台魔力象限》中,火山引擎领跑“挑战者”象限,其“执行能力”位列全球第五、中国第一[14] 关键增长驱动与战略举措 - 2024年5月15日,火山引擎推出豆包大模型API服务,通过技术创新将主力模型定价从“分计价”拉入“厘计价”时代,降幅高达99.3%,引发了行业降价潮并推动了市场“从无到有”般的增长[6] - 2025年2月1日,DeepSeek-R1登陆火山方舟,模型推理服务全面爆发,火山引擎成为市场上吃到最多DeepSeek推理服务红利的云厂商[7] - 豆包大模型与DeepSeek的爆红,共同催生了中国MaaS市场,IDC报告显示2024年7月和2025年2月是中国公有云大模型调用量月度环比增长率最高的两个拐点[8][10] - 豆包大模型调用量呈指数增长,推出不到600天,其最新日均调用量已达63万亿Tokens[3][4] 产品迭代与调用量增长的正循环 - 2025年6月以来,豆包大模型家族密集发布了1.6、1.8版本以及视频生成、图像编辑、语音、图像创作等多个模型,每次模型能力提升都解锁了更多应用场景并带动调用量增长[10] - 伴随模型发布节奏,几乎每3个月模型调用就会迎来一次更陡峭的增长[11] - 公司认为,大的模型调用量能打磨出更好的模型和基础设施,来自B端场景的真实反馈可以指导下一代模型的训练路线图[15][16][18] - 大规模调用量能迭代出更极致的基础设施,优化推理成本,例如通过PD分离、xLLM推理框架等方式在2024年5月大幅降低模型推理价格[18] - MaaS服务已成为火山引擎增长最快、毛利最高的AI云计算产品,参照DeepSeek公布的推理服务最高成本利润率可达545%[18] 字节跳动的技术溢出与协同优势 - 火山引擎63万亿日均Tokens调用量的用户基础,部分来源于字节跳动的溢出效应[20] - 公司受益于B端和C端的极致协同,字节跳动的C端产品(如豆包App)拥有大量用户并大规模调用模型,这帮助火山引擎优化服务,同时豆包App也成为向企业客户展示能力的窗口[20][21] - 字节跳动内部50多个业务线在AI实践上走得更靠前,尝试了众多Agent,这为火山引擎提供了宝贵的认知和know-how[23] - 云计算是规模体系的比拼,火山引擎的崛起得益于字节跳动庞大的业务体系托举和技术外溢,这与AWS、谷歌、阿里等头部云厂商的路径类似[24] - 字节跳动通过火山引擎持续把新模型、新技术开放给企业客户,以在更大市场经受检验[24][25] 未来战略:从MaaS到AI云原生 - 在取得MaaS份额第一后,火山引擎的战略目标依旧是MaaS优先[27] - 公司致力于降低AI应用门槛,通过更高层次的封装和成本优化加速AI普惠[27] - 在基础MaaS层,追求模型效果更好、成本更低、易用性更高,并推出了Prompt Pilot、Model Router和Responses API等工具[27] - 在更底层,推出了模型的推理代工服务,客户可将自己的模型托管在火山方舟上,无需自建基础设施[27] - 随着应用迈向以Agent为技术主体,公司正构建以模型为中心的AI云原生架构,MaaS是使用模型的最佳方式,云平台和中间件进一步把Tokens组装成Agents[28] - 作为国内率先推出Agent开发、运营全套产品的云厂商,火山引擎已将豆包助手API、即梦API对外提供服务[30] - Agent的商业逻辑从tokens调用的IT预算,转向类似BPO(人力外包)的角度,市场天花板有望扩大很多倍[30]
豆包大模型日均调用量突破50万亿tokens 火山引擎深化AI时代Agent生态变革
新浪财经· 2025-12-20 04:27
核心观点 - 火山引擎发布豆包大模型1.8与音视频创作模型Seedance 1.5 pro,其大模型在多模态理解、生成及Agent能力上已跻身全球第一梯队,并展示了强劲的用户增长与商业化进展 [3] - 公司通过技术创新与成本优化,致力于降低人工智能技术门槛,推动AI普惠化落地,并认为大模型市场未来增长空间广阔,焦点在于共同开拓而非存量竞争 [3][6] - 公司正构建从模型能力到AI云原生基础设施的全面能力,以支持企业级Agent从开发到规模化运营,加速AI在各行各业的深度落地 [9][10] 豆包大模型1.8的技术升级与能力 - 模型定位从知识库转向执行器,针对多模态Agent场景进行定向优化,增强了工具调用、复杂指令遵循及OS Agent能力 [3][4] - 多模态理解能力实现飞跃,单次视频理解帧数从640帧提升至1280帧,支持以低帧率理解超长视频并调用工具进行高帧率关键片段分析 [4] - 在视频运动理解、复杂空间理解、文档OCR能力方面均有提升 [5] - 支持256K长上下文窗口,可通过API进行上下文管理,以更好地支持长程Agent任务 [5] - 通过更大的图片转tokens压缩比和思考长度可调节优化,在提升效果的同时进一步优化了成本 [5] - 在多项公开评测中表现强劲,在视觉推理、通用视觉问答、空间理解及视频理解等任务中获最佳或接近最佳成绩,在通用智能体测评集BrowseComp上全球领先,数学与推理等基础能力接近全球顶尖通用模型 [6] 豆包大模型的商业化进展与市场策略 - 截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍 [3] - 目前已有超过100家企业客户累计token使用量超过1万亿 [3] - 公司认为大模型市场明年规模能再扩大10倍,各方焦点在于携手开拓增长空间而非存量竞争 [6] - 发布了豆包助手API,将对话、思考、搜索等核心能力开放,帮助企业开箱即用或构建自定义豆包 [10] - 推出了业内首个全模型参与抵扣的AI节省计划,基于承诺用量提供阶梯式折扣,最高能帮助企业节省47%的成本 [10] 音视频创作模型Seedance 1.5 pro的创新 - 采用创新的原生音视频联合生成架构,能同时处理环境音、背景音乐和人声对白,实现毫秒级音画同步,解决了口型对不上、音画脱节的问题 [7] - 支持多人多语言对话,口型对齐精准,覆盖中文方言、英文及小语种 [7] - 在运动细节捕捉和人物情绪呈现上达到影视级标准,具备自发的镜头调度能力,可执行长镜头跟随、希区柯克变焦等高难度专业运镜 [7] - 即将上线“Draft样片”功能,可生成低分辨率样片预览,据测算可帮助创作者提升65%的整体效率,并减少60%的无效创作成本 [8] - 个人用户已在豆包、即梦AI等平台可体验,企业用户自12月23日起可通过火山引擎API接入服务 [8] AI云原生架构与企业级Agent生态 - 传统的IT架构已无法满足Agent时代需求,以模型为中心的AI云原生架构正在形成并围绕Agent开发与运营进行重构 [9] - 在企业Agent开发层面,全面升级了企业级AI Agent平台AgentKit,覆盖Agent从开发、部署到管控的全生命周期 [9] - 在企业Agent运营层面,推出了HiAgent智能体工作站,构建统一的企业AI任务调度中心,提供开箱即用的通用智能体并支持个性化定制,2025年累计服务数百家行业头部企业 [9] - 企业Agent应用正发生关键跨越:平均一家企业投产的智能体数量从2024年的几十个增至2025年的200多个,个别企业甚至超过千个;应用场景从to C娱乐延伸到to B的严肃生产场景 [10] - 小米集团案例显示,AI云原生架构帮助其手机业务将资源交付周期从一周缩短到10分钟以内,并帮助汽车业务提升训练稳定性和仿真效率,缩短算法迭代和上车周期 [9]
AI日报丨字节宣布AI节省计划,微软、谷歌等24家公司加入美国政府的人工智能“创世使命”
美股研究社· 2025-12-19 23:26
AI行业动态与市场趋势 - 人工智能技术正以前所未有的速度发展,带来了广泛的机会 [3] - 韩国政府计划今后五年内在人工智能等硬科技领域孵化1万家初创企业 [5] - 韩国计划打造50家独角兽和"十角兽"企业,并推动企业对接年规模约40万亿韩元(约合1904亿元人民币)的全球风险投资市场 [6] 主要科技公司AI进展 - 火山引擎宣布AI节省计划正式发布,旨在帮助企业降低AI使用成本,最高可节省47%的使用成本 [5] - 腾讯官方声明澄清,所有带有"内容由AI生成"标识的评论均为元宝AI独立生成,无人工运营团队参与轮班 [5] - Meta Platforms正在研发代号为Mango的新型图像及视频AI模型,以及下一代文本大语言模型,预计将于2026年上半年发布 [9] - 包括OpenAI、微软、英伟达、Amazon Web Services和Alphabet子公司谷歌在内的24家顶尖AI公司已同意加入美国联邦政府的"创世使命"计划 [10] 投资与融资活动 - 谷歌与英伟达旗下风投部门参与投资瑞典"氛围编程"初创公司Lovable的B轮融资,融资金额3.3亿美元,公司投后估值达66亿美元 [13] - Lovable公司2025年累计融资额突破5亿美元,估值较今年7月上一轮融资时增长超两倍 [14] 市场风险与监管变化 - 摩根大通策略师警告美股存在"过度拥挤"现象,并列出六只被视为投机性成长股的高风险股票,包括博通、AMD公司、Expedia Group Inc.、雅诗兰黛、景顺和Nucor Corp [7] - 苹果公司宣布将在日本市场允许第三方应用商店运营,并准许开发者自行处理支付流程,此举是为了遵守日本已正式生效的《移动软件竞争法》 [11][12]
财经早报:机构密集调研AI眼镜产业链公司 多家商业航天概念上市公司提示风险丨2025年12月19日
新浪财经· 2025-12-19 08:11
资本市场政策与监管动态 - 证监会主席吴清就资本市场“十五五”规划发声,强调将持续深化投融资综合改革,紧扣防风险、强监管、促高质量发展主线,稳步扩大制度型高水平对外开放 [2][39] - 专家对“十五五”规划的建议包括:提高发行上市制度包容性以吸引新质生产力企业上市、扩大长期资本供给、活跃并购重组市场、严格常态化退市、完善AI应用治理、从严打击财务造假及加强投资者保护 [2][39] 宏观经济与市场数据 - 美元指数持续走弱,12月17日收盘报98.3978,今年以来累计跌幅已超过9%,11月20日至12月17日期间累计下行1.72% [5][42] - 中国人民银行于12月18日开展883亿元7天期和1000亿元14天期逆回购操作,因当日有1186亿元7天期逆回购到期,实现净投放697亿元,以护航资金面平稳跨年 [6][43] 行业趋势与商品市场 - 电解锰价格持续上涨,12月18日平均价达17820元/吨,环比上涨200元/吨,12月以来已连续13个交易日上涨,累计涨幅近15%,价格创2022年5月以来新高 [7][44][45] - 机构观点认为,半导体硬件等板块短期估值已偏高,存在压力,长期估值支撑需依赖进口替代及质量产出提升,在AI领域更看好电力储能、光伏、电池及材料等基础设施方向 [16][54] - 出海主题中,电池、储能及光伏产业链的出口前景备受看好,被认为是2026年最看好的方向之一 [17][54] 知名公司战略与资本运作 - 阿里巴巴投资方向显著向AI领域集中,2023年后其在人工智能领域的投资金额占比从4%跃升至50%,近期新增投资进一步聚焦于具身智能领域 [4][41] - 海天味业宣布拟实施2025年特别分红,每10股派发现金红利3元,合计派发约17.54亿元,并承诺未来三年(2025-2027年)每年现金分红比例不低于80% [14][18][51][52][56] - TikTok CEO周受资发布内部信,披露美国业务解决方案:将成立名为“TikTok美国数据安全合资有限责任公司”的新合资公司负责数据安全,字节跳动保留电商、广告等商业运营,相关事宜计划于2026年1月22日前完成 [11][12][49] - 豆包AI将其对话、思考、搜索等核心能力通过API形式开放,企业可将其集成至自有产品中,这是豆包在AI生态上的又一次进击 [13][50] - 苹果公司在日本调整佣金政策,“苹果税”大幅下调,针对应用内第三方支付、应用外支付及第三方应用商店/侧载等不同场景,佣金率分别降至10%-21%、10%-15%和5% [15][53] 上市公司重要公告 - **旭升集团**:控股股东筹划股份转让,可能导致公司控制权变更,股票自12月19日起停牌,预计不超过2个交易日 [19][57] - **中微公司**:筹划通过发行股份购买杭州众硅电子科技有限公司控股权并募集配套资金,股票自12月19日起停牌,预计不超过10个交易日 [24][61] - **国盾量子**:公司董事长吕品不幸逝世 [20][58] - **古鳌科技**:前实际控制人陈崇军因操纵证券市场罪,一审被判处有期徒刑六年并处罚金四百万元 [21][59] - **天风证券**:拟将向控股股东借入的40亿元次级债务展期一年,并将年化利率从5%下调至4% [22][60] - **山东高速**:拟在2025年度对联营企业东兴证券的长期股权投资计提减值准备约6.9亿元,预计导致年度利润总额减少约6.9亿元 [25][62] - **合富中国**:发布风险提示公告,公司股票自10月28日至12月18日累计涨幅达349.25%,期间流通换手率波动大,击鼓传花效应明显,公司目前处于亏损状态 [26][63][64] - **西藏药业**:拟以1.7亿元至2亿元回购公司股份,回购价格不超过55元/股 [27][65] 股东增减持与回购 - **君实生物**:持股5%以上股东上海檀英计划减持不超过2053.38万股,占公司总股本的2% [28][65] - **大中矿业**:持股5%以上股东及部分董高监计划合计减持不超过公司总股本的1.44% [29][66] - **瑞晨环保**:持股7.38%的股东计划减持不超过214.9万股,占公司总股本比例不超过3% [30][67] - **安联锐视**:实际控制人徐进计划减持不超过67万股,占公司总股本比例0.9609% [31][68] - **奕东电子**:控股股东、实控人的一致行动人于12月10日至17日累计减持234.63万股,占公司总股本的1% [32][69] 重大项目与合同签署 - **宁波建工**:联合体中标7.47亿元奉化现代智造产业园基础设施提升工程项目 [33][70] - **青龙管业**:签订5526.71万元输水干线工程采购合同,占公司2024年度营业总收入的1.96% [34][71][72] - **中富通**:收到中移铁通两项综合业务支撑服务集中采购项目中选通知书,预估中选金额合计5.73亿元 [35][73] - **时空科技**:联合体中标1.41亿元智慧文旅融合项目 [36][74]
豆包 1.8 多模态超越谷歌Gemini 3!字节祭出“推理代工”,要做模型届的英特尔?
AI前线· 2025-12-18 15:24
豆包大模型1.8核心性能与能力 - 火山引擎正式推出新一代豆包大模型1.8,面向多模态Agent场景深度优化 [2] - 模型上下文窗口达256k,最大输入Token长度为224k,最大输出及思考内容Token长度均为64k [2] - 运行效率高,TPM(每分钟处理Token数)达5000k,RPM(每分钟请求数)为30k [3] - 原生支持智能上下文管理,可配置策略清除低价值历史信息,确保多步骤任务稳定完成 [7] 评测表现与行业地位 - 在AIME 2025等Agent评测集上稳步提升,在通用智能体测评Benchmark上取得全球领先成绩 [3] - 多模态理解方面,在视觉判断准确性、空间理解、文档解析、视频运动识别等多项能力上超越Gemini 3,其他任务处于全球第一梯队 [3] - 具体评测数据:在数学(AIME-25)得分94.3,推理(GPQA-Diamond)得分83.8,复杂指令遵循(MultiChallenge)得分66.7,通用智能体(BrowseComp-en)得分67.6 [4] - 多模态能力评测:多模态推理(MMMU-Pro)得分73.2,通用视觉问答(VLMsAreBiased)得分62.0,空间理解(MMS/Bench)得分25.8,文档与图表理解(OmniDocBench)得分0.106,动作机感知(MotionBench)得分70.6,长视频理解(VideoMME)得分87.8 [4] 多模态与Agent应用场景 - 演示中成功规划流程,调用十余个工具,在多个电商平台完成耳机全网比价与最优选择,能力可应用于电商、生活服务及企业自动化流程 [5] - 能快速低帧率浏览1小时4分钟的监控视频,精准定位事故画面并分析肇事车辆与时间,能力可拓展至在线教育、安全巡检、产品质检等领域 [5] - 大幅提升视觉理解基础能力,可低帧率理解超长视频,并在视频运动理解、复杂空间理解、文档结构化解析能力上有所提升 [7] - Tool Use能力、复杂指令遵循能力、OS Agent能力均实现大幅增强 [7] 图像与视频生成能力 - 豆包大模型拥有全球领先的图像与视频生成能力,覆盖从图像创作与编辑、视频生成、数字人制作到3D模型生成的完整创作链条 [8] - 新一代豆包生图模型Seedream 4.5在复杂指令遵循、画面元素保持能力上大幅提升,融入更丰富世界知识 [8] - Seedream 4.5能将不同人物、物体与场景照片智能组合生成创意合影,将汽车渲染成分解结构图,制作多卡通角色主题拼图,实现逼真的模特虚拟试穿及专业级产品营销海报 [8] - 视频生成模型Seedance 1.5 Pro正式登场,核心特点为音画同步输出、多人多语言对白配音及更强的影视级叙事张力 [9] - Seedance 1.5 Pro实现声音与画面在时间、语义上的精准同步,能根据角色数量和身份精准匹配口型,原生支持多种语言及中国各地方言 [9] - Seedance 1.5 Pro能通过提示词生成充满细节和情感张力的画面,驾驭影视级镜头语言和叙事张力 [11] - Seedance系列将上线“Draft样片”功能,可先快速生成低分辨率样片验证创意,帮助用户将整体创作效率提升65%,并减少60%的无效创作成本 [13] 企业服务与市场进展 - 截至今年12月,豆包大模型的日均tokens调用量已突破50万亿,自发布以来实现417倍增长,与去年12月相比实现超过10倍增长 [6] - 2025年已有超过100万家企业及个人使用火山引擎大模型服务,覆盖百余行业,其中超过100家企业在火山引擎的累计tokens使用量突破1万亿 [16] - 火山引擎正式推出“豆包助手API”,将豆包APP核心的对话、思考、搜索、创作等Agent能力以API形式开放,首批文本相关能力已上线 [16] - 豆包APP是国内用户规模最大的AI应用,从技术角度看是中国最复杂、难度最高的AI Agent之一 [16] 成本优化与推理服务 - 火山引擎推出业界首个“AI节省计划”,平台上所有按量付费的大模型均可参与,企业各部门享受统一价格优惠,不同模型用量可合并累计 [17] - “AI节省计划”采用阶梯折扣,用量越多节省越多,最高可节省47%的成本 [17] - 火山方舟正式推出“推理代工”服务,针对典型开源大模型结构提供极致的弹性伸缩、全栈推理优化与分布式缓存等支持 [18] - 用户上传加密模型参数后无需运维底层GPU,根据测试,以云上集群替代自建集群可使硬件与运维成本下降约一半,采用方舟推理代工服务对比云上租赁GPU算力可获得额外1.6倍左右的吞吐提升 [18] - 火山引擎能在分钟级完成百卡到千卡的算力伸缩以应对突发流量 [18] - AI产业的推理与训练走向分工与分层是大势所趋,对大多数团队而言,低成本、高吞吐地“推理好”一个大模型可能比“后训练好”一个模型更为困难 [19]
“豆包助手API”正式登陆火山方舟!科创人工智能ETF华夏(589010) 早盘探底回升,细分赛道龙头领涨
每日经济新闻· 2025-12-18 14:12
科创人工智能ETF市场表现 - 截至13点51分,科创人工智能ETF(589010)报收平盘,盘面呈现“先抑后扬”走势,午后维持高位震荡,当前正处于日内均线附近的整固阶段 [1] - ETF内部结构化特征显著,30只持仓股涨跌对半,其中中科星图、思看科技涨幅均超过10%,星环科技涨超7%,复旦微电、优刻得涨超5%,为组合贡献主要向上动力 [1] - 流动性方面,盘中成交近4000万元,交投活跃度处于正常量能区间 [1] 人工智能行业技术趋势 - 人工智能大模型参数规模正朝着两极分化方向发展,呈现出“超大参数模型”与“轻量级模型”并行发展的态势 [2] - 参数量千亿级别以上的超大参数模型,能够学习更复杂的特征和模式,为定制化解决方案提供有力支持,在处理复杂任务时具显著优势 [2] - 参数量在数十亿至百亿级别的轻量级模型,擅长移动端及对实时性要求高的应用场景,通过模型压缩、蒸馏等技术实现高效部署,具有高性价比优势,并可借助端侧计算降低云端负载与优化隐私保护 [2] 相关产品与产业动态 - 科创人工智能ETF华夏(589010)紧密跟踪上证科创板人工智能指数,覆盖全产业链优质企业,兼具高研发投入与政策红利支持,20%涨跌幅与中小盘弹性有助于捕捉AI产业“奇点时刻” [2] - 在火山引擎2025冬季Force原动力大会上,火山引擎总裁谭待宣布“豆包助手API”正式登陆火山方舟,该API将豆包对话、思考、搜索等核心产品能力打包开放,让企业开箱即用,目前首批四项文本能力已上线火山方舟的应用实验室 [1]
字节宣布“AI节省计划”,火山引擎谭待:用得越多,节省越多
新浪财经· 2025-12-18 10:55
火山引擎AI产品升级与成本计划 - 火山引擎在FORCE原动力大会上宣布了其AI产品矩阵的多项重要升级,旨在提升模型能力并降低企业使用成本 [1][3] 图像创作模型Seedream 4.5 - 豆包图像创作模型Seedream 4.5能力升级,支持多图组合、创意写真、图片拆解、复杂组图、虚拟试穿、海报设计等多种功能 [1][3] 视频生成模型Seedance 1.5 Pro - 公司发布了全新的视频生成模型Seedance 1.5 Pro,对比1.0版本,新版本支持音画高精同步、多人多语言对白、影视级的镜头语言和叙事张力 [1][3] - 该模型通过Draft样片功能,可以快速验证并确保内容一致性 [1][3] 豆包助手API上线 - 豆包助手API已登陆火山方舟平台,首批上线了日常沟通、联网搜索等能力 [1][3] AI节省计划 - 为帮助企业降低AI技术使用成本并加速AI普惠,公司正式发布了AI节省计划,其核心原则为“用得越多省得越多”,最高可节省47%的使用成本 [1][3]