百度伐谋
搜索文档
百度发布最新财报:2025年营收1291亿元 四季度AI业务收入占比43%
中国经济网· 2026-02-27 15:44
公司整体财务与战略表现 - 2025年全年总营收达1291亿元人民币,其中AI业务营收达400亿元人民币 [1] - 2025年第四季度总营收327亿元人民币,AI业务收入占一般性业务收入的43%,超出市场预期 [1] - 公司认为2025年是AI成为其新核心的关键一年,以AI为先的战略清晰成型 [1] AI云业务 - 2025年AI云全年收入同比增长34% [1] - 2025年第四季度AI高性能计算设施订阅收入同比增长143%,增速较第三季度的128%进一步加快 [1] - 2025年百度智能云在大模型相关中标项目数和中标金额上实现双第一,连续两年成为中标项目数和中标金额最多的云厂商 [1] AI原生营销服务 - 2025年AI原生营销服务全年收入同比增长301% [2] - 2025年12月,百度App月活用户数达6.79亿,文心助手月活用户数达2.02亿 [2] - 春节红包活动启动以来,文心助手月活跃用户同比增长4倍 [2] - 2025年,慧播星数字人开播规模同比增长202%,收入同比增长228%,已赋能30多个行业 [2] AI应用与产品 - 2025年AI应用全年收入突破100亿元人民币 [2] - 无代码生成平台秒哒在平台功能和应用质量方面表现出行业领先性能 [2] - 全球首个自我演化超级智能体百度伐谋已获得超2000家企业申请试用,并发布“同舟生态伙伴计划” [2] - 百度文库、百度网盘整合成为个人超级智能事业群(PSIG),以加快AI应用创新 [2] - 近期文心5.0正式版上线,作为原生全模态大模型,参数达2.4万亿,支持文本、图像、音频、视频等多种信息的输入与输出 [3] - 文心5.0多次登上LMArena文本榜、视觉理解榜国内第一 [3] 自动驾驶业务(萝卜快跑) - 2025年第四季度,萝卜快跑全球无人驾驶出行服务次数达340万次,同比增长超200% [2] - 季度内萝卜快跑每周出行次数峰值超30万次 [2] - 截至2026年2月,萝卜快跑累计提供全球出行服务次数超2000万次,足迹覆盖全球26个城市 [2] - 目前萝卜快跑自动驾驶总里程累计超3亿公里,其中全无人驾驶里程超1.9亿公里 [2] 其他业务与进展 - 2026年1月,昆仑芯向香港联交所提交主板上市申请 [3] - 公司在《标准普尔全球可持续发展年鉴2026》全球版中,ESG绩效取得进一步提升 [3]
向市场亮剑,百度2025年Q4 AI业务增长为行业注入信心
搜狐财经· 2026-02-27 06:33
公司2025年财务表现 - 2025年全年总营收达1291亿元人民币,AI业务营收达400亿元人民币 [1] - 2025年第四季度总营收为327亿元人民币,同比增长5% [1] - 2025年第四季度AI业务收入占公司一般性业务收入的43%,超出市场预期 [1] - 2025年全年销售成本为724.36亿元人民币,研发费用为204.33亿元人民币 [2] - 2025年第四季度销售及管理费用为73.89亿元人民币,研发费用为55.91亿元人民币 [2] AI业务商业化进展 - AI云收入2025全年同比增长34%,其中第四季度AI高性能计算设施订阅收入同比激增143% [4] - AI应用全年收入突破100亿元人民币 [4] - 公司智能云全年大模型相关中标项目数和中标金额实现双第一,连续两年成为中标项目数和中标金额最多的云厂商 [8] - 公司AI商业化已进入实质性阶段,从成本中心转向利润中心,收入主要来自企业和用户为实际效果付费 [8] AI技术产品与市场地位 - 无代码生成平台“秒哒”在平台功能和应用质量方面表现出行业领先性能 [9] - 全球首个自我演化超级智能体“百度伐谋”已获得超2000家企业申请试用 [9] - 在中国自研GPU云市场中,公司智能云以40.4%的市场份额位居第一 [10] - 自研昆仑芯从架构层为AI设计,能大规模提供稳定、高性能的AI计算,并兼容主流模型和框架 [9] AI应用场景落地与成效 - AI原生营销服务收入同比增长301% [13] - 2025年12月,“文心助手”月活用户数达2.02亿;春节红包活动启动以来,其月活跃用户同比增长4倍 [13] - 2025年,“慧播星”数字人开播规模同比增长202%,收入同比增长228%,已赋能30多个行业 [13] - “秒哒”用户中有81%为非程序员用户,其生成的应用已累计服务超过1000万用户,每天约有近10万人使用 [14] - “萝卜快跑”第四季度全球无人驾驶出行服务次数达340万次,同比增长超200%,季度内每周出行次数峰值超30万次 [16] - 截至2026年2月,“萝卜快跑”累计提供全球出行服务次数超2000万次,足迹已覆盖全球26个城市 [16] 公司近期资本市场举措与市场反应 - 公司于2026年2月5日宣布启动新一轮50亿美元股票回购计划,并首次提出2026年派息政策 [19] - 公司用市值10%的大比例回购股票,远超市场预期及苹果、谷歌等公司通常2%-4%的回购比例 [19] - 昆仑芯已于2026年1月1日通过保密形式向香港联合交易所提交上市申请表格 [21] - 近期近20家机构上调公司目标价,摩根大通将公司美股目标价上调至200美元 [21]
百度2025年营收达1291亿元 第四季度AI业务收入占比43%
证券日报网· 2026-02-26 21:05
公司2025年财务与业务表现 - 2025年公司总营收达1291亿元人民币,AI业务营收达400亿元人民币 [1] - 2025年第四季度公司总营收327亿元人民币,AI业务收入占公司一般性业务收入的43% [1] - 公司创始人表示,2025年是AI成为公司新核心的关键一年,AI云势头强劲,AI应用组合持续扩展,萝卜快跑巩固全球领先地位,AI原生营销服务为长期发展开启新可能性 [1] AI云业务 - 公司AI云2025年全年收入同比增长34% [1] - 2025年第四季度,AI高性能计算设施的订阅收入同比增长143%,较第三季度的128%进一步加速 [1] - 根据智能超参数数据,公司智能云以109个中标项目和9亿元人民币中标金额,连续两年成为中标项目数和中标金额最多的云厂商 [1] AI原生营销服务 - AI原生营销服务2025年全年收入同比增长301% [2] - 2025年第四季度,AI原生营销服务收入达到27亿元人民币,同比增长110% [2] - 2025年12月,公司App月活用户数达6.79亿,文心助手月活用户数达2.02亿 [2] - 春节红包活动启动以来,文心助手月活跃用户同比增长4倍 [2] - 2025年,慧播星数字人开播规模同比增长202%,收入同比增长228%,已赋能30多个行业 [2] AI应用 - 2025年公司AI应用全年收入突破100亿元人民币 [2] - 2025年第四季度内,自我演化超级智能体“百度伐谋”已获得超2000家企业申请试用,并发布“同舟生态伙伴计划” [2] - 近期,公司文库、公司网盘整合成为个人超级智能事业群(PSIG),以加快AI应用创新 [2] - 文心5.0近期正式上线,作为原生全模态大模型,其参数达2.4万亿,采用原生全模态统一建模技术,支持文本、图像、音频、视频等多种信息的输入与输出 [2] 自动驾驶业务 (萝卜快跑) - 萝卜快跑2025年第四季度全球无人驾驶出行服务次数达340万次,同比增长超200%,季度内每周出行次数峰值超30万次 [3] - 截至2026年2月,萝卜快跑累计提供全球出行服务次数超2000万次,足迹已覆盖全球26个城市 [3] - 目前,萝卜快跑自动驾驶总里程累计超3亿公里,全无人驾驶里程超1.9亿公里 [3] - 财报显示,萝卜快跑加速向全球多个市场扩张 [3] 2026年资本运作与股东回报 - 2026年1月1日,公司旗下AI芯片子公司昆仑芯以保密形式向香港联交所提交上市申请 [4] - 2026年2月5日,公司董事会授权一项新股份回购计划,可回购最高50亿美元的公司股份,有效期至2028年12月31日 [4] - 为进一步提升股东回报,公司董事会预计在2026年宣布首次发放股息 [4] 行业分析师观点 - 行业分析师指出,2025年公司在AI大模型与智能云领域持续领跑,文心一言生态加速落地,驱动搜索、营销、企业服务全面升级 [3] - 分析师认为,萝卜快跑规模化运营稳步推进,彰显自动驾驶商业化领先优势 [3] - 分析师表示,公司以坚实的技术底座和清晰的AI战略,正高效兑现“AI原生”转型红利,展现出强劲的创新动能与长期增长潜力 [3] - 分析师评价,公司2026年通过50亿美元股票回购与首次派息提升股东回报,彰显现金流实力与治理信心;推动昆仑芯分拆上市释放AI芯片业务价值,强化“AI+硬科技”双轮驱动叙事 [4][5] - 分析师认为,资本举措协同发力,优化了集团估值结构,也为长期技术投入打开融资通道 [5] - 分析师展望,公司有望依托大模型技术优势与丰富应用场景,进一步打通AI在搜索、云服务、智能驾驶等领域的协同效应 [5] - 分析师表示,随着生成式AI深度融入产品矩阵,其商业化能力将持续释放,生态壁垒不断加固 [5] - 分析师认为,在国家支持人工智能高质量发展的政策环境下,公司作为国内AI领军企业,有望在全球科技竞争中占据更有利位置 [5]
百度发布最新财报!
中国基金报· 2026-02-26 19:37
公司整体财务与战略表现 - 2025年公司总营收达1291亿元人民币,其中AI业务营收达400亿元人民币 [1] - 2025年第四季度总营收为327亿元人民币,AI业务收入占一般性业务收入的比例达到43%,超出市场预期 [1] - 公司创始人表示2025年是AI成为公司新核心的关键一年,并强调“以AI为先”的战略已清晰成型 [1] AI云业务 - 2025年AI云收入同比增长34% [1] - 2025年第四季度,AI高性能计算设施的订阅收入同比增长143%,增速较第三季度的128%进一步加快 [1] - 公司智能云全年在大模型相关项目的中标数量和中标金额上实现双第一,连续两年成为中标项目数和中标金额最多的云厂商 [1] AI原生营销服务 - 2025年AI原生营销服务收入同比增长301% [2] - 2025年12月,公司App月活跃用户数达6.79亿人,文心助手月活跃用户数达2.02亿人 [2] - 自春节红包活动启动以来,文心助手月活用户同比增长4倍 [2] - 2025年,慧播星数字人开播规模同比增长202%,相关收入同比增长228%,已赋能超过30个行业 [2] AI应用与生态 - 2025年AI应用全年收入突破100亿元人民币 [2] - 2025年第四季度,全球首个自我演化超级智能体“百度伐谋”已获得超过2000家企业申请试用,并发布了“同舟生态伙伴计划” [2] - 近期,文心5.0正式版上线,该模型参数规模达2.4万亿,采用原生全模态统一建模技术,支持文本、图像、音频、视频等多种信息的输入与输出 [3] - 文心5.0多次在LMArena文本榜和视觉理解榜位列国内第一,超过多款国内外主流模型 [3] - 2026年1月,公司旗下昆仑芯已向香港联交所提交主板上市申请 [3] 萝卜快跑(自动驾驶业务) - 2025年第四季度,萝卜快跑全球无人驾驶出行服务次数达340万次,同比增长超过200%,季度内每周出行次数峰值超过30万次 [3] - 截至2026年2月,萝卜快跑累计提供的全球出行服务次数已超过2000万次,业务足迹覆盖全球26个城市 [3] - 目前,萝卜快跑自动驾驶总里程累计超过3亿公里,其中全无人驾驶里程超过1.9亿公里 [3]
百度最新财报:2025年营收1291亿元 四季度AI业务收入占比43%
市值风云· 2026-02-26 18:12
百度2025年第四季度及全年财报核心观点 - 2025年是AI成为公司新核心的关键一年,AI业务全年营收达400亿元,占公司总营收的31% [1] - 公司以AI为先的战略清晰成型,凭借差异化的全栈端到端AI能力赢得企业认可,对在AI时代创造持久价值充满信心 [1] 整体财务与AI业务表现 - 2025年公司总营收达1291亿元,第四季度总营收为327亿元 [1] - 第四季度AI业务收入占公司一般性业务收入的43%,超出市场预期 [1] - AI业务2025年全年营收达到400亿元 [1] AI云业务 - AI云业务2025年全年收入同比增长34% [1] - 第四季度AI高性能计算设施订阅收入同比增长143%,增速较第三季度的128%进一步加快 [1] - 2025年,公司智能云在大模型相关中标项目数和中标金额上实现双第一,连续两年成为中标项目数和中标金额最多的云厂商 [1] AI原生营销服务 - AI原生营销服务2025年全年收入同比增长301% [2] - 2025年12月,百度App月活用户数达6.79亿,文心助手月活用户数达2.02亿 [2] - 春节红包活动启动以来,文心助手月活跃用户同比增长4倍 [2] - 慧播星数字人业务2025年开播规模同比增长202%,收入同比增长228%,已赋能30多个行业 [2] AI应用业务 - AI应用2025年全年收入突破100亿元 [2] - 无代码生成平台“秒哒”在IDC报告中,于平台功能和应用质量方面表现出行业领先性能 [2] - 全球首个自我演化超级智能体“百度伐谋”在季度内已获得超2000家企业申请试用,并发布“同舟生态伙伴计划” [2] - 近期,百度文库与百度网盘整合成为个人超级智能事业群(PSIG),以加快AI应用创新 [2] 自动驾驶业务(萝卜快跑) - 萝卜快跑第四季度全球无人驾驶出行服务次数达340万次,同比增长超200%,季度内每周出行次数峰值超30万 [2] - 截至2026年2月,萝卜快跑累计提供全球出行服务次数超2000万次,业务覆盖全球26个城市 [2] - 萝卜快跑自动驾驶总里程累计超3亿公里,其中全无人驾驶里程超1.9亿公里 [3] - 业务正加速向全球多个新市场进行国际扩张 [2] 大模型与技术进展 - 文心5.0正式版作为原生全模态大模型上线,模型参数达2.4万亿,采用原生全模态统一建模技术,支持文本、图像、音频、视频等多种信息的输入与输出 [3] - 文心5.0曾多次登上LMArena文本榜、视觉理解榜国内第一,超过多款国内外主流模型 [3] - 2026年1月,公司旗下昆仑芯已向香港联交所提交主板上市申请 [3] ESG表现 - 在《标准普尔全球可持续发展年鉴2026》全球版中,公司在ESG绩效方面取得了进一步提升 [3]
百度最新财报:2025年营收1291亿元 四季度AI业务收入占比43%
齐鲁晚报· 2026-02-26 17:23
核心财务与战略 - 2025年公司总营收达1291亿元,其中AI业务营收达400亿元 [1] - 2025年第四季度总营收327亿元,AI业务收入占一般性业务收入的43%,超出市场预期 [1] - 公司战略定位为“AI为先”,AI成为其新核心,致力于在AI时代创造持久价值 [1] AI云业务 - 2025年AI云全年收入同比增长34% [1] - 第四季度AI高性能计算设施订阅收入同比增长143%,增速较第三季度的128%进一步加快 [1] - 2025年,公司智能云在大模型相关中标项目数和中标金额上实现双第一,连续两年成为中标最多的云厂商 [1] AI原生营销服务 - 2025年AI原生营销服务全年收入同比增长301% [2] - 2025年12月,百度App月活用户数达6.79亿,文心助手月活用户数达2.02亿 [2] - 春节红包活动启动以来,文心助手月活跃用户同比增长4倍 [2] - 2025年,慧播星数字人开播规模同比增长202%,收入同比增长228%,已赋能30多个行业 [2] AI应用与生态 - 2025年AI应用全年收入突破100亿元 [2] - 无代码生成平台秒哒在平台功能和应用质量方面表现出行业领先性能 [2] - 全球首个自我演化超级智能体“百度伐谋”已获得超2000家企业申请试用,并发布“同舟生态伙伴计划” [2] - 百度文库、百度网盘整合成为个人超级智能事业群(PSIG),以加快AI应用创新 [2] - 文心5.0正式版上线,参数达2.4万亿,采用原生全模态统一建模技术,支持多种信息输入输出 [3] - 文心5.0在多项评测中位列国内第一,超过多款国内外主流模型 [3] 自动驾驶业务(萝卜快跑) - 第四季度全球无人驾驶出行服务次数达340万次,同比增长超200%,季度内每周出行次数峰值超30万 [2] - 截至2026年2月,萝卜快跑累计提供全球出行服务次数超2000万次,业务覆盖全球26个城市 [2] - 公司自动驾驶总里程累计超3亿公里,其中全无人驾驶里程超1.9亿公里 [2] 其他重要进展 - 2026年1月,昆仑芯向香港联交所提交主板上市申请 [3] - 公司在《标准普尔全球可持续发展年鉴2026》全球版中,ESG绩效取得进一步提升 [3]
李彦宏:2025年是AI成为百度新核心的关键一年
新浪财经· 2026-02-26 17:18
公司整体财务与战略 - 2025年全年总营收达1291亿元人民币,其中AI业务营收达400亿元人民币 [1][4] - 2025年第四季度总营收327亿元人民币,同比增长5% [1][4] - 第四季度AI业务收入占公司一般性业务收入的43%,超出市场预期 [1][4] - 公司创始人表示2025年是AI成为公司新核心的关键一年,对以AI为先的战略及在AI时代创造持久价值的能力充满信心 [1][4] AI云业务 - 2025年全年AI云收入同比增长34% [1][4] - 第四季度AI高性能计算设施的订阅收入同比增长143%,增速较第三季度的128%进一步加快 [1][4] - 2025年在全年大模型相关中标项目数和中标金额上实现双第一,连续两年成为中标项目数和金额最多的云厂商 [1][4] AI原生营销服务 - 2025年全年AI原生营销服务收入同比增长301% [2][5] - 2025年12月,公司App月活用户数达6.79亿,文心助手月活用户数达2.02亿 [2][5] - 春节红包活动启动以来,文心助手月活跃用户同比增长4倍 [2][5] - 慧播星数字人2025年开播规模同比增长202%,收入同比增长228%,已赋能30多个行业 [2][5] AI应用业务 - AI应用2025年全年收入突破100亿元人民币 [2][5] - 无代码生成平台秒哒在IDC报告中,于平台功能和应用质量方面表现出行业领先性能 [2][5] - 全球首个自我演化超级智能体“百度伐谋”已获得超2000家企业申请试用,并发布“同舟生态伙伴计划” [2][5] - 公司近期将百度文库、百度网盘整合成为个人超级智能事业群(PSIG),以加快AI应用创新 [2][5] 自动驾驶业务(萝卜快跑) - 2025年第四季度全球无人驾驶出行服务次数达340万次,同比增长超200% [2][6] - 第四季度内每周出行次数峰值超30万次 [2][6] - 截至2026年2月,累计提供全球出行服务次数超2000万次,业务已覆盖全球26个城市 [2][6] - 自动驾驶总里程累计超3亿公里,其中全无人驾驶里程超1.9亿公里 [3][6]
新京报2025“智慧生活”年度案例揭晓,20家企业和产品入选
新京报· 2026-01-30 16:09
行业趋势与核心观点 - 2025年科技与生活融合进入深度迭代期,共情AI与拟人化具身智能机器人密集涌现,市场需求与技术变革精准呼应[1] - 产业发展背后是顶层政策的系统性牵引,政策与市场双向奔赴,构筑智慧生活核心发展逻辑[1] - 行业聚焦“场景应用”,深度挖掘智慧技术落地民生的实践力量,入选案例具有显著AI属性[1] - 与上一年相比,本届案例呈现更鲜明的“技术深化”与“场景融合”特征,标志数智技术从“工具属性”向“生态属性”跃迁[1] - 大模型与Agent成为主角,数智生活迈入“深度渗透”新阶段,未来产品将从设计之初深度融入大模型能力,诞生真正的AI原生应用[2] - 共情能力仅是开端,未来智慧产品有望成为更懂人心的伙伴,提供有温度、可信赖的解决方案[3] 获奖企业及产品案例 - 豆包、淘宝闪购、蚂蚁阿福、海信AI生活管家等20家企业及产品入选新京报2025“智慧生活”年度案例[1] - 淘宝闪购获评年度人工智能大模型[5] - 蚂蚁阿福获评年度即时零售创新平台[5] - 海信AI生活管家获评年度家庭健康守护AI管家[5] - 快手「wow 」智能体获评年度商业AI助手[6] - 盒马获评年度助力新兴城市商圈活力平台[7] - 希音获评年度产业带出海赋能平台[9] - 58同城“Al直聘”获评年度AI原生应用[8][10] - 谦寻超级商店获评年度跨界融合消费创新案例[11] - 小果冻Al助手获评年度赛事服务智能伙伴[11] - 海信Al生活管家获评年度家电智能体创新案例[12] - 大疆Osmo Action 6获评年度智能影像普惠案例[13] - 追觅T60 Ultra洗地机获评年度智能清洁创新应用案例[13] - 泛微获评年度数智办公全域服务平台[13] - 麦瑞克Al健身私教Mia获评年度家庭健身陪伴系统[14] - MiniMax Agent获评年度通用Agent产品[16] - 灵心巧手Linker Hand系列获评年度具身智能灵巧手产品[16] - 百度伐谋获评年度算法自主优化引擎[17] - 喜马拉雅“小雅”智能语音助手获评年度AI技术突破音频产品[18] - 海亮科服“Al创思课堂”获评年度数智赋能教学改革产品[18]
让AI沉下来:北京锻造人工智能第一城
北京日报客户端· 2026-01-27 00:49
北京人工智能产业发展现状与目标 - 北京正以“人工智能第一城”的姿态参与全球竞争,凭借人才密度、全栈生态与产业集群三大优势 [1] - 城市目标是在“十五五”期间,用两年时间实现人工智能核心产业规模突破万亿元 [2] - 2025年产业规模约为4500亿元,计划到2027年突破万亿元,实现规模翻倍 [11][12] 产业人才与创新源头 - 北京拥有1.5万名AI学者,占全国总量的30% [4] - 有148人入选AI 2000全球最具影响力学者榜单,占全国比例超过40% [4] - 创新源头高度集中,拥有2个人工智能领域国家实验室、1个国家级人工智能学院及14所设立人工智能学院的高校 [5] - “AI原点社区”等首批4个人工智能创新街区,位于海淀区约3平方公里的科教资源密集区,产业载体达400万平方米 [4] 核心技术突破与协同生态 - 智源研究院推动的FlagOS系统软件栈,作为连接国产AI芯片与大模型的“通用语言”,以每3个月一次的速度迭代 [1][4] - 国产GPU企业摩尔线程联合智源研究院,首次使用基于MTT S5000的千卡集群完成了RoboBrain 2.5全流程训练,验证了国产算力训练高级AI模型的实力 [8] - 生数科技与清华大学联合发布视频生成加速框架TurboDiffusion,将高质量1080P分辨率、8秒视频的生成时间从约900秒压缩至约8秒,速度提升200倍 [6][7] - 面壁智能推出全球首个可部署在端侧的全双工全模态大模型MiniCPM-o 4.5,支持自主回答与更自然的人机交互 [9] 核心产业要素与市场应用 - **算力**:寒武纪、摩尔线程、昆仑芯等国产芯片性能提升,FlagOS提供统一软件生态保障 [10] - **模型**:北京已备案大模型达209款,占全国近30%,形成抖音豆包、智谱GLM、月之暗面Kimi、百度文心四大基础模型及垂类模型矩阵 [10] - **数据**:光轮智能等公司通过构建“数字平行工厂”提供高质量仿真数据,支持机器人并行训练 [9] - **应用与市场**:百度伐谋的自我演化能力将汽车风阻验证时间从10小时压缩至1分钟 [12] 快手可灵AI在2025年12月收入突破2000万美元,对应年化收入运行率达2.4亿美元,其App端付费用户规模在2026年1月较前月增长约350%,日均收入提升约30% [13] 代表性企业动态与资本市场 - 智谱AI于2026年1月在香港联交所上市,被称为“全球大模型第一股” [4] - 生数科技由清华、北大、中科院及阿里、腾讯、字节、百度等企业人才组建,于2024年4月发布中国首个高性能视频大模型Vidu [5][6]
产业级 Agent 如何破局?百度吴健民:通用模型难“通吃”,垂直场景才是出路
AI前线· 2026-01-16 14:28
Agentic模型的发展现状与挑战 - 通用全能的Agentic模型现阶段不可能实现,业务场景、工具、环境差异过大,通用模型泛化性有限 [2] - 当前研发核心是让模型在各类垂直Agent场景中更好发挥作用,发展最快的场景是Coding Agent,包括通用编程及网页开发等特定领域 [4] - 具备在各类垂直Agent场景下达到工业级效果的通用模型尚未出现,原因在于场景设定、工具集合及运行环境差异极大 [5] - 针对具体应用场景定制模型更容易形成优势,特别是当场景能清晰定义Reward且评估能高效自动完成时,通过强化学习定制的Agentic模型可显著超过现有通用模型 [5] - Agentic模型训练的最大卡点不是模型,而是真实环境复刻,外部接口、数据库、登录依赖等真实链路的稳定访问技术门槛极高 [2] - 实现模型在特定场景持续迭代,必须依赖一套在该场景下运行顺畅、具备高效率和高吞吐能力的强化学习系统 [6] 强化学习的技术瓶颈与工业应用 - 开源强化学习框架如OpenRLHF、TRL、VeRL等覆盖了主要环节,但在工业级应用中仍不够成熟,涉及多轮工具调用的Agentic场景需深度定制 [7] - 工业级打磨方向主要在模型规模支持与Agent训练能力两方面,需能高效支撑参数量较大的SOTA模型,并处理多轮工具调用的复杂交互 [7] - 工业级Agentic模型研发对整体技术栈要求极高,包括沙盒环境、高性能高并发调度运行能力及稳定的高并发搜索API支持 [7] - 强化训练的本质是激发和稳定模型在特定场景中的既有能力,首要前提是基座模型本身在目标场景上具备优势,通常源于预训练阶段的数据分布 [8] - 强化学习过程中,生成尝试路径(Rollout)通常占据80%—90%的时间成本,能否以高吞吐方式高效完成Rollout是成败关键 [9] - 强化训练的样本规模已可扩展到百万级,系统性地提升了模型推理和复杂问题解决能力 [10] - 大规模多场景强化训练的前提是结果评估能准确自动完成且最好有稠密的评估奖励反馈,这在代码或数学等评估相对确定的场景中相对容易实现 [11] 多模态模型的技术进展与局限 - 视觉生成主流模型框架从Diffusion Model发展到Flow Matching,效果、稳定性碾压前代方案 [3] - 视觉理解模型仍以ViT Encoder嫁接语言模型的主流方案为主,模型能力迭代主要聚焦在垂直方向的数据合成 [3] - 当前未真正实现多模态理解和生成的统一建模,分开独立优化效果依旧优于融合建模 [3] - 多模态模型核心是在语言模型基础上引入视觉能力,主流方案是在语言模型训练到一定阶段后,引入视觉编码器并用图文对齐数据联合训练 [17] - 视觉信号信息密度较低,仅依赖视觉输入进行大规模训练难以达到语言模型效果,现有方案高度依赖图文对齐数据 [17] - 行业可用的图文对齐数据规模大致在3–5T token,量级上存在明显差距,限制了多模态模型的进一步scale [18] - 生成与理解的统一建模是重要方向,但现阶段融合后的效果还不如单独优化 [21][23] 模型架构与能力扩展的关键方向 - 稀疏MoE架构被广泛应用,其核心是解决Scaling Law问题,在增大模型总参数的同时,让训练和推理实际使用的参数规模保持次线性增长 [15] - 稀疏MoE的稀疏比已做到5%甚至更低,成为推动模型规模继续扩展的现实可行方案 [16] - 长上下文能力与Agent能力直接相关,上下文长度决定了模型能记忆和理解的信息规模 [13] - 业界探索通过Agent脚手架本身“放大记忆”的方案,借助工具使用来弥补上下文长度的限制 [13] - 长上下文能力的关键是模型能否准确理解高效处理,依赖高效的注意力机制设计和实现,可采用稀疏化策略或分块筛选方案 [14] - “世界模型”存在多种理解,一种是通过建模理解物理世界的运行规律,另一种是强调代码能力和工具调用能力 [26] 未来趋势与演进路径 - 2025年明显方向是Agentic Model,即模型具备稳定、准确的工具调用能力,代码场景已率先验证,明年该能力很可能扩展到更多应用场景 [28] - 面对复杂环境,可行方案是让模型在特定场景的Agent脚手架中学会熟练使用该场景所涉及的相对有限的工具集合 [29] - 通用人工智能的实现路径存在分歧,一种是将多种能力融合到单一模型中,另一种是强调模型学会使用工具,当前没有看到哪条路一定能走通 [25] - 在特定专业场景中不断提升模型和Agent能力,使其在局部任务上超过人类水平,在相当长一段时间内仍将是主流方向 [12]