全栈AI布局
搜索文档
破局者字节,全栈AI狂飙
21世纪经济报道· 2025-08-29 15:34
文章核心观点 - 字节跳动通过全栈AI布局实现纵向成本与体验的飞轮效应和横向C端超级App与B端企业服务的双轮驱动 构建开放生态 坚定长期投入追求智能上限并服务产业应用 [1] 全栈AI布局 - 公司持续加大AI基础技术研发投入 基于互联网海量数据建设海内外算力中心 自研DPU的GPU实例较上一代集群性能最高提升三倍以上 [3] - 2025年计划在AI基础设施投入超120亿美元(约855.78亿元人民币) 2024年资本开支800亿元 2025年预计翻倍至1600亿元 主要用于自建算力中心与DPU芯片研发 [3] - 最新开源Seed-OSS-36B模型采用Apache-2.0许可证 支持原生512K上下文长度 引入可控思维预算机制提升推理效率 在AIME24达91.7分 AIME25达84.7分 [3] - 多模态技术Waver 1.0基于修正流Transformer架构 支持文本到视频 图像到视频和文本到图像生成无需切换模型 统一架构实现多模态生成无缝切换重构内容创作流程 [3][4] - OmniHuman-1.5通过全方位条件训练颠覆静态图像转动态视频传统认知 仅需一张人物照片和一段音频即可生成说话 唱歌 做手势和表达情绪的视频 [6] 产品矩阵与市场表现 - ToC端AI应用布局全面 Chatbot豆包或为国内最大的AI Native应用 覆盖Chatbot 教育 图像视频 情感陪伴等垂类 海外国内产品基本一一对照 同时布局APP端和Web端 [6] - 豆包拥有超1.1亿用户 同比增长864.35% 位列榜单第二 豆包家族包含通用Pro/Lite 角色扮演 语音合成/识别 文生图 视频生成等十余款细分模型 [6] - 视频生成产品线Seedance 1.0 Pro在全球文生视频 图生视频双榜领先 5秒1080P视频生成成本仅3.67元 Waver 1.0支持长达10秒高质量视频生成 兼容多种艺术风格 [7] - 企业级市场HiAgent 2.0与豆包企业版双轮驱动 HiAgent 2.0采用调度对话行动三位一体架构 支持流程图/自然语言/API三种任务编排方式 内置100+行业模板库 [7] - 推出AI硬件产品包括AI耳机Ola Friend等AIoT产品 截至6月11日接入豆包的AIoT产品出货量超100万台 预计2025年年底有望突破1000万台 [7] 行业应用与渗透 - 豆包大模型服务全球TOP10手机厂商中的9家 八成主流汽车品牌 70%的系统重要性银行及超五成985高校 [8] - 截至2025年5月底 豆包大模型日均Tokens使用量超过16.4万亿 较去年5月刚发布时增长137倍 [8] - IDC报告显示2024年火山引擎在中国公有云大模型服务调用量上稳居第一 市场份额46.4% [8] 差异化竞争策略 - SuperCLUE 2025年5月测评显示字节豆包1.5深度思考模型与商汤日日新V6并列国内第一 [10] - 首创按输入长度区间定价 0~32K段输入0.8元/百万Tokens 综合成本仅为竞品的1/3 推动大模型进入厘时代 [10] - 火山引擎差异化优势体现在规模优势与AI原生能力 抖音 头条等内部业务运行使其成为中国计算规模最大的云厂商之一 通过规模化降低成本提供高性价比多云服务 [10][11] - 豆包大模型发展迅速 C端用户可直接体验形成B端与C端的协同 [11] 生态建设与未来趋势 - 火山引擎定位不只做自有模型而是打造模型超市 汇聚智谱 MiniMax 百川等第三方大模型 提供精调 评测 推理全托管服务 [13] - 成立手机 汽车等行业联盟 与头部企业合作 与金蝶 汉得等行业伙伴集成模型能力拓展垂直领域 [11] - 孵化AI原生企业服务初创公司 通过孵化器提供代金券和技术支持 助力成长推动中国AI企业服务弯道超车 [11] - 技术融合更加深入 多模态技术打破传统内容生成边界 AI与VR/AR结合可能成为下一个突破点 [13] - 人机交互方式发生变革 探索更便携更自然的交互方式 未来可能出现更多创新交互设备 [13] - 智能体中台技术成熟与行业模板库完善 企业级AI Agent将从单点效率提升转向全链路智能重构 推动中国企业数字化转型进入AI原生新阶段 [13]
AI新业务首次突破百亿,百度大胆革新的底气是什么?
阿尔法工场研究院· 2025-08-21 09:38
核心观点 - 公司Q2总营收327亿元,核心营收263亿元,归属核心净利润74亿元,同比增长35% [3] - AI新业务收入首次超过100亿元,同比增长34% [3] - 萝卜快跑Q2全球出行服务次数超220万,同比增长148%,累计服务次数超1400万,覆盖全球16座城市 [3] - 公司展现出比谷歌更为激进的技术革新姿态,智能云业务超越行业平均增速,核心搜索业务进行十年来最彻底的AI化重构 [4] - 公司长期技术投入进入规模化变现期,正在迎来长期价值重估 [7] 搜索业务 - 公司搜索业务启动十年来最大规模改版升级,从底层交互逻辑到顶层生态构建全方位重构 [10] - 传统搜索框进化为支持千字文本、多模态输入的智能框,百看功能支持图文、音视频混合输出并融合智能体与真人服务能力 [10] - 公司成为全球首个接入中文音视频一体化生成模型的搜索平台,已接入超过1.8万个优质MCP [10] - 公司超过64%的搜索结果由AI直接生成,IDC报告显示其AI搜索在中国通用型AI搜索产品中总分第一 [19] - 与谷歌相比,公司展现出更彻底的破坏式创新姿态,谷歌仅有13.14%的查询触发AI Overviews [17] 全栈AI布局 - 公司在芯片层、框架层、模型层、应用层进行全栈布局,拥有昆仑芯、飞桨深度学习框架、文心预训练大模型等关键自研技术 [23] - 百度智能云连续六年稳居中国AI公有云服务市场榜首,2024年在大模型平台市场以14.9%的份额超越阿里云 [23] - 昆仑芯三万卡集群与百舸平台组合实现算力性能与成本效率的极致平衡,可支持1000家企业进行百亿参数模型精调 [27][28] - 飞桨深度学习框架最新版本将30多种语言的文字识别精度提升30个百分点 [28] - 文心大模型在IDC的8项核心评估中斩获7项满分,文心X1 Turbo获得信通院推理能力最高等级认证 [29] 智能云与萝卜快跑 - 智能云客户涵盖招商局、国家电网等头部企业,与65%+央企展开深度合作 [30][36] - 萝卜快跑以20.46万元的单车成本实现全球1100万次服务,出险率仅为人类司机的1/14 [33] - 萝卜快跑与Uber、Lyft达成战略合作,计划在欧洲市场部署数千辆无人车 [34] - 萝卜快跑Q2出行服务次数220万+,同比增长148%,全球累计出行服务次数1400万+ [36] 生态布局与创新业务 - 数字人技术突破重塑商业生态,罗永浩数字人直播7小时创5500万+GMV [36][43] - Comate AI IDE作为行业首个多模态、多智能体协同的独立AI原生开发环境工具正式发布 [44] - 秒哒平台以无代码+AI方式在4个月内创建20万个应用 [44] - 知识博主艾弥儿的数字人将用户停留时长提升101%,蒙牛悠瑞的数字人使转化率提高33% [44]