豆包2.0
搜索文档
国产AI进展探讨
2025-11-28 09:42
行业与公司 * 纪要主要探讨中国人工智能(AI)行业,特别是大模型、多模态AI、AI智能体(Agent)的发展现状、商业化路径及竞争格局[1] * 核心涉及的公司包括字节跳动、阿里巴巴、腾讯、百度(提及较少)、谷歌(Google)、Meta(OpenAI)等国内外科技巨头[2][3][4][5][6][7][8][9][10][11][12][13][14][15][16][17][18][19][20][21][22][23][24][25][26][27][28][29][30][31][32][33] 字节跳动的AI布局与进展 * 智能体平台“扣子平台”在国内智能体量和开发者数量上领先竞争对手[3] * 基于豆包2.0大模型的“豆豆包工坊”可生成小软件或应用,类似阿里的灵光[2][3] * 文生视频产品“即梦”日活跃用户数达300万,为国内第一,但全年平均收入仅约3,000万至4,000万[2][3] * B端业务火山云和maMAAS占据全国一半市场份额,但因优惠力度大收入不高,未来将通过增加营销、广告功能提升回报[3][4] * 豆包2.0大模型参数量提升至1T以上,增强抖音自媒体文案生成、电商营销方案等特定功能,并提升多轮交互和调用原生工具能力[2][5] * Token调用量分布:内部使用占1/3(其中80%用于搜广推和内容理解),豆包C端应用消耗14~15万亿Tokens,公有云对外输出约5~6万亿Tokens[31];即梦(原文为吉梦)日消耗Tokens从去年基本为零增长至1万亿,是今年增长最快的方向[31][32] 阿里巴巴的AI策略与优势 * 阿里“灵光”APP不再依赖通识模型操作软件,而是根据用户需求现场生成程序,旨在逐步取代部分软件功能[2][7] * 通过“千问”整合高德地图、饿了么等服务,实现流量引导,提升服务使用率,并通过会员体系(如八八会员)提供免费使用权以增强用户粘性[2][8][9][11] * 阿里在多模态能力上综合实力领先字节跳动,通常比字节早2~3个月发布相似功能,2025年下半年起差距扩大至3~6个月,在视频生成、语音模型等细分领域已超越字节[27][28] * 文生视频模型“万象2.5”能够同步生成带声音的视频,与谷歌VIO 3系列对标,在美感上不相上下甚至略有优势[30] * 阿里云服务器监控、算账及打车业务离线分析等B端场景适合Agent应用;百炼平台客户留存率和付费意愿更高[10] 腾讯的AI生态挑战 * 腾讯在AI生态上前期缺乏投入,导致基础日活用户不足,AI助手和对话功能未能有效吸引用户留存[26] * “元宝”作为对话型AI助手,难以长期留住国内用户,在生态系统方面不如千问,若不能迅速积累足够日活,其发展将受限[14][33] * 腾讯在2025年第三季度放缓了相关投入[33] 多模态AI的进展与影响(以Gemini 3为例) * Gemini 3模型在多模态理解(视频与文本高度融合)方面取得突破,能够处理复杂任务(如生成PPT),可能替代传统Office套件,标志着多模态市场进入新阶段[15][16] * 该技术将极大拓展市场需求空间,例如可实现更高级别的视频内容理解和精准推荐,提升广告投放精准度,带来巨大的B端API新增需求[21] * 谷歌凭借技术壁垒、TPU生态系统及强大的商业化版图(硬件、安卓、Google Cloud、搜索引擎),其他公司难以迅速追赶[19] * Meta需要跟进多模态技术以优化广告业务,但进展不顺利,其投入主要围绕自身业务进行低成本自用[20][24] AI商业化模式与竞争格局 * 国内公司商业化节奏更快,字节跳动早在两年前就开始试水各种模式[9];阿里策略是通过整合自身生态系统服务,不直接收费而是流量变现[9] * C端用户需要的是具体功能(如拍题解题、智能体对话、学习和工作场景),而非多轮对话的AI聊天,因此提供专业化服务和场景功能对提高用户留存至关重要[11][12] * 拥有强大生态系统(如阿里的地图、生活服务)的公司,在提供高价值实际服务、增强用户粘性和变现能力方面更具优势[11][12] * 未来竞争格局中,千问若经营顺利市场份额有较大增长空间;腾讯的“元气平台”类似低代码智能体平台,可通过小程序实现智能体调取,但需先提升日活[13][14] 技术细节与市场观察 * 文生视频领域分为导演系(注重画面精细度、美感,转场慢)和生活类/自媒体类(强调快节奏、逼真度),国内主流模型如阿里万象2.5属导演系[29] * 国内在多模态功能(如图片修改、文字处理)上与谷歌存在差距,主要由于谷歌先进的Token处理架构[30] * 生成式大模型(参数量约0.5B到3B)在广告搜索推荐中效果显著提升,同时算力消耗与上一代模型无异,使用新硬件可大幅降低成本[25] * 谷歌Chrome AI功能月活已达1亿,广告转化效果显著,每月约有80多亿次点击[22][23];Meta计划2026年投入1,000亿美元用于相关领域[22][24]