字节跳动布局情感大模型 - 公司旗下火山方舟大模型平台计划上线"情感大模型"API服务,豆包则坚持自研路线,形成"火山开放,豆包自研"的双轨策略[1] - 火山引擎相关负责人否认"情感大模型"计划,但行业信息显示该技术能识别53种人类情绪,实现拟人化情感交互[2] - 公司计划通过垂类大模型带动豆包月活在2025年翻倍,并围绕抖音生态推进娱乐、社交场景渗透,同时强化火山引擎ToB输出能力[14] 情感大模型技术特性 - 技术核心在于"理解情绪+精准回应",通过分析语调、停顿、表情实现接近真人的交互体验[3][4] - 技术演化形成两条路径:通用大模型增强多模态情感计算能力,或专注情感领域的生成式大模型[5][6] - 训练算力需求比通用模型高30%-50%,需采用端到端形式且依赖特殊数据,但相比传统模型在算力使用上更高效[10] 行业市场前景 - 腾讯研究院预测未来2-3年人机陪伴市场将爆发,全球AI伴侣市场规模预计从2023年3000万美元增至2030年1500亿美元,年均复合增长率236%[7] - CharacterAI移动端下载量超3432万,网页月访问量3.1亿;消费类机器人2024年全球出货4700万台,未来5年复合增长率超20%[10][17] - GPT-4o等多模态模型加速情感陪伴落地,国内外企业已推出AI玩具、桌面机器人等产品,涉及儿童教育、情感治愈等场景[11][12][13] 技术发展趋势 - 国内技术比国外晚约1年,但在MoE架构和多模态学习方面取得进展,未来通用大模型可能融合情感、文生视频等细分模型[11][17] - HumeAI的EVI系统能检测53种情绪,其CEO认为情商是AI界面核心要求,需推断用户真实需求并执行[15] - 行业下一阶段进化方向可能是"世界模型",具备物理直觉和未来状态推演能力,但当前仍面临算力消耗、数据隐私等技术瓶颈[17]
字节藏了一手“牌”
虎嗅·2025-07-12 15:27