Workflow
划时代的多模态入口
国盛证券·2025-05-28 18:27

报告行业投资评级 - 增持(维持) [5] 报告的核心观点 - 豆包App实时通话功能升级,新增视频聊天问答功能,使用便捷,基于视觉理解模型重大升级,具备多模态信息融合处理、复杂任务处理及实时联网检索三大核心能力,实现从静态图像到动态视频的跨越,为场景化AI交互筑牢基础 [1][17] - 相比传统AI助手一问一答的交互方式,豆包视频通话功能通过视觉信息的引入构建自然语境,降低用户描述需求、整理prompt的门槛,交互更自然精准,在博物馆场景中用户提问准确率较纯语音输入提升40%,多模态交互令老年用户使用意愿提高65%,此次升级标志着AI交互的重大突破,未来有望催生更多创新交互方式与应用场景 [2][19] 根据相关目录分别进行总结 豆包App实时通话功能升级,支持视频聊天问答 - 5月23日,豆包App实时通话功能全面升级,新增视频聊天问答功能,用户在工作、生活、学习场景中遇问题,可随时通过视频与豆包对话获取解答,更新至最新版后,于对话框选择“打电话”,点击“视频通话”即可开启 [1][11] - 视频通话功能基于豆包视觉理解模型的重大升级,具备多模态信息融合处理、复杂任务处理及实时联网检索三大核心能力,实现从静态图像到动态视频的跨越,技术团队优化模型架构,将平均响应延迟控制在800毫秒内,且模型具备情境保持能力,为场景化AI交互筑牢基础 [1][17] 建议关注 - 算力:寒武纪、海光信息、阿里巴巴等多家公司 [3][21] - Agent:金山办公、泛微网络、金蝶国际等多家公司 [3][22] - 军工AI:品高股份、普天科技、能科科技、海格通信等 [3][23]