Workflow
视觉+语音能力加持,火山引擎打造更有“人感”的AI交互体验
财富在线·2025-06-18 10:56

豆包大模型产品发布 - 火山引擎正式发布豆包大模型1.6、豆包·视频生成模型Seedance 1.0 pro、豆包·语音博客模型,同时豆包·实时语音模型全量上线 [1] - 豆包大模型家族已形成全模态、全尺寸、高性价比的领先模型矩阵 [1] - 全球Top10手机厂商中,有9家与火山引擎深度合作,豆包大模型已覆盖4亿终端设备 [8] 多模态交互技术突破 - AI多模态交互大模型推动人机交互迈入全新时代,通过视觉、听觉等多通道响应交互需求 [1] - 豆包大模型支持深度语义理解,用户可通过语音提问或"画圈"方式圈选关键内容进行交互 [3] - 豆包语音大模型能识别嘈杂环境或多样化口音,并模拟多样化音色、语气和语调 [2] 智能终端应用案例 - OPPO引入豆包语音大模型,实现精准信息召回,支持模糊搜索与全局搜索 [6] - 努比亚接入豆包大模型后打造全链路多模态智能助手「小星」,实现"指哪搜哪"功能 [3] - 三星Galaxy Z系列手机通过豆包大模型提供旅行搜索服务,以短视频内容卡片形式展现 [8] 行业发展趋势 - 新一轮科技革命与产业变革兴起,AI技术重塑新一代生活方式 [1] - 手机正成为工作生活中不可或缺的"智能伙伴",推动生活方式向高效便捷升级 [5] - 从图像识别到自然语言处理,人机交互方式持续迭代进化 [8]