语音博客模型

搜索文档
视觉+语音能力加持,火山引擎打造更有“人感”的AI交互体验
财富在线· 2025-06-18 10:56
豆包大模型产品发布 - 火山引擎正式发布豆包大模型1.6、豆包·视频生成模型Seedance 1.0 pro、豆包·语音博客模型,同时豆包·实时语音模型全量上线 [1] - 豆包大模型家族已形成全模态、全尺寸、高性价比的领先模型矩阵 [1] - 全球Top10手机厂商中,有9家与火山引擎深度合作,豆包大模型已覆盖4亿终端设备 [8] 多模态交互技术突破 - AI多模态交互大模型推动人机交互迈入全新时代,通过视觉、听觉等多通道响应交互需求 [1] - 豆包大模型支持深度语义理解,用户可通过语音提问或"画圈"方式圈选关键内容进行交互 [3] - 豆包语音大模型能识别嘈杂环境或多样化口音,并模拟多样化音色、语气和语调 [2] 智能终端应用案例 - OPPO引入豆包语音大模型,实现精准信息召回,支持模糊搜索与全局搜索 [6] - 努比亚接入豆包大模型后打造全链路多模态智能助手「小星」,实现"指哪搜哪"功能 [3] - 三星Galaxy Z系列手机通过豆包大模型提供旅行搜索服务,以短视频内容卡片形式展现 [8] 行业发展趋势 - 新一轮科技革命与产业变革兴起,AI技术重塑新一代生活方式 [1] - 手机正成为工作生活中不可或缺的"智能伙伴",推动生活方式向高效便捷升级 [5] - 从图像识别到自然语言处理,人机交互方式持续迭代进化 [8]
豆包视频生成模型Seedance 1.0 pro正式发布 实时语音模型同步全量上线
快讯· 2025-06-11 13:29
豆包视频生成模型Seedance1 0pro发布 - 火山引擎在"2025火山引擎春季FORCE原动力大会"上正式发布豆包视频生成模型Seedance1 0pro [1] - Seedance1 0pro具备无缝多镜头叙事、多动作及随心运镜功能 并能稳定运动保持真实美感 [1] - 该模型定价为0 015元/千tokens(tokens是语言生成模型的最小工作单元) [1] 豆包实时语音模型相关发布 - 火山引擎总裁谭待宣布豆包实时语音模型全量上线 [1] - 会上同时正式发布了语音博客模型 [1]