Workflow
Voice - Agent
icon
搜索文档
作业帮亮相2025AI+研发数字峰会 展示多模态交互技术创新成果
中金在线· 2025-06-12 14:48
2025AI+研发数字峰会 - 峰会在上海举办 主题为"拥抱AI 重塑研发" 汇集百度 阿里 腾讯 华为 作业帮等头部互联网企业及高校专家 [1] - 作业帮资深算法专家周舒然受邀演讲 分享多模态交互技术的前沿探索与教育场景落地实践 [1] 多模态交互技术突破 - 传统语音交互存在响应慢 理解偏差 体验割裂等问题 大模型技术为重塑体验提供新可能 [3] - 2023年推出"理解-推理-生成"多模态融合方案 整合语音识别 NLP与语音生成 显著提升交互效率与智能化水平 [3] - 研发Instruct and Context-Awared TTS系统 实现基于上下文的拟真情感语音合成 [3] - 开发LLM-Based ASR and Audio Chat系统 支持语音到文本直接回复 可识别用户语音情感 [3] 端到端技术升级 - 2024年突破技术瓶颈 推出全端到端语音和流式全双工交互系统 [4] - 通过创新数据链路 Tokenizer设计 多模块融合及推理优化 大幅缩短首次响应时间(TTFT)和首次语音生成时间(TTFS) [4] - 语音交互被视为未来Kernel级应用 公司将持续投入Voice-Agent技术研发 [4] 教育场景规模化应用 - 多模态技术已应用于DAU超1200万的教育行业Top1产品快对AI [6] - AI口语老师方案实现动态对话教学 智能纠错和联想互动 有效解决"哑巴英语"问题 [6] - 语音交互被定位为教育领域核心接口 Voice-Agent与学习内容互动已形成明确PMF场景 [6]