文章核心观点 - 大模型厂商面对DeepSeek爆火有不同应对策略,百度文小言完成品牌焕新与功能升级,将自研模型与第三方模型深度融合,提升多模态能力,找到与新生力量开放相处之道,其策略或成未来AI演进主线,用户将受益 [1][3][17] 各部分总结 补齐DeepSeek的多模态短板 - 2023年大模型早期比拼长文本处理能力,2024年多模态能力发展,2025年DeepSeek-R1让关注回到通用大模型,但多模态交互需求未满足 [5] - DeepSeek强大但多模态有短板,输入输出全是文字,腾讯元宝接入未带来多模态增益价值 [6] - 新版文小言将文心X1、文心4.5与DeepSeek-R1多模型融合调度,用户可切换或选自动模式 [8] - 文心X1能自主调用工具完成连续任务,推理输出可图文混合呈现;文心4.5多模态交互理解强,能实现多种多模态功能 [8] - 文小言语音大模型全新升级,支持方言对话等场景,是业界首个基于全新互相关注意力的端到端语音语言大模型,调用成本降低50%-90%,响应速度快 [8][10] 更多场景更多玩法 - 新版文小言借助多模型融合和多模态理解,带来更多AI使用场景和想象空间,如制作动画、装修设计、辅导功课等 [10] - 文小言可一条龙解决动画制作,还能为装修设计生成效果图及说明,新增解题老师功能,多模态解题指导做题方法 [10][12][14] - 文小言新语音模型能识别儿童发音,理解儿童习惯,可切换音色和方言,避免尴尬局面 [16] 写在最后 - 大模型竞争未来是让AI能力更高效便捷触达用户,百度在AI领域经验丰富,有本地化优势 [17] - 百度近期开放升级姿态明显,文小言采用“模型矩阵+自动调度+生态开放”策略构建产品护城河,提升用户体验 [17]
深度融合DeepSeek和多模态,百度文小言找到了自己的开放之道