行业投资评级 - 投资评级为看好,维持不变 [7] 核心观点 - DeepSeek v3.1 正式发布,在混合推理、响应速度及 Agent 能力三大维度构筑核心竞争力 [2][4] - 字节跳动开源 Seed-OSS-36B,具备强大原生上下文处理能力、灵活的推理预算控制和卓越的任务性能,成为开源社区新标杆 [2][4] - 百度蒸汽机视频模型升级 2.0 版本,作为全球首个中文音视频一体模型,实现行业内首次多人有声音视频一体化生成 [2][4] - 建议关注 AI 应用商业化潜力、大厂 to C AI Agent 打造、海外商业模式复制及 AI+游戏落地等细分赛道 [9] DeepSeek v3.1 发布 - 混合推理架构:模型同时支持"思考"与"非思考"双模式,用户可根据任务复杂度智能切换,实现高效推理 [9] - 响应速度提升:相比 DeepSeek-R1-0528 模型,DeepSeek-V3-Think 在输出 token 数减少 20% - 50% 的情况下,表现持平甚至更快 [9] - 增强的 Agent 能力:经过 Post-Training 优化,新模型在工具调用与智能体任务中的表现更加出色,执行复杂指令更稳定可靠 [9] 字节跳动 Seed-OSS-36B 开源 - 超长上下文处理能力:上下文窗口原生支持,512K 上下文可一次性处理 1600 页文档或数十万字内容,为长文档分析、代码库理解等场景提供支持 [9] - 思考预算功能:创新性引入"思考预算"功能,使用户能够灵活配置推理过程中的计算资源,智能平衡响应质量与推理速度 [9] - 高效推理优化:采用高效注意力机制与内存管理策略,在处理超长文本时仍可保持合理的推理速度与资源占用 [9] 百度蒸汽机模型升级 - 多人有声音视频一体化生成:行业首次实现多人有声音视频同时输出,毫秒级精准对齐语音、唇形、表情与动作 [9] - 多模态潜在空间规划技术:自主协调角色互动逻辑,确保电影级叙事连贯性;生成视频中文语音还原度超 98% [9] - 端到端影视级画质生成:支持专业级运镜控制能力,集成数十种镜头语言,可精准响应文本指令 [9] 建议关注细分赛道 - AI 应用商业化:关注工具型实力领先的快手、美图,AI 玩具商业化落地看好上海电影 [9] - 大厂 to C AI Agent:聚焦腾讯控股等具备流量分发、模型、数据优势的公司 [9] - 海外商业模式复制:关注广告、电商、教育垂直赛道 [9] - AI+游戏落地:关注 AI 布局积极的巨人网络、恺英网络等游戏厂商 [9]
AI系列跟踪(74):DeepSeekv3.1发布,字节开源Seed-OSS-36B,百度蒸汽模型升级