可灵数字人2.0
搜索文档
5天连更5次,可灵AI年末“狂飙式”升级
量子位· 2025-12-10 12:26
12月伊始,可灵AI接连放出大招。 全球首个统一的多模态视频及图片创作工具 "可灵O1" 、具备"音画同出"能力的 可灵2.6模型 、 可灵数字人2.0 功能…… 5天内5次"上新" ,直接让生成式AI领域的竞争"卷"出新高度。 可灵O1,从图片到视频,带来更强的"可控性" 可灵2.0发布的时候,就创新性地提出过一个全新交互理念—— Multimodal Visual Language (MVL) ,让用户能够结合图像参考、视频 片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意,直接高效地传达给AI。 基于MVL理念,在最新的一次迭代中,可灵O1将所有生成和编辑任务融合于一个全能引擎之中,为用户搭建全新的多模态创作流,实现从灵 感到成品的一站式闭环。 允中 发自 凹非寺 量子位 | 公众号 QbitAI 就像a16z投资合伙人Justine Moore在产品发布后第一时间点评的那样: 我们终于迎来了视频界的Nano Banana。 以可灵视频O1模型为例,它打破了传统单一视频生成任务的模型边界,将 参考生视频、文生视频、首尾帧生视频、视频内容增删、视频修改 变换、风格 ...
腾讯研究院AI速递 20251205
腾讯研究院· 2025-12-05 00:16
生成式AI 2. 模型精通体态动作、手势、表情、镜头语言,口型效果真实自然,手部细节大幅提升,无惧特写; 3. 在多维度客观评测中效果胜负比综合得分远超同类产品,单次生成视频时长支持5分钟,覆盖深度科普、歌曲演绎 等长内容场景。 https://mp.weixin.qq.com/s/IbHKzsWYyVUxO_flqo400g 一、OpenAI代码泄露!最强模型「皇帝」登基,0思考延时 1. OpenAI四个神秘新模型在DesignArena测试,均为"企鹅家族",推理预算分别为Emperor(512)、Rockhopper (64)、Macaroni(16)和Mumble(0); 2. 内部代码流出显示OpenAI正开发"记忆搜索"功能,用户可通过提问快速检索存储的记忆信息,解决当前记忆管理 界面难用的痛点; 3. 有付费用户称对话中收到ChatGPT广告推送引发取消订阅潮,外界猜测OpenAI可能提前发布GPT-5.2以应对谷歌 Gemini竞争压力。 https://mp.weixin.qq.com/s/fswchZ8a8YClow1yHO6ifg 二、可灵新一代数字人 2.0 已全量上线!不止会说,更 ...