万相
搜索文档
【转|太平洋传媒-AI 视频深度】模型加速迭代,工具和 IP 价值凸显
远峰电子· 2026-03-22 19:57
文章核心观点 - 2025年以来,海内外视频生成模型在性能上加速迭代,已具备L3短片级内容制作能力,推动全球影视行业迈入AI普及期 [3][6] - 目前AI在影视行业的渗透率仅约1.4%,仍处于较低水平,随着模型和视频工具的进一步迭代,行业渗透率有望迎来爆发式增长 [4][6] - 在产业链中,AI视频工具作为模型能力转化为生产力的核心载体,价值凸显;同时,拥有海量可视频化内容库的IP公司有望充分受益于本轮AI视频浪潮,实现内容资产价值重估 [5][6] 1. 视频模型:海内外差异化竞争,已支持短片级内容创作 - **技术发展历程**:AI视频模型经历了技术架构扩散期(2014-2022年)、DiT架构普及期(2024年)和技术快速迭代期(2025年以来)三大阶段,目前处于快速迭代期 [11] - **海外模型优势**:海外模型在物理模拟、保真度等前沿能力上率先突破。例如,OpenAI Sora2单次生成时长最长达25秒,原生分辨率达准2K,物理规律合规率较前代提升超一倍;谷歌Veo3.1在视频生成质量上领跑全球 [15][17][34][35] - **国内模型特点**:国内模型聚焦可控性、多模态交互与本土场景适配,形成差异化竞争。快手可灵主体一致性超96%;字节Seedance 2.0生成15秒视频的可用率或达90%;阿里万相以中文创作需求为核心 [24][26][27] - **模型能力现状**:主流模型已支持L3短片级内容创作,部分能力可达L4长片级要求。具体表现为:原生分辨率最高达准2K,单次生成时长最长25秒;支持音画同步输出;可控性与物理模拟能力持续增强 [3][30][33][39] - **演进趋势**:模型向高清长视频演进(海外重分辨率,国内重时长);生成速度提升、成本优化(海外定价整体高于国内);输入端实现多模态混合,输出端实现音画同出;可控性及对专业创作流程的适配性增强 [30][31][32][33] 2. 影视场景:细分领域渗透率提升,降本增效驱动增长 - **整体渗透率**:全球视频制作市场规模约3163亿美元,目前全球AI视频市场规模约45亿美元,渗透率仅1.4%,提升空间巨大 [4] - **漫剧领域**:AI在内容制作环节应用比例达50%-80%,推动供给爆发式增长。2025年Q4,AI漫剧数量在漫剧榜单中占比超70%。现象级作品《斩仙台下,我震惊了诸神!》由10人团队10天以15万元成本完成,累计分账收入达140万元 [4][43][45] - **真人短剧领域**:从“AI+实拍”发展到全AI制作,AI仿真人剧快速起量。头部作品《斩仙台AI真人版》上线6天抖音播放量破亿,部分作品已跑通商业化,ROI突破1.1 [4][47][48] - **电影电视剧领域**:目前仍以AI辅助制作为主。AI动画电影已率先落地(如《团圆令》),而真人电影仍处起步阶段,与实拍电影存在差距 [4][49][54] - **降本增效作用**:AI在影视素材拍摄环节显著降本,同时通过压缩内容制作周期、丰富内容题材及形式进行增效 [4] 3. AI视频标的梳理:视频工具为核心,IP环节受益最大 - **产业格局**:形成了视频模型公司、IP及影视公司、第三方工具公司协同发展的格局 [5] - **视频工具公司**:AI视频工具是模型能力转化为实际生产力的核心载体,依赖于模型技术支撑和专业视频制作实践积累。拥有技术领先优势的AI视频工具公司更易依托自身创作能力与平台生态产出优质内容 [5] - **IP及影视公司价值**:IP公司因具备海量可视频化的内容库资源,有望充分受益于AI视频工具的成熟,实现内容资产价值重估 [5][6] - **第三方工具公司**:目前以初创公司为主,聚焦垂类应用场景 [5]
京东回应成立“变色龙业务部” :AI技术商业化加速落地;荷兰法院裁定一桩婚姻因AI撰写结婚证词而无效丨AIGC日报
创业邦· 2026-01-09 08:08
行业动态:AI技术产品化与商业化加速 - 阿里云发布集成通义系列大模型的多模态交互开发套件,预置十多款生活休闲、工作效率等领域的Agent和MCP工具,旨在应用于AI眼镜、学习机、陪伴玩具、智能机器人等硬件设备 [2] - 京东成立“变色龙业务部”,全面承接JoyAI App、JoyInside、数字人等核心AI产品的打造与商业化,旨在整合资源提升商业化效率,并宣布第二批自研AI玩具将于1月中旬全面上线 [2] 市场研究:企业AI投资趋势分化 - 一项针对200家德国中小企业的研究显示,其2025年在AI技术上的投入占营收比例预计为0.35%,较2024年的0.41%有所下降 [3] - 相比之下,所有企业的AI平均投入占营收比例从2024年的0.40%升至2025年的0.5%,德国中小企业的AI投资规模较整体市场水平低约30% [3] - 研究指出地缘政治紧张局势和早期AI应用案例未达预期效率提升,是德国中小企业削减AI投资的原因 [3] 法规与风险:AI应用的法律边界 - 荷兰法院裁定一桩婚姻因使用ChatGPT撰写的结婚证词不符合法律要求(未包含必要的法律声明)而无效,明确了AI工具在严肃法律程序中的应用限制 [2]
阿里云发布多模态交互开发套件 助力硬件实现“能听、会看、会交互”
环球网· 2026-01-08 17:41
公司动态:阿里云发布多模态交互开发套件 - 阿里云在通义智能硬件展上正式推出多模态交互开发套件 [1] - 该套件集成了千问、万相、百聆三款通义基础大模型 [1] - 套件预置了生活休闲、工作效率等领域的多款智能体与工具 [1] - 套件旨在为AI眼镜、学习机、陪伴玩具、智能机器人等硬件设备赋予更强的感知、理解和交互能力 [1] 产品技术细节 - 套件已兼容30多款主流的ARM、RISC-V及MIPS架构终端芯片平台 [3] - 未来通义大模型将与玄铁RISC-V进行全链路协同优化 [3] - 公司针对多模态交互场景推出专用模型,支持全双工语音、视频、图文等多种交互方式 [3] - 其端到端语音交互时延可降至1秒,视频交互时延不超过1.5秒 [3] - 套件预置了涵盖生活、工作、娱乐、教育等场景的十余款智能体与工具 [3] - 套件接入阿里云百炼平台生态,支持调用第三方模板及兼容多方智能体协议 [3] 应用场景展示 - 在AI眼镜场景中,融合千问VL、百聆CosyVoice等模型,实现了同声传译、拍照翻译、多模态备忘等一体化功能 [4] - 在家庭陪伴机器人方面,可实现异常监测、告警推送、视频定位及人机对话等综合服务 [4] 行业背景与公司地位 - 随着多模态大模型技术逐渐成熟,硬件设备通过接入大模型提升交互体验已成为行业趋势 [3] - 单一基础模型往往难以兼顾低成本、低时延、功能丰富与高质量效果等多元需求 [3] - 阿里云此次发布的开发套件,致力于为硬件企业与解决方案商提供低门槛、快响应、多场景的开发支持 [3] - 根据Gartner报告,阿里云在云基础设施、工程、模型及知识管理应用四大维度均入选“新兴领导者”象限 [4] - 阿里云是亚太地区唯一在此四项均获评的领导厂商,与谷歌、OpenAI等国际企业并列 [4]
阿里云发布全新多模态交互开发套件 可应用于AI眼镜、机器人等
智通财经· 2026-01-08 14:22
产品发布与核心功能 - 阿里云全新发布集成通义千问、万相、百聆三款基础大模型的多模态交互开发套件 [1] - 该套件能听、会看、能思考并与物理世界交互,可应用于AI眼镜、学习机、陪伴玩具、智能机器人等硬件设备 [1] - 套件预置了十多款覆盖生活休闲、工作效率等领域的Agent和MCP工具 [1] 技术适配与性能优化 - 套件在芯片层面适配了30多款主流ARM、RISC-V和MIPS架构终端芯片平台,满足绝大多数硬件设备的快速接入需求 [1] - 未来通义大模型将与玄铁RISC-V实现软硬全链路协同优化,以实现大模型在RISC-V架构上的极致高效部署和推理性能 [1] - 阿里云针对多模态交互场景推出专有模型,全面支持全双工语音、视频、图文交互,端到端语音交互时延低至1秒,视频交互时延低至1.5秒 [1] 应用场景与解决方案 - 套件预置的MCP工具和Agent覆盖生活、工作、娱乐、教育等多个场景,例如出行规划Agent可调用路线规划、旅行攻略等能力 [1] - 在AI眼镜领域,基于千问VL、百聆CosyVoice等模型打造了完整交互链路,可实现同声传译、拍照翻译、多模态备忘录、录音转写功能 [2] - 面向家庭陪伴机器人场景,解决方案可实时监测异常状况并告警,支持用户基于关键词查找视频、与机器人对话及控制设备 [2] 生态扩展与平台能力 - 该套件接入了阿里云百炼平台生态,用户可添加其他开发者提供的MCP和Agent模板 [2] - 套件通过A2A协议兼容三方Agent,极大程度扩展了应用能力边界,帮助企业灵活搭建业务场景 [2]