HiClip

搜索文档
智象未来亮相 WAIC:多模态智能体,重塑创作的未来版图
财富在线· 2025-07-29 11:28
公司战略与商业化路径 - 公司以"解决真实创作痛点"为导向,探索"技术筑基、场景破局、价值闭环"的商业化路径 [1] - 构建"MaaS-SaaS-RaaS"递进商业化体系:MaaS为根基打造百亿级多模态基础模型,SaaS为桥梁开发垂直场景产品,RaaS为终局直接交付可落地成果 [1][2][3] - 多模态生成平台已服务于影视制作、产品营销、文旅互娱等领域,实现技术研发到商业价值的闭环 [3] 技术突破与核心优势 - 多模态基础模型历经三次迭代:2023年8月1.0版本(扩散模型DiT),2024年6月2.0版本(扩散自回归模型DiT+AR),2024年12月3.0版本(MoE多场景学习) [4] - 技术优势体现为语义一致性(IP故事活化保持风格统一)、精准可控性(支持个性化定制)、影视级画质(4K分辨率、长时序稳定输出) [4] - 视频生成领域突破时空一致性难题,通过扩散自回归模型(DiT+AR)使生成内容更贴近真实物理世界规律 [9] 产品与市场表现 - HiDream系列开源模型累计下载量超60万次,被Diffusers库、ComfyUI、Recraft等主流工具集成 [6] - HiDream-I1开源后24小时内登顶Artificial Analysis榜单,成为首个问鼎榜首的中国自研模型,Hugging Face实时排名全球第一 [6] - HiDream E1.1跻身Artificial Analysis图像编辑智能体榜单第一梯队,性能超越Flux.1 Kontext等主流模型 [7] 产品形态与功能 - 以智能体为核心构建工具链,vivago agent聚焦短视频二创,支持多模态输入、智能拆解、交互式生成 [11] - 即将发布长视频编辑智能体HiClip,通过多模态语义理解实现高光片段提取、跨平台适配剪辑 [11][12] - 创作工具箱形成"生成-编辑-优化"闭环,包含AI口播、视频模板、运动笔刷、虚拟换衣、图像超分等功能 [9] 生态合作与行业影响 - 携手跨境、互联网、影视、新媒体、文旅等多领域伙伴,构建"技术-场景-生态"共赢格局 [13] - 视频生成产品支持4K高清画质、全局/局部可控及剧本多镜头生成,被评价为"重新定义AIGC美学标准" [6] - 开源交互式编辑模型HiDream-E1通过自然语言指令完成图像生成及编辑,降低创作门槛 [6]