Workflow
可灵AI推出全新数字人功能

产品核心功能 - 通过上传一张角色图片并输入文字或音频,即可一键生成最长1分钟、最高1080p分辨率、48FPS高帧率的数字人视频 [1][3] - 产品支持生成写实人物、动漫、动物等多种角色,并支持中英日韩多语种,结合会员优惠最低价格为0.12元每秒 [1][3] - 提供一站式解决方案,支持用户上传自有素材或使用内置官方形象库、AI生图功能及近百种TTS音色,完成从角色创建到配音的全流程 [3] 技术能力与表现力 - 在口型精准度上达到业界领先水平,唇形能与快速变化的歌词音节完美贴合,即使面对多语种、歌唱或极快语速的台词也能保证同步 [1][4][7] - 可通过提示词精细化控制角色情绪与肢体语言,实现从听声音到懂意图的跨越,将抽象情绪转化为具体面部微表情和动作 [5][6] - 展现出优秀的跨风格泛化性能,无论是写实人物、动漫卡通或动物形象均可生成高质量视频,例如生成随节奏说唱摇摆的卡通猫 [4] 技术架构与行业地位 - 技术依托多模态理解大模型与视频生成模型的深度融合,采用音画高度对齐的交叉注意力机制和关键帧控制架构,实现身份一致前提下的无限长度视频生成 [6][7] - 在专业测试中,与行业产品Heygen及即梦数字人对比,整体GSB得分分别达到1.37和2.39,在整体效果及多个细分维度上表现优异 [7] 公司背景与市场影响 - 可灵AI作为全球领先的视频生成大模型,自2024年6月发布以来已完成超30次迭代,用户规模突破4500万,生成视频数量超2亿 [8] - 公司为超过2万家企业提供API服务,覆盖广告、影视、游戏等多个领域,新产品旨在降低行业创作门槛,推动在短视频、电商直播、在线教育等领域的规模化应用 [1][8]