Workflow
晚点独家丨快手提高可灵 AI 的优先级,组建一级部门
晚点LatePost·2025-04-30 17:22

组织架构调整 - 快手成立可灵AI事业部,下设产品部、运营部和技术部,负责可灵、可图等大模型业务,由高级副总裁盖坤担任负责人[3] - 社区科学线下成立基础大模型与应用部,专注LLM大模型、多模态理解大模型及应用技术研发[3] - 可灵AI升级为与主站、商业化等并列的一级部门,直接向CEO程一笑汇报,是近3年唯一新设的独立事业部[3] 业务表现与战略定位 - 可灵AI"图生视频"功能综合效果全球第一,商业化以来累计营收超1亿元,2025年前三月营收已超2024年下半年总和[5] - 公司内部将AI视为核心战略,此次调整旨在强化资源调配灵活性,保持视觉大模型领域竞争优势[5] - 可灵发展路径优先保证模型效果,聚焦专业创作者(P端),目标成为AI视觉生产领域全球领先者[5] 技术投入与行业对比 - 快手是押注视频模型最坚定的中国互联网公司之一,2023年初启动AI战略,2024年Sora发布后进一步倾斜资源[6] - 可灵采用与Sora相同的DiT技术路线,2024年6月上线全球首个面向普通用户的视频大模型[7] - 行业多数公司侧重语言/图片模型:百度明确不投入视频模型,字节跳动优先视觉理解,腾讯侧重文本模型[6] 技术优势与市场表现 - 可灵团队复用社区科学线原有视频处理能力,快速完成数据规范化处理,相比同业节省大量基础搭建时间[7] - 可灵1.6pro在AI基准测试中以1000分登顶图生视频赛道,超越Google Veo 2和Pika Art[7] - 可灵2.0对比谷歌Veo2和Sora的胜负比分别达205%和367%,图像模型可图2.0同样居业内第一[8] 发展挑战与未来规划 - 当前视频生成模型仅覆盖数字媒体市场不足20%份额,行业30日用户留存率普遍为4%-5%[8] - 服务1亿日活需约40万张算力卡(相当于10个算力中心),成本压力显著[8] - 公司提出2025年"跨越式增长"目标,同时持续投入研发保持技术领先[8] - 技术路线仍存争议,可灵提出Multi-modal Visual Language交互理念以提升多模态创意表达[9] 历史机遇与长期愿景 - 公司视AI为继移动互联网后的新起点,希望复刻2013年从GIF转型短视频的成功路径[9] - 影视、广告等行业加速渗透,内部对可灵带来的"兴奋感和战斗力"给予高度评价[9]