Workflow
AIGC视频
icon
搜索文档
行业最大融资,字节离职大哥搞AI视频:阿里投资4.3亿 用户破亿
36氪· 2025-09-16 20:25
- 01 - 爱诗科技的创始人叫王长虎,是位80后(1982年生),出生于辽宁本溪。2009年,他从中国科技大学毕业(博士),加入了微软亚洲研究院,一干就是8 年。 直到2017年,他跳槽至字节跳动,担任AI Lab总监,主导抖音和TikTok从0到1的视频AI能力建设。 从这段经历看,王长虎的背景聚焦在AI视频。在中科大,他的研究方向是计算机视觉、视频理解、多媒体检索和机器学习等;在字节跳动,他主攻的也 是AI视频。 但随后,他从字节跳槽至龙湖集团,这段经历就有点小插曲:担任AIoT引擎团队总经理,负责数字化与智能化转型。 AI生成视频赛道,最近打破了个记录:爱诗科技完成超过 6000 万美元融资(B轮),领投方是阿里巴巴。该融资(约4.26亿元),打破了AIGC视频最大 单轮融资记录(国内)。 那么问题来了。这笔融资背后,究竟隐藏着怎样的超级机会,以至于让阿里如此重仓出击? 直到2023年4月,他创立爱诗科技,才算又回到AIGC视频赛道。 在产品策略上,爱诗科技是先国外再国内。2024 年 1 月,爱诗科技推出海外版产品 PixVerse。这是个利用AI制作视频的工具:用户输入照片或文字, PixVers ...
赛道Hyper | 百度取道特定场景攻略AGI视频
华尔街见闻· 2025-07-03 08:57
百度进军AI视频生成领域 - 公司推出视频生成MuseSteamer模型及"绘想"平台 瞄准搜索、广告和推荐场景的原生化内容生产痛点 [1] - 与Sora等通用视频生成模型不同 公司选择聚焦特定场景的视频生成 避免长期投入风险 [1][7] - 技术团队解决了中文语境下多模态语义对齐的核心挑战 实现视觉元素与声音信息的自然协同 [1][2] MuseSteamer模型技术特点 - 采用"场景颗粒度拆解"方案 将亿级中文视频数据分为23个高频场景 并细分为"动作-情绪-效果"三级标签 [2] - 在电商场景中 模型能精准理解"这件裙子垂感很好"等描述 并匹配对应的音画表现形式 [2] - 支持一体化生成带音效和人物台词的视频 可生成5秒和10秒两个版本 均达到1080p清晰度 [4] 商业化应用与竞争优势 - 推出Turbo、Lite和Pro三个版本 分别面向中小商家试错成本敏感和专业机构时间成本痛点 [4][6] - 有声版支持粤语、川语等8种方言即时生成 大幅降低区域化营销内容的边际制作成本 [7] - 与百度广告平台深度协同 利用亿级用户互动数据优化模型 形成数据壁垒 [9] 行业竞争格局 - 快手可灵AI在1080p模式下生成5秒视频仅需不到60秒 年化收入运行率突破1亿美元 [7] - 公司采取差异化竞争策略 专注搜索、广告等商业场景而非泛娱乐内容 [7][8] - 模型生成的视频可直接接入百度信息流广告系统 实现"创作-分发-反馈"闭环 [8] 技术落地与行业趋势 - 行业竞争焦点从"能不能生成"转向"生成的内容能不能用" [11] - 公司通过精准捕捉商业场景需求 提供技术落地的可行范式 [11] - 填补传统视频制作流程中的效率洼地 推动AIGC视频工具的商业化应用 [11]