AI视频生成
搜索文档
速递|OpenAI 计划将Sora接入ChatGPT,Sora的生成能力或扩展到图像
Z Potentials· 2025-03-01 11:53
Sora集成到ChatGPT计划 - OpenAI计划将AI视频生成工具Sora直接集成到ChatGPT中,以扩大产品协同效应 [2][3] - 集成后的Sora版本可能无法提供与独立Web应用相同的视频编辑控制功能 [3] - 该举措旨在通过视频生成能力吸引用户升级ChatGPT高级订阅 [3] Sora产品发展路线 - Sora当前仅通过独立Web应用提供,支持生成最长20秒的电影风格视频片段 [2] - 公司正在开发Sora Turbo模型的新版本以增强现有功能 [6] - 团队积极招募移动工程师,计划未来推出独立的Sora移动应用程序 [4] 多模态能力扩展 - OpenAI研发基于Sora的AI图像生成器,可能比现有DALL-E 3模型产生更真实的照片 [5] - 公司致力于扩展Sora的内容创作范围,包括视频和图像生成能力的结合 [3][5] 产品战略考量 - 初期将Sora作为独立应用推出是为了保持ChatGPT的界面简洁性 [4] - 已逐步完善Sora网络体验,增加社区视频浏览功能以提升用户参与度 [4]
对话 PixVerse 王长虎:AI 视频生成可能通向新平台,Sora 只领先几个月
晚点LatePost· 2024-04-30 18:25
行业竞争格局 - Sora发布后被视为视频生成领域的领先者,其他模型如Runway、Pika、SVD、PixVerse等被比喻为"膜拜者"[4] - PixVerse是中国唯一进入全球视频生成领域第一梯队的产品,月访问量达140万,与Pika(200万)、Runway(600万)同属全球top3[6][10] - 国内所有公司视频生成产品访问量总和仅为PixVerse的三分之一[10] 技术发展现状 - Sora能生成60秒连贯视频,但实际用户需求更多是15秒以内的短视频[9] - 视频生成的ChatGPT时刻定义为普通用户能实时生成高质量视频,目前仍处于GPT-2到GPT-3阶段[9][13] - 当前视频生成模型普遍只能生成4-7秒视频,PixVerse可生成4秒,Runway通过拼接可达18秒[17][18] - 视频生成面临手指、尾巴等细节问题,可通过3D建模信息辅助优化[19] 公司战略与优势 - 公司坚持视频生成方向,认为视频内容最接近用户,团队有字节跳动视频AI技术积累[14][15] - 采用差异化策略,用更少资源(百卡级)达到与Pika、Runway同等水平[15][22] - 新融资将支持升级至千卡级训练,认为达不到此规模的公司将失去竞争力[22] - 同时布局模型层和应用层,目标直接服务C端用户,探索新内容平台可能性[27][28][29] 市场机会判断 - 大平台对AIGC内容持谨慎态度,这为创业公司创造了机会[9][29] - AI视频生成可能催生新内容平台,而非简单融入现有平台[29][30][32] - 全球市场同步推进,认为AI时代产品应面向全球[33][34] - 当前聚焦提升生成能力而非用户增长,商业化将基于ROI考量[36] 团队与资源 - 研发人员占比超70%,保持精简团队规模[38] - 创始人兼具学术和工业背景,有万卡GPU使用经验和国民级产品建设经历[41] - 新融资来自蚂蚁集团,金额达上亿元人民币[7]