Sora 2 模型技术更新 - 新一代视频生成模型Sora 2在物理逻辑、画面一致性和真实感上相比初代Sora有显著提升,能够基于一张照片和一句提示词创作有剧情、有文案的短片 [3] - 模型在物理上更加精准和逼真,可控性有巨大飞跃,能够完成之前视频模型难以完成的任务,如精确模拟奥林匹克体操动作和浮力等动态,并配备同步音频 [7] - 测试显示其镜头语言丰富,对话有想象力,音频输出方面口型与发音一致,但生成一个10秒视频需等待数分钟,且分辨率不高 [8] Sora 应用产品特性 - Sora应用被形容为“AI版抖音”,主页为垂直视频流,用户可上下滑动浏览全部由AI生成的视频内容 [7] - 应用采用邀请码注册机制,用户注册后可裂变出4个邀请码,使用邀请码会自动关注邀请对象,从而形成好友网络,具备强社交基因 [7] - 用户可选择上传图片结合文字提示生成视频,或使用“Cameo”功能基于自己或朋友形象进行提示词生成 [7] 产品市场表现与用户反响 - Sora APP在美区iOS免费应用排行榜上空降第三位,仅次于谷歌的Gemini和OpenAI自家的ChatGPT [4] - 由于采用邀请制,国内闲鱼平台出现邀请码交易,单价6.88元的邀请码更受欢迎,界面显示有近50人想要 [4] - 对于普通受众而言,玩AI视频变成一件很接近且很有趣的事情,但技术尚未完全跨越“真实”门槛,对实际生产帮助有限 [3][15] 技术优势与现存缺陷 - 优势在于用户数字人的物理效果和唇型驱动效果很好,应用交互设计友好,能通过很短的音频和视频素材输出不错效果 [14] - 缺陷包括人脸输出效果“似像非像”,在多元素物体交互时会出现手脚和脸糊等细节丢失,动作不符合物理逻辑,中文支持是“重灾区”,会凭空生造文字 [10][12][14] - 虽然相比初代物理理解更好,但模型能力尚未真正解决技术问题,一致性和物理问题仍未彻底解决 [14][15] 行业竞争与产品战略定位 - 行业观点认为Sora 2的技术并无代差领先,谷歌有Veo3、Nano banana及世界模型Genie3,国内可灵、即梦也能与之一战 [15] - OpenAI的优势在于打造互联网产品,Sora应用更侧重于用AI视频完成用户社交,是寻找应用场景的新尝试,采用先完成再完美的互联网迭代打法 [15][16] - 公司不追求画质和时长,而是通过获取消费者面部数据并结合邀请码机制,吸引亲朋好友链式传播,在产品玩法上暂时领先于其他公司 [16]
记者实测Sora2,AI视频的GPT-3.5时刻真的来了吗?
第一财经·2025-10-03 08:03