记者实测Sora2，AI视频的GPT-3.5时刻真的来了吗？

Sora 2 模型技术更新 - 新一代视频生成模型Sora 2在物理逻辑、画面一致性和真实感上相比初代Sora有显著提升，能够基于一张照片和一句提示词创作有剧情、有文案的短片 [3] - 模型在物理上更加精准和逼真，可控性有巨大飞跃，能够完成之前视频模型难以完成的任务，如精确模拟奥林匹克体操动作和浮力等动态，并配备同步音频 [7] - 测试显示其镜头语言丰富，对话有想象力，音频输出方面口型与发音一致，但生成一个10秒视频需等待数分钟，且分辨率不高 [8] Sora 应用产品特性 - Sora应用被形容为“AI版抖音”，主页为垂直视频流，用户可上下滑动浏览全部由AI生成的视频内容 [7] - 应用采用邀请码注册机制，用户注册后可裂变出4个邀请码，使用邀请码会自动关注邀请对象，从而形成好友网络，具备强社交基因 [7] - 用户可选择上传图片结合文字提示生成视频，或使用“Cameo”功能基于自己或朋友形象进行提示词生成 [7] 产品市场表现与用户反响 - Sora APP在美区iOS免费应用排行榜上空降第三位，仅次于谷歌的Gemini和OpenAI自家的ChatGPT [4] - 由于采用邀请制，国内闲鱼平台出现邀请码交易，单价6.88元的邀请码更受欢迎，界面显示有近50人想要 [4] - 对于普通受众而言，玩AI视频变成一件很接近且很有趣的事情，但技术尚未完全跨越“真实”门槛，对实际生产帮助有限 [3][15] 技术优势与现存缺陷 - 优势在于用户数字人的物理效果和唇型驱动效果很好，应用交互设计友好，能通过很短的音频和视频素材输出不错效果 [14] - 缺陷包括人脸输出效果“似像非像”，在多元素物体交互时会出现手脚和脸糊等细节丢失，动作不符合物理逻辑，中文支持是“重灾区”，会凭空生造文字 [10][12][14] - 虽然相比初代物理理解更好，但模型能力尚未真正解决技术问题，一致性和物理问题仍未彻底解决 [14][15] 行业竞争与产品战略定位 - 行业观点认为Sora 2的技术并无代差领先，谷歌有Veo3、Nano banana及世界模型Genie3，国内可灵、即梦也能与之一战 [15] - OpenAI的优势在于打造互联网产品，Sora应用更侧重于用AI视频完成用户社交，是寻找应用场景的新尝试，采用先完成再完美的互联网迭代打法 [15][16] - 公司不追求画质和时长，而是通过获取消费者面部数据并结合邀请码机制，吸引亲朋好友链式传播，在产品玩法上暂时领先于其他公司 [16]