SORA模型
搜索文档
OpenAI新视频震撼发布:这次,真的叫“颠覆”吗?揭秘AI发展的两条岔路
搜狐财经· 2026-01-22 18:47
SORA模型的技术原理与局限性 - 模型通过高度抽象和压缩将视频映射到抽象空间 其原理类似于高级皮影戏 使用来自真实世界的基本视频元素拼接成完整视频 使整体观感具有真实感 [3][25][48] - 模型与真正“理解物理世界”并基于此仿真虚拟世界存在显著差距 差距被比喻为手机拍视频与电影制作之间的距离 [3][25][48] - 现有AI缺乏对物理世界的理解 例如无法自主产生“加速度”概念 因此无法生成物理意义上精确的运动轨迹 更无法处理复杂粒子模型 [7][30][53] - 基于当前技术思路 AI绝对无法产生与实拍电影完全对等的效果 也绝无可能取代动画电影 [7][30][53][75] 公众认知误区与AI能力边界 - 公众普遍误解在于 认为AI能完成人类看来困难的事 就更能完成人类看来简单的事 例如AI可处理法律文件或实现智能驾驶 但无法完成炒菜颠勺或机器人端茶送水等任务 [8][31][53][76] - 本质在于计算机擅长处理信息量大但规则简单的事务 而人类擅长处理信息量不大但潜在规则复杂的事务 当前AI并未突破此限制 [8][31][76] - 以“端茶送水”为例 其涉及多自由度关节精准控制、水面平衡实时观测、环境预警及运动轨迹规划 对计算机程序的复杂度远超登月任务 [9][32][54][77] AI视频技术的实际应用与市场炒作 - 业内对SORA类技术的实际应用尚处初步思考阶段 其除让外行眼前一亮外 具体落地场景仍需探讨和实验 [5][28][51] - 许多行业可能并无视频应用需求 例如在直播带货中 以AI虚拟主播替代真人主播的可行性与意义存疑 [11][34][56] - 该技术最重大的影响可能在于股市 公众对技术的理解与现实存在巨大差距 创造了炒股空间 庄家可利用公众初期高估、后期退热的预期差进行反复炒作获利 [11][25][34][48][56] - 美国股市为主导的环境偏好能激发公众想象力的技术 通过制造“颠覆性技术”叙事引导散户盲目上车与割肉离场 实现反复炒作 技术本身的实际效用并非首要考量 [11][34][56] 两种AI发展路径与商业模式对比 - 一条路径是忽略散户炒作 直接从客户实际需求出发解决专业领域问题 例如利用AI加速气象云图分析或从雷达干扰中识别隐形飞机 此类应用商业模式清晰且有客户付费 但因公众难以理解而缺乏炒作话题 [13][36][58] - 以华为为例 其专注于商业模式清晰、客户按月付费的生意 不依赖股市炒作 华为一年所缴税款超过许多上市公司的市值 此环境导致其对宣传AI大模型的具体应用缺乏兴趣 [13][36][58] - 华为的AI技术(如智能驾驶)是其众多行业应用之一 公司未宣传AI聊天、画画、视频生成等技术 因缺乏客户买单 其商业规则是优先开发能带来重大产值(如智能驾驶、AI采矿)的应用 而非赚取小利 [15][38][60][83] - OpenAI的业务模型对比显示 其缺乏从客户赚取大钱的常规业务 主要现金流来自资本市场(炒股) 这决定了其研发面向推出所谓的“划时代”技术以维持市场热度 [15][38][60][83] - 大部分技术即使将某个行业效率提高10倍 对整体时代和GDP的影响也微乎其微 真正的“划时代”常源于外行对技术的疯狂幻想 而非技术本身 [17][40][62][85] 中美AI发展路径差异与展望 - 中美AI发展轨道不同 基本未做对方的事情 若将实现通用AI比作攀登珠穆朗玛峰 中国主流思路(如华为)是进行基础体能训练(深耕具体行业) 而美国则是在小山坡表演攀岩(追求吸引眼球的演示)以显示“遥遥领先” [20][43][65][88] - 从专业视角看 为散户表演攀岩(炒作性研发)纯属浪费研发资源 美国在此路径上的胜算并不被看好 [20][43][65][88] - OpenAI面临的挑战在于 其给予市场的“想象空间”越大 未来实际落地空间可能越小 因为真正能赚大钱的项目可能无法满足被吊高胃口的受众的刺激感 这可能导致其需要不断寻找更“刺激”的技术方向 [18][41][63][86] - 有消息称OpenAI老板试图筹集几万亿美元资金进行大项目 但其具体商业价值存疑 且美国可能并无能力提供如此巨额资金 [20][43][65][88]
千亿豪赌!OpenAI领衔,视频生成上演巨头“终局之战”
搜狐财经· 2026-01-21 11:17
SORA模型的技术原理与局限性 - SORA模型的核心思想是对视频进行高度抽象和压缩,将其映射到一个抽象空间,类似于高级皮影戏,使用来自真实世界的抽象基本视频元素拼接成完整视频,使其“打眼一看”具有真实感 [3][25][48][71] - 该技术与真正“理解物理世界”并基于此仿真虚拟世界仍有不小距离,差距被比喻为手机拍视频与电影制作之间的距离 [3][25][48][71] - 现有AI缺乏对物理世界的理解,甚至无法产生“加速度”概念,因此无法生成物理意义上精确的运动轨迹,更无法处理复杂粒子模型 [7][30][53][76] - 以目前已知技术思路,AI绝对不可能产生与实拍电影完全对等的效果,不仅无法取代实拍电影,连取代动画电影也绝无可能 [7][30][53][76] 公众认知与AI能力现实的差距 - 外行普遍误解在于,看到AI能完成人类看来很难的事(如处理法律文件、智能驾驶),便认为其更能完成人类看来简单的事(如炒菜、端茶送水) [8][31][54][77] - 本质在于计算机擅长处理信息量大但规则简单的事务,而人类擅长处理信息量不大但潜在规则复杂的事务,当前AI并未突破这一点 [8][31][54][77] - 以“端茶送水”为例,其涉及多自由度关节精准控制、水面平衡实时观测、环境预警、运动轨迹规划等,对计算机程序的复杂度远超登月任务 [9][32][55][78] AI视频技术的实际应用与市场炒作 - AI视频生成技术(如SORA)最重大的实际影响可能在于股市,普通人对技术的理解与现实存在巨大差距,这创造了炒股空间 [11][25][34][48][57][71][80] - 在美国以股市为主导的环境下,企业更倾向于推出能激发公众无穷想象力的“颠覆性”技术,通过反复炒作(散户盲目上车后割肉离场)让庄家赚得盆满钵满,技术本身是否有用反而不重要 [11][34][57][80] - 对于AI视频技术,大部分行业难以想出具体应用场景,例如直播带货用AI虚拟主播替代真人主播,其可行性与意义存疑 [11][34][57][80] 务实与炒作两种AI发展路径对比 - 另一条发展路径是从客户实际需求出发,解决具体行业问题(如用AI加速气象云图分析、从雷达波干扰中识别隐形飞机),此类应用商业模式清晰,客户会实际付费 [13][36][59][82] - 但此类专业应用因公众不懂而缺乏炒作话题,不适合股市炒作,例如宣布将某项预测速度提高10倍难以引发公众兴趣 [13][36][59][82] - 以华为为例,其专注于商业模式清晰、客户按月付费的生意(如智能驾驶),不依赖吹嘘和炒作散户,其AI大模型(如盘古)渗透于千千万万具体行业以提升生产效率,大部分应用不为外行所知 [13][15][36][38][59][61][82][84] - 华为不上市,通过发行企业债融资,其一年所交税款超过许多上市公司的市值 [13][36][59][82] OpenAI与华为的商业模式与技术路线差异 - 抛开资本市场融资,单从客户赚钱角度看,OpenAI缺乏正经赚大钱的业务,其主要现金流来自股市炒作而非常规业务,这决定了其研发面向推出所谓的“划时代”技术以服务炒作 [15][38][61][84] - 真正的“AI时代”应由像华为盘古大模型那样,渗透到具体行业并与企业联合开发以提高生产效率的路径带来,而非以让散户激情四射为目的的研发 [17][40][63][86] - OpenAI不断推出刺激公众的产品(聊天、画画、视频),导致受众“敏感度”越来越低,未来若转向务实但不够刺激的行业应用(如AI控制金属探伤仪用于桥梁监测),将难以满足被吊高的公众预期 [18][41][64][87] - OpenAI目前提供的“想象空间”越大,其日后务实落地的空间反而可能越小,这类似于依赖不断寻找更刺激药物的成瘾模式 [20][43][66][89] 中美AI发展轨道与资本环境差异 - 中美AI发展轨道不同,基本不做对方的事情,若以实现通用AI比喻为攀登珠穆朗玛峰,中国主流思路(如华为)是进行基础体能训练(跑步、撸铁),而美国则相当于在小山坡表演攀岩并宣称“遥遥领先” [20][43][66][89] - 在美国以资本市场和“外行领导内行”的体制下,资本偏好能引发公众狂热的话题(如教授与幼女解方程),迫使科学家和研发资源服务于炒作,而非真正有重大价值的产品 [22][45][68][91] - 这种环境导致像OpenAI这样的公司,其科学家虽有操守和梦想,但在资本压力下,研发方向不得不面向股市炒作 [22][45][68][91]