Sora
搜索文档
生成不遗忘,「超长时序」世界模型,北大EgoLCD长短时记忆加持
36氪· 2025-12-24 15:58
【导读】视频生成模型总是「记性不好」?生成几秒钟后物体就变形、背景就穿帮?北大、中大等机构联合发布EgoLCD,借鉴人类「长短时记忆」机 制,首创稀疏KV缓存+LoRA动态适应架构,彻底解决长视频「内容漂移」难题,在EgoVid-5M基准上刷新SOTA!让AI像人一样拥有连贯的第一人称视 角记忆。 随着Sora、Genie等模型的爆发,视频生成正从「图生动」迈向「世界模拟器」的宏大目标。 然而,在通往「无限时长」视频生成的路上,横亘着一只拦路虎——「内容漂移」(Content Drift)。 你是否发现,现有的视频生成模型在生成长视频时,往往也是「金鱼记忆」:前一秒还是蓝色瓷砖,后一秒变成了白色墙壁;原本手里的杯子,拿着拿着 就变成了奇怪的形状; 对于第一人称(Egocentric)视角这种晃动剧烈、交互复杂的场景,模型更是极其容易「迷失」。 生成长视频不难,难的是「不忘初心」。 近日,来自北京大学、中山大学、浙江大学、中科院和清华大学的研究团队,提出了一种全新的长上下文扩散模型EgoLCD,不仅引入了「类脑的长短时 记忆」设计,还提出了一套全新的结构化叙事Promp方案,成功让AI在生成长视频时「记住」场景 ...
数字经济双周报(2025年第23期):美国启动“科技力量”计划,展开举国AI动员-20251224
银河证券· 2025-12-24 15:00
CGS-NDI 周度报告 美国启动"科技力量"计划,展开举国 AI 动员 —— 数字经济双周报(2025 年第 23 期) 2025 证 12 证 24 证 核心观点 ⚫ 本期焦点:美国启动"科技力量"计划, AI 竞争进入国家系统能力动员阶 段。12 证 15 证证证证证证证证证证证证证证证证证证证证 U.S. Tech Force 证证 证证证证证证证证证证证证证证证证证证证证 AI 证证证证证证证证证证证证 证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证 证证证证证证证证证证证证证 证证证证证证证证证证证证证证 AI 证证证证证证证证证证证证证证证证证证 证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证 证证证证证证 证证证证证证证证证证证证证证证证证证证证证证证证证证证证 证证证证证证证证证证证证证 AI 证证证证证证证证证证证证证证证证证证证 证证证证证证证证证 AI 证证证证证证证证证证证证证证证证证证证证证证证 证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证 证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证证 证证 ...
奥特曼的“帝国隐忧”:多线扩张,正在拖慢ChatGPT
创业邦· 2025-12-24 11:25
以下文章来源于腾讯科技 ,作者值得关注的 腾讯科技 . 腾讯新闻旗下腾讯科技官方账号,在这里读懂科技! 来源丨 腾讯科技 (ID:qqtech) 作者丨陆陆 编辑丨 徐青阳 图源丨 midjourney 过去一年,一个令人费解的现象在OpenAI内部蔓延: 即便ChatGPT推出了能在国际数学奥赛摘金、 在顶级编程竞赛夺冠的"最强大脑",但普通用户们似乎并不买账 。 据外媒报道和OpenAI 9月发布的数据显示,多数用户使用ChatGPT可能只是询问相当简单的问题, 根本无需动用那些耗费巨大计算资源、需要"思考"半分钟的推理模型。 这一刺眼的数据,指向了OpenAI在巅峰之下隐藏的深刻危机:一场由CEO山姆·奥特曼亲自推动的战 略扩张正引发严重的深层危机,包括组织架构割裂、多线作战导致资源分散,以及技术路线与用户需 求严重脱节,这正将其王牌产品ChatGPT拖入竞争泥潭。 核心矛盾:前沿研究与大众需求的 "性能过剩"鸿沟 OpenAI的核心矛盾,根植于其研究部门与产品团队日益扩大的目标分歧。 公司内部一个超过千人、相对独立的研究团队,近年来将重心押注在追求"推理模型"和"通用人工智 能"( AGI )这一终极 ...
被起诉的AI独角兽,这样回应好莱坞
搜狐财经· 2025-12-23 20:30
AIX财经(AIXcaijing)原创 作者 | 陈丹 编辑 | 魏佳 AI与版权的战争,或许正迎来一个戏剧性的拐点。 自2025年9月"海螺AI"被迪士尼等好莱坞公司起诉以来,其母公司MiniMax始终未就此对外发声。直至 冲刺"大模型第一股"的关键节点,它才在最新披露的招股书中,首次详细回应这场版权诉讼。其核心立 场可以概括为两点:其一,公司并无构成侵权;其二,即便最终败诉,对公司整体财务影响亦有限。 而在太平洋彼岸,剧情却上演了神反转——起诉AI公司的迪士尼,转身向OpenAI抛出巨额投资并开放 核心IP。更耐人寻味的是,这场交易中,掏钱的并非AI巨头,而是手握版权的迪士尼。 诉讼仍在推进,合作已经展开。版权方与AI公司的关系,正迅速从法庭上的对抗,转向规则框架内的 交易与博弈。 这一转向,或许比行业预期来得更早。 在MiniMax提交的六百多页招股书中,与迪士尼等好莱坞公司版权诉讼相关的内容,多次出现在不同章 节。公司披露了案件起因、原告诉求、潜在赔偿规模,以及自身的抗辩逻辑。 在判断MiniMax的回应是否成立之前,首先需要厘清好莱坞阵营究竟在指控什么。 2025年9月16日,迪士尼、环球影业和华纳 ...
奥特曼的“帝国隐忧”:多线扩张,正在拖慢ChatGPT
36氪· 2025-12-23 08:33
核心矛盾:前沿研究与大众需求的“性能过剩”鸿沟 - 公司内部超过千人的独立研究团队重心押注于追求“推理模型”和“通用人工智能”,此类模型在复杂数学和科学问题上表现出色,但代价是高昂的计算成本和缓慢的响应速度,处理问题可能需要数秒甚至数分钟[1] - 这与ChatGPT数亿主流用户的需求严重脱节,大多数用户询问的可能是非常简单的日常问题,如电影评分、日常咨询,根本不需要模型长时间“思考”[2] - 2025年初,将最先进的推理模型转化为ChatGPT可用版本时,其性能反而意外变差,即使以“思考模式”嵌入,在近9亿周活跃用户中也仅有极少数人频繁使用[2] - 传统的非推理模型在集成到ChatGPT产品时,也可能因与“个性化”等功能的冲突而导致性能下降[2] 多线作战:战略扩张与核心产品的资源内耗 - 公司在ChatGPT之外,同时推进了包括Sora视频生成、音乐AI、AI网页浏览器、AI智能体、消费级硬件设备、机器人等一系列雄心勃勃的项目[4] - 这些并行项目持续分流了原本应集中投入在ChatGPT上的关键资源,削弱了用于提升ChatGPT大众化吸引力的投入强度[4] - 公司文化与决策层面依然深受“研究优先”基因主导,产品本身并非终点[4] - 图像生成功能优先级一度降低,直到2025年8月谷歌发布流行产品后才仓促重新聚焦,暴露了多线作战导致的决策滞后和被动[5] 增长悖论:用户增速放缓与商业变现的竞赛 - 公司年初设定了年内达到10亿周活跃用户的宏大目标,但截至12月初,其用户数不足9亿,且用户增长正在显著放缓[6] - 商业化变现取得惊人进展,年化收入从1月份的60亿美元激增至目前的超过190亿美元,主要动力来源于个人和企业用户的订阅[6] - 公司正寻求以7500亿美元的估值进行融资,该估值较两个月前高出50%[6] - 在每100名ChatGPT的周活跃用户中,约有5人付费订阅其Pro或Plus服务[8] - 为实现2030年规划的2000亿美元收入愿景,公司必须将周活跃用户转化为日活跃用户,以创造更多变现机会[8][11] - 专注于从现有用户获取高额订阅收入的策略,可能正在损害其用户基础的进一步扩大[11] 竞争围剿:谷歌的反击与生态劣势 - 谷歌在搜索结果顶部整合AI生成的答案摘要,正推动有意义的搜索量增长和收入提升[12] - 2025年,谷歌Gemini实现快速增长:月活用户从7月的4.5亿增至6.5亿,网站访问量单月增长14.3%,而ChatGPT同期访问量却连续两月下降[12] - Gemini的平均访问时长自9月起已超越ChatGPT[12] - 谷歌的Nano Banana Pro图像生成器因能生成可读且上下文相符的文字而风靡社交网络[12] - 用户转向Gemini不仅仅是因为模型更好,而是发现其AI能力已经无缝融入谷歌庞大的产品生态中[5][12] - 前员工警告,如果谷歌在原始性能上实现超越甚至免费提供Gemini,可能同时扼杀公司的API和消费者订阅业务[14] - 在企业客户市场,公司份额已降至27%,而Gemini则上升至21%,Anthropic以40%的份额领先[18] 战略调整与未来挑战 - 公司CEO在12月拉响“红色代码”警报,要求将资源重新集中到ChatGPT及其推理能力等核心基础之上,并推迟广告、扩展电商等短期盈利项目,希望在明年1月底通过一次重大产品更新来扭转局面[15] - 公司迅速推出一系列应对措施:发布GPT-5.2重新夺回多项AI模型性能基准榜首;推出新图像生成模型回应竞争;回退模型路由系统,让免费用户默认使用更快的GPT-5.2 Instant[15] - 模型路由系统仅运行四个月就被撤回,因为它将免费用户使用推理模型的比例从不到1%提升至7%,显著增加了成本,却因响应慢对日活指标产生负面影响[15] - 此次“红色代码”持续八周,是比以往更长的紧急状态[15] - 公司正每年烧掉数十亿美元现金以支付惊人的计算成本,其规划的1.4万亿美元基础设施投入更是天文数字[18] - 公司正试图通过与迪士尼合作、聘请苹果前设计主管开发硬件来构建生态,但这需要时间[14][18] - 公司CEO已开始布局宏大的硬件战略,聘请前苹果设计主管乔尼·艾维,旨在开发一款设备以取代智能手机成为新标准,这可能预示与苹果发生直接碰撞[16][17]
2家“中国OpenAI”排队上市
36氪· 2025-12-22 20:02
行业资本化进程 - 中国大模型公司智谱于12月19日通过港交所聆讯,正式冲击IPO [1] - 两天后,另一家大模型公司MiniMax(稀宇科技)也通过聆讯,争夺全球大模型第一股 [2] - 无论哪家先上市,都将在资本化程度上领先于OpenAI等美国大模型巨头 [3] 行业估值逻辑与对比 - 市场存在一种估值逻辑,即国产大模型有1%的概率成为OpenAI,其估值可参照OpenAI估值的1% [4] - OpenAI正洽谈千亿美元融资,估值可能达8300亿美元,其1%为83亿美元(约584亿元人民币) [7] - MiniMax在2024年7月完成近3亿美元融资后估值约300亿元人民币;智谱累计融资数十轮,2024年融资超30亿元,估值在300-400亿元人民币区间,均远低于OpenAI估值的1% [7] - 差距巨大的原因在于OpenAI是技术定义者和领导者,创造了多个新赛道,覆盖全模态,且商业化能力强劲 [7] - OpenAI预计2024年总营收达130亿美元(约915.1亿元人民币),覆盖全球200多个国家,拥有8亿周活用户、超5000万付费用户、100万家企业用户 [7] 公司业务模式与市场地位 - 智谱成立于2019年,核心团队来自清华大学,于2022年推出千亿级大模型GLM-130B [10] - 智谱营收主要来自B端和G端客户,通过MaaS平台提供AI模型服务 [11] - 本地化部署服务面向大型企业和政府机构,占总营收的84.5% [12] - 云端部署服务按使用量收费,适合中小企业 [13] - 截至2025年上半年,智谱拥有超8000家机构客户,包括金山办公、智联招聘、蒙牛等,并承接了杭州城投、京西智谷等政府项目 [14] - 2024年智谱总营收3.12亿元人民币,在中国大语言模型厂商中排名第二,市占率6.6%,超过阿里巴巴 [15] - OpenAI在一份分析报告中明确将智谱定义为AI产业全球化的对手 [16] - MiniMax成立于2021年,团队385人,平均年龄29岁,押注文本、语音、视觉和视频四大模态研发 [18] - MiniMax形成B端和C端两大业务线,C端产品包括海螺AI和星野(talkie) [18] - 海螺AI在2025年3月的全球Top 50 AI应用榜单(Web端)中位列第12名,登顶AI视频赛道 [18] - 星野的海外版talkie全球月活达1100万,其中50%用户来自美国 [20] - MiniMax的路线与OpenAI更相似,都押注多模态、走全球化路线、侧重C端 [20] 公司财务表现与竞争态势 - 2025年上半年,智谱收入1.9亿元人民币,超过2023年全年水平,但净亏损达23.58亿元人民币 [21] - 2025年前三季度,MiniMax总营收5344万美元(约3.76亿元人民币),同比暴涨175%,净亏损5.12亿美元(约36亿元人民币) [21] - 智谱优势在于依赖B端大客户,营收稳定,但易受政府政策影响及面临项目延期风险 [21] - MiniMax优势在于C端产品变现渠道更多元,全球化潜力大,但需与字节、阿里、腾讯等巨头竞争 [21] - 到2025年底,中国大模型“六小虎”战略重心发生变化,普遍放弃全栈通用幻想,转向细分赛道落地 [22] - 除智谱和MiniMax外,Kimi回归技术深耕,百川智能转向医疗垂直领域,阶跃星辰聚焦终端Agent,零一万物转向企业定制化部署解决方案 [21][22]
Minimax、智谱抢夺“全球大模型第一股”
华尔街见闻· 2025-12-22 19:14
公司IPO进程与竞争格局 - “全球大模型第一股”争夺战激烈 Minimax紧随智谱之后于12月21日公布港股IPO聆讯后招股书[1] - 公司重要优势在于深度挖掘海外C端市场 这与主要收入来自国内企业本地部署服务的智谱形成差异[6] - 公司能否夺下“全球大模型第一股”称号 市场正拭目以待[6] 公司业务与收入构成 - 公司以自研大模型组合为核心 推出了智能Agent、视频生成应用海螺AI、音频生成等应用[2] - AI视频生成应用海螺AI已成为重要收入来源 2025年前三季度收入达0.17亿美元(折合1.2亿元人民币) 占总收入比重32.6%[2] - 海螺AI在2025年前三季度付费用户数达31万 平均每名用户贡献56美元[2] - 公司收入高度依赖境外市场 2025年前三季度中国大陆以外市场贡献0.39亿美元 占总收入比重超过70%[2] 行业挑战与竞争态势 - AI视频生成应用面临用户留存率低的普遍挑战 例如Sora的1天、7天、30天、60天用户留存率分别仅为10%、2%、1%、0%[3] - 海螺AI的用户留存率同样不乐观 今年10月在新加坡苹果用户中的1天、7天、30天、60天留存率分别为22.57%、4.62%、0.8%和0.66%[4] - 海螺AI的创收水平目前不敌竞争对手 快手旗下“可灵”应用仅今年第二季度便实现超2.5亿元收入[2] - 行业应用需在专业创作与大众娱乐之间找到真正的立足点[4] 公司财务与运营状况 - 公司持续亏损 2024年及2025年前三季度净亏损分别为4.65亿美元和5.12亿美元[6] - 为减亏公司已减少应用推广 2025年前三季度销售支出为0.39亿美元 同比减少超25%[6] - 算力成本高昂 2025年前三季度销售成本和研发费用中的算力支出合计达1.8亿美元[6] - 海螺AI的定价分为“基础”套餐9.99美元/月和“至臻”套餐199.99美元/月[2]
好莱坞巨头起诉三个月后,MiniMax回应版权侵权指控
南方都市报· 2025-12-22 17:56
公司IPO与诉讼披露 - 12月21日,MiniMax(稀宇科技)在港股IPO招股书中首次正式回应了迪士尼、环球影业和华纳兄弟提起的AI版权侵权诉讼 [1] - 该诉讼于今年9月16日由三家好莱坞制片厂在美国加州中区联邦地区法院提起,指控MiniMax旗下AI应用“海螺AI”侵犯其影视角色版权 [1] - 招股书详细披露了公司的业务和财务数据 [1] 原告方指控内容 - 指控涉及“海螺AI”在输出端生成了原告享有版权的小黄人等知名影视角色形象,并在YouTube官方推广视频中使用了这些角色 [1][3] - 指控还涉及模型训练输入端,称MiniMax在未经授权的情况下复制了原告作品用于“海螺AI”的训练和开发 [3] - 原告提出了两个维度的法律主张:直接侵权(复制、展示和分发版权内容)和间接侵权(诱导或帮助用户侵权) [3] - 案件涉及500件注册作品,原告有权就每件作品索赔最高15万美元,MiniMax可能面临最高7500万美元的法定损害赔偿 [6] 公司抗辩理由与措施 - MiniMax否认直接侵权指控,称“海螺AI”是工具,内容生成由用户决定,公司并未选择特定角色或场景 [4] - 针对模型训练使用版权内容,公司预期提出“合理使用”抗辩,称使用具有高度转化性,是让模型学习统计模式而非复制表达性内容 [4][5] - 公司反驳间接侵权指控,辩称提供通用创意工具不构成帮助侵权,且对被控侵权行为不存在已知或故意 [5] - 公司在收到原告8月27日的来信后立即回应并启动调查,并在9月16日诉讼明确具体角色后采取了防止侵权的措施 [5] - 为缓解风险,公司已实施并加强内部控制,包括采用基于关键词的过滤器等技术过滤和筛选措施 [7] - 公司评估,因需认定故意侵权且司法判例罕见,面临最高7500万美元赔偿的可能性极低 [6] 行业背景与趋势 - 截至2025年11月18日,美国已至少发生56起AI版权诉争,其中超过50起涉及模型输入端和输出端的版权侵权 [6] - AI公司对高质量数据有明确需求,但合规获取数据的政策法规和市场机制仍需创新突破 [8] - 行业中出现“以诉促和”趋势,一些案件已达成和解,同时版权方与AI公司也开始主动开展授权合作 [8] - 迪士尼与OpenAI于12月11日达成10亿美元的股权投资,并将旗下200多个动漫角色授权给OpenAI的Sora使用,被视为实现共赢的合作范式 [8][9] 公司观点与建议 - MiniMax高管赞赏迪士尼与OpenAI的合作,认为通过IP授权、创作分成等市场手段代替司法诉讼,更有利于AI企业发展并为版权方拓展市场模式 [9] - 公司希望与数据提供方形成利益共享的良性合作机制 [9] - 公司建议在有关部门指导下,联合多方主体针对法律不明确环节开展沙盒试点,共同探索解决方案 [9]
Walt Disney (DIS) Invests $1 Billion in OpenAI Deal
Yahoo Finance· 2025-12-21 22:44
公司与OpenAI的战略合作 - 华特迪士尼公司向OpenAI投资10亿美元,并达成一项为期三年的合作伙伴关系 [1][2] - 根据许可协议,从2026年初开始,OpenAI的Sora AI视频生成器和ChatGPT Images将能够生成包含迪士尼旗下角色的视频,例如木法沙、灰姑娘和米老鼠 [3] - 该协议不包括任何演员的形象或声音使用权 [3] 合作内容与战略意图 - 此次合作旨在利用生成式AI技术,审慎地扩展公司的叙事能力,同时尊重和保护创作者及其作品 [3] - 首席执行官鲍勃·艾格此前在11月的投资者电话会议上曾暗示此战略,指出AI将帮助公司为Disney+用户提供工具,以创作和享受用户生成内容,主要是短视频形式 [4] - 根据协议,一部分用户生成的视频将可以在Disney+上播放,使该平台能够从短视频内容日益增长的需求中受益 [4] 对行业的影响与意义 - 此次合作标志着好莱坞拥抱生成式AI的关键时刻,并有可能改变好莱坞的内容创作方式 [2] - 该合作绕开了关于AI损害就业或知识产权的担忧 [2] - 协议允许OpenAI在其Sora AI视频生成器中使用来自《星球大战》、皮克斯和漫威的角色 [1] 公司业务背景 - 华特迪士尼公司是一家美国跨国大众媒体和娱乐集团,通过三个核心业务部门运营:迪士尼娱乐、ESPN和迪士尼体验 [5]
智谱招股书透露风险:“我们可能无法保护用户数据”丨合规周报
21世纪经济报道· 2025-12-21 12:03
AI动态 - 智谱通过港交所聆讯并披露招股书 其2022年、2023年、2024年净亏损分别为1.43亿元、7.88亿元、29.58亿元 2025年上半年净亏损达23.58亿元 累计亏损超62亿元 [1] - 智谱招股书提及其GLM-4S模型在2025年9月RAG领域的LLM幻觉排行榜中 幻觉率为全球第二低及中国最低 [1] - 智谱招股书指出 中国人工智能行业监管环境日益严格 未来可能出台的法律法规可能对公司业务产生重大不利影响 [2] - 智谱目前未被认定为关键信息基础设施运营者 但无法保证未来其MaaS平台不会被归类为关键信息基础设施 [2] - 智谱招股书坦陈 由于网络安全及数据保护法规诠释存在不确定性 公司可能无法完全保护用户数据 [2] - 智谱业务运营中可能从第三方及公开来源获取训练数据 但无法保证这些数据的合法性 若数据获取不合规可能对公司服务及声誉造成重大不利影响 [3][4] - 智谱指出 现有数据处理技术存在局限 无法保证能有效过滤或匿名化从第三方及公开来源获得的数据以完全符合法规 [4] - 智谱招股书提到 人工智能技术可能被使用者滥用 从而对公司声誉及业务造成重大不利影响 [4] - 迪士尼宣布与OpenAI达成深度合作 包括向OpenAI进行10亿美元股权投资并获得认股权证 这是Sora平台首次迎来大型内容授权合作伙伴 [5][6] - OpenAI的Sora和ChatGPT Images将获得迪士尼旗下超200个角色授权 包括米老鼠、漫威、皮克斯和星球大战角色 但不包含真人肖像或声音 [6] - 迪士尼将利用OpenAI的API为Disney+流媒体平台构建新产品工具 为员工部署ChatGPT用于内部工作流程 粉丝精选创作视频将在Disney+播放 [6] - 千问宣布接入高德地图 针对涉及地理位置的问题 能够调用高德地图等数据生成可视化决策卡片 用户点击卡片可在高德App中唤起导航或打车服务 [7] 平台治理 - 国家发展改革委、市场监管总局、国家网信办三部门印发《互联网平台价格行为规则》 规定平台内经营者在不同平台销售商品或提供服务可依法自主定价 [7] - 《规则》要求平台经营者不得通过提高收费、限制流量、搜索降权、屏蔽店铺等措施 强制或变相强制平台内经营者降价、进行促销或不得高于其他渠道价格 [7][8] - 《规则》明确禁止平台经营者强制或变相强制平台内经营者开通自动跟价、自动降价或类似系统 [7][8] - 《规则》禁止平台经营者及平台内经营者利用平台规则、数据和算法等手段相互串通 操纵市场价格 [8] - TikTok CEO周受资宣布 字节跳动、TikTok已与三家投资者签署协议 将成立名为“TikTok美国数据安全合资有限责任公司”的新美国合资公司 负责美国的数据保护、算法安全、内容审核和软件保障 [8] - 最高人民法院对《民事案件案由规定》进行第三次修正 修改后的规定共有1055个案由 [9] - 修正案围绕服务发展新质生产力 增加了数据、网络虚拟财产相关案由 并细化了知识产权相关案由 [9]