李飞飞发布全新世界模型RTFM;德勤向澳洲政府退钱;OpenAI放宽成人内容引发争议|一周AI要闻回顾
36氪·2025-10-18 17:07

世界模型与生成式AI技术突破 - 斯坦福大学李飞飞团队发布实时生成式世界模型RTFM,仅需单张或多张2D图像即可生成3D一致场景,无需显式3D表征,并能精准建模几何、反射等物理现象 [2] - RTFM模型在单块H100 GPU上即可实现实时渲染,解决了世界模型长期存在的可扩展性难题,其研发公司World Labs已获2.3亿美元融资,计划于2025年推出产品 [2] - OpenAI完成Sora2模型重大升级,免费用户视频生成时长提升至15秒,Pro用户可生成25秒视频,并新增音频生成功能,可自动匹配环境音、对话及背景音乐 [4] - 谷歌发布Veo 3.1视频生成模型,新版本在音频输出、精细化编辑控制以及图像转视频效果方面均有提升,允许用户向视频中添加对象并使其自然融入原有画面风格 [5] - 上海AI Lab推出科研智能体FlowSearch,该智能体在多个权威科研基准上表现突出,通过动态结构化知识流构建科研任务的多层依赖图,实现任务的并行探索与自适应优化 [5] AI基础设施与硬件创新 - 微软推出新一代热交换单元(HXU),在物理尺寸基本不变的情况下散热性能比上一代产品提升一倍,可支持单机架超过240千瓦的功率密度 [6] - 甲骨文披露AI基础设施项目毛利率可达35%,举例一个为期六年、总收入600亿美元的项目,公司剩余履约义务(RPO)超过5000亿美元 [12] - 谷歌宣布将在印度安得拉邦投资150亿美元建立一座1吉瓦的数据中心和AI中心,该投资将在未来五年内完成,标志着谷歌在印度的最大投资 [12] - 谷歌DeepMind与Commonwealth Fusion Systems合作,利用深度强化学习和开源等离子体模拟器TORAX,开发AI驾驶员实时控制SPARC核聚变装置 [11] AI应用商业化与市场动态 - 淘宝新增6款AI导购应用,包括"AI万能搜"、"AI帮我挑"、"AI试衣"等,AI美工月均生成2亿张图片及500万个视频,带动商品点击率提升10% [4] - 字节跳动旗下AI助手豆包月活跃用户达1.57亿,超越DeepSeek的1.43亿,成为中国最受欢迎AI应用,其成功源于字节跳动打造"爆款应用"的成熟经验 [6][7] - OpenAI的Sora应用上线首周在美加两地通过邀请制获得62.7万次iOS下载,已超越ChatGPT首发同期表现,并迅速登顶美国AppStore免费榜 [4] - 自今年5月谷歌视频编辑平台Flow上线以来,用户已在该应用上创作了超过2.75亿个视频 [5] AI模型训练与成本优化 - 腾讯提出名为Training-Free GRPO的无训练组相对策略优化方法,该方法无需调整模型参数,只需在提示词中学习简短经验即可显著提升模型性能 [7] - 独立研究机构报告指出,大型语言模型训练成本急剧上升,GPT-3训练成本约为5000万美元,GPT-4升至5亿美元,而GPT-5则耗资50亿美元,但性能提升并不显著 [14] - OpenAI年化经常性收入约为130亿美元,其中约70%来自ChatGPT用户的订阅费用,但付费用户比例仅为5%,公司今年上半年运营亏损高达约80亿美元 [8] AGI发展与行业标准 - 图灵奖得主Yoshua Bengio联合多机构提出AGI新定义,将其定义为能匹配或超越受过良好教育成年人的认知广度和熟练度的人工智能 [13] - 研究团队设计量化评估方法,评估显示2023年GPT-4得27分,2025年GPT-5提升至58分,但距离100分的AGI标准仍有较大差距,尤其在视觉、听觉和长时记忆存储领域存在显著短板 [13] 行业竞争与人才流动 - 苹果公司AI搜索业务负责人Ke Yang离职并加入Meta,这是苹果AI团队近期一系列高管离职中的最新一例,此前苹果AI模型负责人Ruoming Pang也已转投Meta [9][10] - 微软正将其Windows操作系统全面重构为围绕AI的新生态,为所有Win11 PC注入AI能力,公司愿景是"围绕AI重写整个操作系统",打造真正的AI PC [11]