Workflow
FlowSearch
icon
搜索文档
李飞飞发布全新世界模型RTFM;德勤向澳洲政府退钱;OpenAI放宽成人内容引发争议|一周AI要闻回顾
36氪· 2025-10-18 17:07
世界模型与生成式AI技术突破 - 斯坦福大学李飞飞团队发布实时生成式世界模型RTFM,仅需单张或多张2D图像即可生成3D一致场景,无需显式3D表征,并能精准建模几何、反射等物理现象 [2] - RTFM模型在单块H100 GPU上即可实现实时渲染,解决了世界模型长期存在的可扩展性难题,其研发公司World Labs已获2.3亿美元融资,计划于2025年推出产品 [2] - OpenAI完成Sora2模型重大升级,免费用户视频生成时长提升至15秒,Pro用户可生成25秒视频,并新增音频生成功能,可自动匹配环境音、对话及背景音乐 [4] - 谷歌发布Veo 3.1视频生成模型,新版本在音频输出、精细化编辑控制以及图像转视频效果方面均有提升,允许用户向视频中添加对象并使其自然融入原有画面风格 [5] - 上海AI Lab推出科研智能体FlowSearch,该智能体在多个权威科研基准上表现突出,通过动态结构化知识流构建科研任务的多层依赖图,实现任务的并行探索与自适应优化 [5] AI基础设施与硬件创新 - 微软推出新一代热交换单元(HXU),在物理尺寸基本不变的情况下散热性能比上一代产品提升一倍,可支持单机架超过240千瓦的功率密度 [6] - 甲骨文披露AI基础设施项目毛利率可达35%,举例一个为期六年、总收入600亿美元的项目,公司剩余履约义务(RPO)超过5000亿美元 [12] - 谷歌宣布将在印度安得拉邦投资150亿美元建立一座1吉瓦的数据中心和AI中心,该投资将在未来五年内完成,标志着谷歌在印度的最大投资 [12] - 谷歌DeepMind与Commonwealth Fusion Systems合作,利用深度强化学习和开源等离子体模拟器TORAX,开发AI驾驶员实时控制SPARC核聚变装置 [11] AI应用商业化与市场动态 - 淘宝新增6款AI导购应用,包括"AI万能搜"、"AI帮我挑"、"AI试衣"等,AI美工月均生成2亿张图片及500万个视频,带动商品点击率提升10% [4] - 字节跳动旗下AI助手豆包月活跃用户达1.57亿,超越DeepSeek的1.43亿,成为中国最受欢迎AI应用,其成功源于字节跳动打造"爆款应用"的成熟经验 [6][7] - OpenAI的Sora应用上线首周在美加两地通过邀请制获得62.7万次iOS下载,已超越ChatGPT首发同期表现,并迅速登顶美国AppStore免费榜 [4] - 自今年5月谷歌视频编辑平台Flow上线以来,用户已在该应用上创作了超过2.75亿个视频 [5] AI模型训练与成本优化 - 腾讯提出名为Training-Free GRPO的无训练组相对策略优化方法,该方法无需调整模型参数,只需在提示词中学习简短经验即可显著提升模型性能 [7] - 独立研究机构报告指出,大型语言模型训练成本急剧上升,GPT-3训练成本约为5000万美元,GPT-4升至5亿美元,而GPT-5则耗资50亿美元,但性能提升并不显著 [14] - OpenAI年化经常性收入约为130亿美元,其中约70%来自ChatGPT用户的订阅费用,但付费用户比例仅为5%,公司今年上半年运营亏损高达约80亿美元 [8] AGI发展与行业标准 - 图灵奖得主Yoshua Bengio联合多机构提出AGI新定义,将其定义为能匹配或超越受过良好教育成年人的认知广度和熟练度的人工智能 [13] - 研究团队设计量化评估方法,评估显示2023年GPT-4得27分,2025年GPT-5提升至58分,但距离100分的AGI标准仍有较大差距,尤其在视觉、听觉和长时记忆存储领域存在显著短板 [13] 行业竞争与人才流动 - 苹果公司AI搜索业务负责人Ke Yang离职并加入Meta,这是苹果AI团队近期一系列高管离职中的最新一例,此前苹果AI模型负责人Ruoming Pang也已转投Meta [9][10] - 微软正将其Windows操作系统全面重构为围绕AI的新生态,为所有Win11 PC注入AI能力,公司愿景是"围绕AI重写整个操作系统",打造真正的AI PC [11]
将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch
量子位· 2025-10-14 12:08
产品核心特点 - FlowSearch是一个由动态结构化知识流驱动的深度科研智能体,通过构建科研任务的多层依赖图实现任务的并行探索和自适应优化[6][7] - 系统采用有向无环图将科研任务和知识关系可视化,每个节点携带任务类型和知识上下文,节点间的边定义信息流向,实现非线性的多路径探索[12][13] - 具备自组织、自纠错、自优化能力,能够根据新信息动态调整节点和依赖关系,确保知识流持续进化[19][24] 技术架构 - 由三大核心模块组成:Knowledge Flow Planner负责规划研究路线并拆解问题,Knowledge Collector执行任务并收集信息,Knowledge Flow Refiner反思和优化整个研究流程[8][9] - Planner模块采用递归扩展策略,从总问题出发逐层细化子任务,InternPlanner模型经过结构化科研任务数据微调,能够学习专家的拆解方式[16] - 多智能体框架下实现任务并行执行,Collector填充节点内容的同时Refiner动态调整流程,形成类似科研团队的协作机制[10] 性能表现 - 在GAIA基准测试中,FlowSearch(o4-mini)在Level 1达到90.56%,Level 2达到76.74%,Level 3达到50.00%,平均分为76.96%,显著优于其他方法[23] - 在GPQA-diamond基准上,生物领域84.21%,化学领域79.57%,物理领域96.51%,平均达到87.37%[23] - 在HLE基准的text only模式下达到31.60%,All模式下达到30.80%[23] - 专业基准TRQA测试中,FlowSearch依托通用工具链超越了多个领域专用模型[23] 技术验证 - 模块有效性验证显示,完整系统在GAIA基准平均分达76.96%,而去除动态知识流建模或反思模块会导致性能显著下降[26][27] - InternPlanner-32B相比基础模型Qwen-3-32B在GAIA基准上提升约6个百分点,从64.81%提升至70.91%,验证了结构化训练的有效性[28][29] - 与OWL对比案例显示,FlowSearch通过显式依赖建模与中间结果整合,有效避免证据丢失与逻辑链断裂[30] 应用价值 - 标志着科研智能体从"任务执行"向"知识驱动推理"的关键转变,为可解释科研智能体与自演化科学发现系统奠定基础[41][42] - 能够适配科学调研与报告生成任务,产出完整、全面且逻辑清晰的科学调研成果[32] - 对科研新人可构建完整知识探索路径,对跨学科研究者提供知识流整合能力,对资深学者可作为智能研究助手提升效率[43]