Workflow
o3推理模型
icon
搜索文档
OpenAI未公开的o3「用图思考」技术,被小红书、西安交大尝试实现了
机器之心· 2025-05-31 14:30
多模态推理模型技术突破 - OpenAI推出的o3推理模型首次实现将图像直接融入推理过程,具备"用图思考"能力,在V* Bench基准测试中准确率达95.7%[1] - o3模型可自动聚焦图像关键区域(如物理试卷公式区、建筑图纸承重结构),结合知识库进行深度推理[1] - 小红书团队联合西安交通大学开发DeepEyes模型,通过端到端强化学习实现类似o3的"图像思考"能力,并开源技术细节[1] 多模态推理方法对比 - 传统"先看后想"方法存在局限:推理阶段无法回看图像补充细节,易导致理解偏差[4] - 更有效的"边看边想"方法允许动态调用图像信息,实现视觉与语言交替交互,提升多模态理解能力[4] - DeepEyes展示完整的三步推理流程:全局视觉分析→智能工具调用→细节推理识别,无需依赖外部OCR工具[7][8][9][10] DeepEyes模型架构与训练 - 引入"自驱动视觉聚焦"机制:根据文本推理需求动态裁剪关键图像区域进行深入分析[14] - 采用端到端强化学习策略,不依赖监督微调(SFT),通过outcome-based奖励函数激发原生能力[18][19] - 训练过程经历懵懂期(随机尝试)、探索期(频繁调用工具)、成熟期(精准预判关键区域)三阶段[21] 性能表现与优势 - 在V* Bench取得90.1准确率,HR-Bench超越现有工作流方法,7B版本视觉搜索表现优于Qwen-VL 32B[23] - 五大独特优势:训练更简洁(仅需问答对)、更强泛化能力、端到端联合优化、深度多模态融合、原生工具调用能力[26][27][28] - 数学推理能力显著提升,展示多模态模型跨任务潜力[24] 行业影响 - 开创多模态推理新范式:无需复杂工作流或大规模监督数据,通过强化学习实现视觉-文本深度融合[29] - 技术突破使"图像思考"不再是OpenAI专属,为开放世界多模态智能探索提供新路径[1][29] - 研究团队来自小红书和西安交通大学,成果已在实习期间完成并开源[31]
硅谷大厂暂缓数据中心建设,算力叙事要讲不下去了
36氪· 2025-04-27 14:34
科技巨头数据中心扩张放缓 - 亚马逊跟随谷歌、微软步伐暂停AI数据中心租赁谈判 尤其在国际租赁方面 [1] - 微软已搁置俄亥俄州10亿美元数据中心建设计划 涉及三个数据中心项目 [1] - AWS暂停租赁与微软近期动态相似 两家公司均在收缩新项目 [1] 云计算与AI公司合作关系变化 - AWS与AI独角兽Anthropic深度绑定 Anthropic优化大模型以适配AWS基础设施 [2] - 微软Azure失去OpenAI独家数据中心提供商地位 仅保留新增云计算服务优先购买权 [1] - 开源模型生态成熟导致AI初创企业退出 减少数据中心算力租赁需求 [2] AI模型发展现状与行业影响 - DeepSeek开源模型引发基座大模型价值重估 国内"AI六小虎"开始转型 [2] - 李开复预测国内基座大模型将仅剩DeepSeek、阿里巴巴、字节跳动三家 [2] - AI模型进步速度明显放缓 有创业者指出自2023年8月以来无实质性突破 [3] 模型性能与用户体验脱节 - Meta的Llama 4在lmsys竞技场排名第一 但实际应用中图像理解等任务表现糟糕 [3] - OpenAI的o3模型宣称FrontierMath正确率超25% 实测仅达10% [3] - AI行业陷入追求跑分而非用户体验的怪圈 类似手机行业发展历程 [4] AI应用商业化困境 - 行业投入数百上千亿美元 最具影响力产品仍仅为ChatGPT类聊天机器人 [4] - AI伴侣等潜在应用受伦理合规限制 大厂回避导致难以规模化发展 [4] - 缺乏被大众认可且具盈利能力的AI应用 商业化路径尚未清晰 [4] 行业扩张与收缩周期 - 2022年硅谷大厂曾进行万人规模裁员 Meta承认疫情期扩张过度 [5] - 2020年疫情催生互联网需求激增 2021年后增长停滞导致裁员潮 [5] - 当前AI行业可能重复互联网周期 从盲目乐观转向理性收缩 [6]
OpenAI官宣GPT-4本月底退役 由4o完全替代
快讯· 2025-04-12 21:48
产品更新 - OpenAI宣布GPT-4将于4月30日退役 由GPT-4o完全替代 [1] - GPT-4将继续通过API提供使用 [1] - GPT-4o在写作、编码、STEM等方面持续超过GPT-4 [1] 新产品发布 - OpenAI下周将揭晓一系列新AI模型 包括GPT-4 1 [1] - GPT-4 1是GPT-4o多模态模型的改进版 [1] - 将推出更小的GPT-4 1 mini和nano版本 [1] - 将推出o3"推理"模型和新的o4-mini推理模型 [1]