Gemini 2.5 Deep Think

搜索文档
谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4
量子位· 2025-08-02 09:33
产品发布与更新 - 谷歌DeepMind推出Gemini 2 5 Deep Think模型 已在Gemini App中上线[3] - 发布版本与IMO金牌版本略有不同 速度更快但实力稍逊 仅达铜牌水平[4][5][6] - 模型仅对Ultra订阅用户开放 月费249 99美元 约合人民币1803元[7] 性能表现与对标 - 推理性能超越OpenAI的o3和马斯克的Grok 4[8] - 在LiveCodeBench V6和Humanity's Last Exam测试中均取得最佳成绩[10] - 擅长编码 科学 知识和推理能力[9] 技术原理与优势 - 采用并行思维技术 拓展思维能力边界 可一次性生成众多想法并修正结合[14][15] - 延长推理时间 探索不同假设 找到创造性解决方案[16] - 迭代式开发能力突出 提升网页开发任务的美观性和功能性[12] 应用场景 - 可深度阅读论文 融合不同论文观点 非简单复述[17] - 协助数学猜想探索和科学文献推理 加速科研发现[18] - 擅长算法开发与代码编写 能精细考量问题表述和时间复杂度[18] 行业影响 - 模型展示谷歌在AI推理领域的领先技术实力[8][10] - 高性能订阅模式可能重塑AI产品商业化路径[7] - 在科研和工程领域的应用潜力显著[17][18]
宗馥莉不得挪用!娃哈哈宗氏“百亿”财产纠纷案判决书曝光;网传汪林朋“绝笔信”为假;智元机器人获国际集团战略投资丨邦早报
创业邦· 2025-08-02 09:09
娃哈哈宗氏财产纠纷 - 香港高等法院判决建浩创投有限公司名下汇丰银行账户资产为宗继昌、宗婕莉、宗继盛三位原告享有受益权的信托财产 [3] - 法官下令宗馥莉不得从相关账户提款或转账资产 禁制令持续至杭州及浙江法院诉讼最终裁决为止 [3] - 被告需支付原告利息收益 以21亿美元为基数 并赔偿擅自转移的信托财产损失108.5万美元 [3] - 三名原告自称是宗馥莉同父异母弟妹 首次曝光其非独生女身份 [3] 外卖平台补贴规范 - 美团、淘宝、饿了么等平台集体承诺规范促销补贴 包括不以显著低于成本价格销售 合理规划补贴发放 [5][6] - 美团声明强调遵守《反垄断法》等法规 保障商家自主定价权 不对补贴总额夸大宣传 [6] - 京东外卖承诺杜绝"0元购"等恶性补贴 搭建透明补贴机制 推动行业回归品质与服务竞争 [6] - 平台措施旨在响应行业协会呼吁 停止内卷式补贴 构建良性行业生态 [6] 企业动态与人事变动 - 格力电器声明否认与"张某利"存在不正当往来 称相关指控为造谣诽谤 [9] - 上海星巴克咖啡经营公司董事长变更为沈灿 原董事长TAN BUAY BENG卸任 [11][12] - 捷豹路虎CEO阿德里安·马戴尔宣布退休 结束35年职业生涯 曾带领公司扭亏为盈 [12] - 阿里前CEO张勇加入港交所中国业务咨询委员会 该委员会成员增至九名 [12] 科技与AI进展 - OpenAI宣布欧洲首个AI数据中心项目"星际之门"挪威站 由Nscale和Aker合作建设 [12] - 谷歌推出Gemini 2.5 Deep Think模型 数学能力达IMO 2025铜牌水平 面向不同用户推出两个版本 [14] - ChatGPT付费企业用户从6月300万增长至超500万 覆盖从初创企业到财富500强 [12] - Figma上市首日股价暴涨250% 收盘报115.5美元 盘后继续上涨 [13] 汽车行业动态 - 理想汽车回应碰撞测试争议 称i8与卡车撞击实验基于真实交通场景模拟 由第三方机构提供设备 [8] - 上汽集团与华为合作的首款车型尚界H5将于9月上市 搭载HUAWEI ADS 4辅助驾驶系统 [14] - 福特汽车在美召回超30万辆汽车 涉及具体型号未披露 [12] 投融资与并购 - 高盛拟以171.3亿美元估值收购冰淇淋制造商Froneri [14] - 诺瓦聚变完成5亿元天使轮融资 创国内民营核聚变公司单笔融资新高 [13] - 智元机器人获LG电子和韩国未来资产集团联合领投 系LG在具身智能领域首次对外布局 [14] - 餐饮机器人公司Yo-Kai Express计划2025年底在纳斯达克IPO [13] 消费与文娱市场 - 演唱会经济效应显著 每1元门票拉动4.8元周边消费 周杰伦三亚演唱会带动超11亿元综合消费 [16] - 电影《罗小黑战记2》上映15天票房破3亿元 [17] - 最高法明确竞业协议对非涉密员工无效 遏制协议滥用现象 [16][17] 全球科技行业趋势 - 今年全球科技业裁员超8万人 涉及171家公司 美国科技职位招聘数量较2020年初下降36% [21] - 苹果CEO库克表示关税使公司损失8亿美元 本季度可能再增11亿美元成本 [11] - 苹果大中华区销售额同比增长10%至153.7亿美元 扭转此前下滑趋势 [11] - 任天堂第一季度销售净额同比增长132.1%至5723.6亿日元 净利润增长18.6% [12]
刚刚,谷歌「IMO金牌」模型上线Gemini,数学家第一时间证明猜想
机器之心· 2025-08-02 08:55
产品发布与功能升级 - 谷歌向Google AI Ultra订阅用户推出Deep Think功能,并向部分数学家提供全版本Gemini 2.5 Deep Think模型[1] - 新版本融合早期测试反馈和研究突破,较I/O大会发布的版本有显著改进[3] - Deep Think基于IMO金牌模型的变体,推理速度更快且日常体验更佳,在2025年IMO基准测试中保持铜牌级性能[4] 技术特性与创新 - 采用并行思维和强化学习技术,可同时生成多个想法并修订结合,延长推理时间以探索创造性解决方案[12] - 支持与代码执行、Google搜索等工具自动配合,生成更长响应[6] - 在HLE(34.8%)、Live Code Bench V6(87.6%)、IMO2025(60.7%)和AIME 2025(99.2%)等基准测试中表现突出[18] 应用场景与案例 - 帮助数学家Michel van Garrel证明猜想,适用于研究人员解决高度复杂的数学和科学问题[5][19] - 在迭代开发中表现亮眼,如通过单提示词生成细节丰富的体素艺术图像[14] - 擅长算法开发与编程,能处理需要精确表述和时间复杂度的重要编码问题[19] 产品性能对比 - 在Humanity's Last Exam基准中,Deep Think(34.8%)显著优于Gemini 2.5 Pro(21.6%)和OpenAI(20.3%)[20] - IMO 2025数学测试达到铜牌水平(60.7%),远超Gemini 2.5 Pro(31.6%)和OpenAI(16.7%)[20] - 代码生成能力在LiveCodeBench v6达87.6%,领先同类产品[20] 商业化与测试计划 - 当前仅限Google AI Ultra订阅用户使用,每日限制5条/24小时[10] - 计划未来几周通过Gemini API向受信任测试者发布带工具和不带工具的版本[11] - 安全性方面,内容安全性和客观性提升,但拒绝良性请求倾向增强[20]
谷歌放出IMO 2025金牌模型Gemini 2.5 Deep Think,截胡GPT-5
华尔街见闻· 2025-08-02 05:43
谷歌推出Gemini 2.5 Deep Think - 公司推出Gemini 2.5 Deep Think,该模型是内部模型的优化变体,曾获得IMO2025金牌 [1] - 模型速度提升,数学能力达到IMO 2025铜牌水平 [1] - 功能已向Google AI Ultra订阅者在Gemini应用中推出 [1] 版本发布 - 公司发布两个版本:日常可用版(面向Ultra订阅者)和竞赛级完整版(面向顶尖数学家) [1]