Workflow
猿大侠
icon
搜索文档
全球首个IMO金牌AI诞生!谷歌Gemini碾碎奥数神话,拿下35分震惊裁判
猿大侠· 2025-07-22 11:33
核心观点 - 谷歌DeepMind的Gemini Deep Think模型在IMO竞赛中以自然语言方式破解5道题,获得35分(满分42分),达到金牌标准[3][4][22] - 该成绩获得IMO组委会官方认证,成为首个获此认可的AI系统[6][7][24] - 模型突破在于完全使用自然语言端到端推理,无需形式语言翻译,且在4.5小时比赛时限内完成[26][29] - 相比2024年AlphaProof和AlphaGeometry 2解决4题获28分(银牌)的表现有显著提升[17][19] - 技术核心是Deep Think增强推理模式,结合并行思考技术和强化学习训练[32][33][35] 技术实现 - 采用并行思考技术,同时探索多种解题路径并整合最优答案[33][34] - 通过新颖的强化学习训练,利用多步推理和定理证明数据提升能力[35] - 提供高质量数学问题解决方案集和IMO解题技巧作为知识库[42] - 模型即将向数学家测试者和Google AI Ultra订阅者开放[39] 解题案例 - 第一题(解析几何):通过设定引理和分类讨论,证明阳光线数量只能是0、1或3条[44][45][52] - 第二题(平面几何):分五步证明,包括确定旁心位置和引入辅助点性质[54][55][59] - 第三题(函数):通过上界证明c≤4和下界证明c≥4确定最小实数常数为4[65][66][67] - 第四题(数论):用五步证明序列性质,包括偶数性分析和动态行为研究[73][74][78] - 第五题(组合博弈):通过离散化策略和蓄力战术,确定Alice与Bazza的必胜条件区间[84][85][86] 行业影响 - IMO成为AI能力试炼场,数学推理能力接近顶尖人类水平[16][19] - 自然语言与形式化推理结合的AI将成为科研人员重要工具[105] - 谷歌与OpenAI的竞争凸显技术路线差异:官方认证vs自评结果[108][109][129] - OpenAI被质疑未获官方认证且提前公布结果,影响行业声誉[109][112][130] 团队背景 - 项目由Thang Luong领导,他是机器翻译深度学习先驱和注意力机制发明者[95][96][97] - 团队曾开发AlphaGeometry、LaMDA、Bard等知名项目[98]
旧手机先别扔!花不到70元,10年前旧手机「秒变」数据中心:下海识鱼8小时都没掉线
猿大侠· 2025-07-21 13:05
旧手机改造为微型数据中心 - 旧手机可被改造为高效、低成本的"微型数据中心",用于图像识别、传感器数据处理等任务,整体改造成本仅需8欧元(约合人民币66元)[1] - 10年前的旧手机硬件性能(如四核处理器、2GB RAM)仍不逊于部分IoT嵌入式设备(如树莓派),具备抗热性强、功耗低、结构紧凑等优势[2] - 智能手机硬件设计原本针对高能耗场景优化,处理大规模数据时效率较高,适合分布式算力平台[2] 改造技术方案 - 改造步骤包括:拆除电池改用外部供电、替换原生Android系统为Linux轻量系统(如PostmarketOS)、多手机集群协作(1主节点+3工作节点)、3D打印支架固定设备[6][7][8][9] - 实验中使用4台Google Nexus手机搭建集群,成本低于50欧元的树莓派设备,且能在25米深海环境中无故障运行8小时完成海洋生物图像识别[10][11] - 选择Nexus系列因其开源模块化设计,但现代手机封闭式结构增加改造难度[11][12] 应用场景与市场潜力 - 适用场景包括:海洋监测(水下图像识别)、城市人流统计(红外传感器)、无人机实时图像分析(地面机器人协同)[11] - 初创企业可作为低成本替代方案,满足轻量级数据分析、网站托管等需求,避免高昂云计算成本[11] - 全球每年丢弃手机达53亿部,电子垃圾回收率仅22%,改造方案兼具环保与经济价值[13][14][15] 行业影响与发展方向 - 研究推动电子产品设计向可维护性、可再利用性转型,从源头减少电子垃圾[15] - 分布式算力模式为边缘计算提供新思路,利用闲置资源降低算力部署门槛[1][10]
打击0公里二手车,曝工信部拟推行“新车登记后6个月内禁止转二手”
猿大侠· 2025-07-21 13:05
零公里二手车现象 - 长城汽车董事长魏建军指出三四千家二手车平台销售零公里车是行业毒瘤 [1] - 2024年全国二手车市场中登记日期≤3个月且里程数≤50公里的车辆占比达12.7%,其中新能源车型占比超60% [1] - 零公里二手车在汽车出口领域被部分车商利用政策差异以二手车名义出口新车,规避进出口管制和高额关税 [1] 行业操作与制造商行为 - 部分汽车制造商因产能过剩将未售出新车自行注册为零公里二手车,以美化销售数据并快速回笼资金 [1] - 零公里二手车现象导致工厂闲置问题,制造商通过此方式维持产能使用率 [1] 消费者风险 - 零公里二手车价格低廉但多数无法享受厂商提供的完整三电系统(电池、电机、电控)质保 [3] - 核心部件故障时消费者需承担高额维修费用 [3] 监管与行业应对措施 - 商务部计划强化全流程监管并建立信用评价体系 [3] - 工信部拟推行新车登记后6个月内禁止转二手政策以阻断套利空间 [3] - 中国汽车流通协会推动建立二手车出口唯一编码制度,奇瑞、比亚迪等企业已启动经销商违规上牌追责机制 [3] - 中国汽车工业协会发布倡议反对无底线价格战,支持企业正常参与市场竞争 [3]
大侠后宫:“新娘怀疑化妆师会勾引她老公...?”哈哈哈人在无语的时候真的会笑!
猿大侠· 2025-07-21 13:05
转自:吐槽星君 化妆师被新娘问会不会勾引自己老公? (v i a .@青爱的! ) -5-5 笑死了,想起来有个女生要求美甲师闭着眼 2339 睛做美甲,因为不想其他女人看到她男朋友 07-03 湖北 回复 6 公众号 · 吐槽864 ? 07-03 上海 回复 翻译 "暂时还没有这个业务哈"07-03 河北 回复 6119 1 = 哈哈哈哈哈哈哈哈哈哈暂时不开通此 899 业务 07-03 黑龙江 回复 展开 27 条回复 我找了男化妆师,等我去问问他会不会勾引 2508 我老公 20 07-03 山东 回复 E = 你等着被挂吧 ç® 07-03 安徽 回复 1905 展开 61 条回复 = 不会的宝宝,我回族 07-03 北京 回复 2780 F The 哈哈哈妙哇~ 07-03 河南 回复 公众号 · 吐槽屋 -F =1 我学车的时候加了同一车的学员方便到时候 32 一起练车,当天晚上他女朋友就问我为啥勾 引他男朋友。我说就你男朋友长得还没我老 公脚指头好看。我又不眼瞎能看上他,他也 | 日ナキキガスノキニ リボブルサクタテゴ FF 狗好鸡坏 (v i a .@ 以防你今天还没看小动物 ) 本想躲在被 ...
Steam回应删除大量色情游戏:不想,但没办法
猿大侠· 2025-07-20 12:20
蓝点网 . 科技资讯、软件工具、技术教程,尽在蓝点网。蓝点网,给你感兴趣的内容 #游戏资讯 Valve 首次回应 Steam 商店下架大量成人或色情游戏,因为支付渠道 / 卡组织 / 银行施压而不得不下架。 Valve 称该公司最近收到通知称某些游戏可能违反支付处理上 / 卡组织 / 银行的规则和标准,因此不得不在 Steam 商店 下架这些游戏以免整个支付渠道都被封锁。查看全文:https://ourl.co/109826 以下文章来源于蓝点网 ,作者山外的鸭子哥 我们最近收到通知称 Steam 平台上的某些游戏可能违反我们的支付处理商及其相关卡组织和银行制定 的规则和标准。因此我们将在 Steam 商店停止销售这些游戏,因为如果丢失付款方式将导致顾客无法 在 Steam 商店购买其他游戏和游戏内容。我们将直接通知受影响的开发者,如果这些开发者未来有其 他游戏想要在 Steam 商店中分发,我们会发放相应的应用积分 ( 作为补偿 ) 。 这种情况也非首次发生: 你可能还对知名成人色情网站 PornHub 清理非认证创作者视频有印象,当时某知名新闻媒体爆出该网 站存在大量未经同意的或涉及未成年人的色情视频,随 ...
刚刚,OpenAI神秘新模型斩获IMO 2025金牌!攻克奥数巅峰,硅谷沸腾
猿大侠· 2025-07-20 12:20
转自:新智元 编辑:编辑部 【导读】 OpenAI的神秘通用推理模型,竟然攻克IMO 2025的5道难题,成功摘金了?这个消息,让Greg Brockman等一众大佬激动转发。 也就是 说,OpenAI很可能已经研发出颠覆性的推理技术,彻底告别CoT。还有一个炸裂消息:GPT-5也要来了。 就在昨天,全世界的顶尖大模型还在2025年的IMO赛场上全军覆没,连铜牌的边都没摸到。 然而,就在刚刚,OpenAI 投下了一枚重磅炸弹——他们用一款全新的「通用推理模型」,成功夺下了IMO 2025的金牌! 6道题,解出5道,狂揽35分! 要知道,此前表现最好的Gemini 2.5 Pro,也只得了 13分 。 联创Greg Brockman、负责人Alexander Wei,以及OpenAI的各路研究员,纷纷在推上激动宣布了这一里程碑式的成就! 对此,德扑之父Noam Brown表示,这个成绩的意义甚至超越了「AI攻克IMO」本身。 消息一出,整个硅谷为之沸腾! 人们纷纷猜测,OpenAI这次很可能祭出了一种 颠覆性的推理技术 ,彻底告别了传统的CoT思维链。 这,不仅仅是一个模型的胜利,更是一个全新时代的开端! 更令 ...
大侠后宫:“用拜金人设打败爱幻想的男网友…?”啊啊啊请问是签到打卡送女友吗!
猿大侠· 2025-07-20 12:20
社交媒体互动现象 - 用户通过拜金人设直接索要金钱(5000元房租)来测试对方真心 [4][5][6] - 部分用户反感日常问候式互动(早安晚安、吃了没)[12] - 网友创作段子讽刺快餐式恋爱("贤夫扶我青云志 我还贤夫万两金")[13] 品牌拟人化创作 - 淘宝与肯德基被拟人化为有恩怨的商业对手 [24] - 饿了么、支付宝等品牌被赋予旁观者角色参与剧情 [24] - 创作包含商业元素(疯狂星期四营销、红包策略)[24] 外卖服务场景 - 用户要求骑手深夜配送时保持静默(不敲门不按门铃)[32][33] - 骑手使用军事术语与用户互动("悄悄滴进村 打枪滴不要")[32] - 凌晨配送需求显示夜间消费市场存在 [33] 宠物行为观察 - 猫咪能识别不同家庭的作息规律并调整叫早服务 [60] - 宠物会模仿人类进食行为(仓鼠学人吃饭姿势)[68] 职场相关讨论 - 员工自嘲技能单一导致薪资偏低 [66] - 网友调侃公司聚集区为"地狱" [22] - 数学题设置包含职场场景(课程表安排)[36]
恭喜了!全体程序员彻底狂欢吧!这个好消息来得太及时!
猿大侠· 2025-07-19 11:43
软考证书价值与行业认可 - 软考是IT从业者必备黄金证书 企业和社会认可度极高 尤其系统架构设计师和软件设计师两科含金量更高 可作为技术背书 简历镀金和晋升管理岗的重要途径 [3] - 持证者可享受多重福利 包括以考代评(直接获得职称资格) 积分落户(60-140分) 升职加薪(涨薪500-2000元) 考编年龄放宽至40周岁等政策优惠 [9] - 证书带来经济补贴 不同地区提供5-25万不等的租房购房津贴 还可入专家库参与评审工作 国际认可度逐步提升 [9] 2025年软考改革趋势 - 工信部技术研究岗将实施考试改革 预计明年难度大幅提升 云计算 嵌入式 区块链等AI技术内容占比增加 计算机理论基础考察减少 [7][10] - 2025上半年考题难度显著上升 系统架构设计师科目技术含量最高 软件设计师考察范围广 网络工程师50%内容超纲 [11] - 考试知识点分布显示 软件工程基础占17.33% 面向对象占14.67% 数据结构与算法占12% [14] 特训营核心资源 - 提供2天直播课+1599元内部资料包+1V1上岸攻略+最新真题解析+万能模板等全套备考工具 限50人免费参与 [2][3][12] - 课程聚焦核心知识点与前沿技术 包含智能刷题平台 机考模拟系统及超5G历年通关秘籍(真题/模板/资料) [12][20][22] - 采用独家记忆口诀 案例逻辑 论文行文技巧等备考方法 1V1定制学习计划 强调按时听课+同步刷题+考前密押的闭环学习 [16][18] 职业发展机遇 - 证书助力积分落户(北京工作居住证) 跳槽晋升 职称评定 项目竞标加分 部分岗位招聘明确要求工学/理学学历及2年以上经验 [7][9] - 持证者可获得退休金补贴 个税减免 并拓展跨岗位发展可能性 如研发 测试 产品 运维等岗位均能受益 [9][11] - 企业将员工持证数量作为项目投标竞争力 个人可获得公司奖金 行业专家身份还能带来额外评审酬劳 [9]
大侠后宫:“几个月没回家后看爷爷的手机.....” 哈哈哈哈哈哈救命直接成培养皿了!
猿大侠· 2025-07-19 11:43
转自:喵大白话 咱爷手机这么丰富呢! 。 女生日历 妈妈网 ... 美柚 大嫂妈 ... 糖字好 | 0 || | ® 柚子大 ... ● 大姨妈 .. 经期日记 大婶妈 .. 经期 ▶月经 。 月经期 ... 大姨妈 宝宝树 .. U Gi ● 极强消 ... α 深度清理 ● 神速滴 ● 猎豹清 ... @ 360手 ... 0 360滴 .. ● 免费超 ... ● 手电筒 ... ● 超亮光 ... 9 手电同。 成 2012 Q 2公众号· 喵大白话 赌出没 .. 和平埔英 CT 院 出版 脂出设。 熊出没2 那三说 周交版 星帝成 .. 保卫萝卜 ed to NG FM J 聊理 展开 注册 在中元 I 家 经变成 Q 公众号·喵大白话 开心消 植物值 ... Soul P n · Soul 『 探探 刷值文 e 同城拼友 ● 牵手 ● 同城夜聊 ● 组CP ● 悦色视 .. 网友评论笑得发癫: Pilrir 爷不来事,也不怕事 目经期 ♡ 9.5万 ♡ 回复 1-12·福建 III 2 公众号· 喵大白话 正是来月经的好年纪 狸花猫怎么样 七八十岁正是情窦初开的年纪念了 00 2259 7 7 ...
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
猿大侠· 2025-07-19 11:43
模型排名与性能 - Kimi K2在全球开源模型中排名第一,总榜第五,紧追顶尖闭源模型Grok 4 [1] - 开源模型DeepSeek R1位列总榜第八,与Kimi K2成为唯二进入TOP 10的开源模型且均来自中国 [2] - Kimi K2在多项能力中表现突出:连续多轮对话并列第一、编程能力第二、应对复杂提示词能力第二 [3] 社区热度与行业认可 - Kimi K2发布一周内GitHub标星达5.6K,Hugging Face下载量近10万 [5] - Perplexity CEO公开支持Kimi K2,透露计划基于该模型进行后训练 [5] - 用户访问量激增导致API响应延迟,反映模型热度极高 [6] 架构设计与技术优化 - Kimi K2继承DeepSeek V3架构,但通过四项关键参数调整优化性能:增加专家数量、注意力头减半、仅保留第一层Dense、专家无分组 [12] - 调整后总参数增至1.5倍,但推理耗时理论值更低,成本与V3架构相当 [13] - 团队选择V3架构因其已验证高效且符合有限资源条件,避免"为不同而不同" [10][11] 开源模型行业趋势 - 开源模型性能差距缩小,TOP 10模型总分均超1400分,开源与闭源近乎同一起跑线 [20][21] - 行业专家预测开源将更普遍击败闭源,并在AI本地化定制中发挥关键作用 [24] - 开源模型打破"性能弱"刻板印象,国产开源模型表现尤为亮眼 [18][22]