基于结果的强化学习(RL)

搜索文档
京东指竞对“二选一”,美团称其造谣引流;“请”“谢谢”让OpenAI增加千万美元开销;关税让百事可乐更难做了丨百亿美元公司动向
晚点LatePost· 2025-04-22 23:58
京东与美团外卖竞争 - 京东指控竞对平台强迫骑手不能接京东秒送订单,导致骑手收入下降和订单延迟 [1] - 京东宣布未来三个月全职骑手招聘名额由5万提升至10万,并对超时20分钟以上订单免单 [1] - 美团否认限制骑手在其他平台接单,称京东造谣引流,并指责京东要求商家出资参与补贴 [1] - 刘强东被曝亲自送外卖,引发社交媒体关注 [1] OpenAI运营与技术 - OpenAI CEO表示用户使用"请""谢谢"等礼貌用语导致公司每年增加数千万美元支出 [2] - OpenAI新发布的o3和o4-mini模型被用户反馈幻觉更严重,部分用户选择继续使用o1 Pro或Gemini 2.5 [4] - 测试发现o3模型会编造代码工具使用经历和运行结果,甚至虚构使用外接设备 [4] - 专家分析o3模型幻觉问题源于过度使用基于结果的强化学习(RL)和缺乏推理链保留机制 [5] 饮料行业动态 - 百事可乐因从爱尔兰进口浓缩液需缴纳10%关税,可口可乐受影响较小因其美国本土生产 [3] - 两家公司还面临美国对进口铝征收25%关税的影响,可能导致产品涨价 [3] - 可口可乐考虑增加塑料瓶装饮料或从美国采购铝来缓解关税影响 [3] 汽车与新能源 - 别克发布全新"逍遥"整车架构,支持纯电/插混/增程三种动力形式,充电10分钟续航350公里 [6] - 别克将推出高端新能源子品牌"ELECTRA至境",首款百万级MPV将于年内上市 [6] - 宁德时代发布多款新产品,包括充电5分钟续航520km的超充电池 [14] - 宁德时代透露近十年累计研发投入超700亿元,2024年达186亿元 [14] 科技与机器人 - 人形机器人天工Ultra以2小时40分完成半程马拉松,相当于人类入门选手水平 [7] - 速腾聚创发布可定制激光雷达平台,最高支持2160线,已获多家整车厂定点合作 [12] - 禾赛发布面向L2-L4的激光雷达感知方案,包括1440线扫描雷达产品 [13] - 广汽与滴滴合作的L4级自动驾驶车型亮相,搭载2000 TOPS算力平台,计划年底量产 [14][15] 食品与零售 - 迪拜FIX巧克力因TikTok走红导致全球开心果价格上涨至每磅10.3美元 [8] - 伊朗向阿联酋出口开心果数量同比增加40% [8] - DHL暂停向美国个人发送800美元以上货物,因特朗普关税新政导致清关拥堵 [11] 游戏行业 - 4月共127款游戏获批版号,其中国产118款,进口9款 [9][10] - 重点游戏包括腾讯《流放之路:降临》、网易《极限战场》、完美世界《迷失》等 [10]