强化学习教师

搜索文档
腾讯研究院AI速递 20250624
腾讯研究院· 2025-06-23 23:15
特斯拉Robotaxi服务上线 - 特斯拉Robotaxi服务在德州奥斯汀启动,首批乘客固定价格4.2美元,仅向受邀用户开放,投入10-20辆Model Y车辆 [1] - 服务有严格地理围栏限制,运营时间为早6点至午夜,车内配有安全监控员可紧急接管,部分情况下还有跟车和远程驾驶员 [1] - 用户体验总体平稳,能应对基本城市驾驶场景,但存在需远程操作介入等问题,马斯克计划数月内扩大至上千辆,但竞争对手Waymo已运营1500辆无人车 [1] OpenAI收购io公司进展 - OpenAI撤除了展示萨姆·阿尔特曼与乔尼·艾维合作的宣传视频,但其65亿美元收购io公司的交易仍在正常推进 [2] - 撤视频原因系法院因iyO公司商标侵权投诉而发布禁令,要求OpenAI删除所有使用"io"名称的宣传材料 [2] - OpenAI已在原公告页面更新声明表示不同意该投诉并正评估应对方案,确认此事不会影响与io的交易进程 [2] 月之暗面Kimi-VL新版开源 - 月之暗面开源Kimi-VL-A3B-Thinking-2506多模态模型,仅用2.8B激活参数在多项测评中超越GPT-4o [3] - 新版本在数学能力、视频理解等方面表现突出,MathVision得分56.9,VideoMMMU得分65.2,刷新开源模型记录 [3] - 支持320万像素分辨率(提升4倍),思考过程更清晰,在多项测试中已超越Qwen2.5-VL-32B,与Qwen2.5-VL-72B相当 [3] MiniMax推出语音新功能 - MiniMax推出Voice Design音色设计功能,用户可通过自然语言描述定制所需音色,实现"任意语言×任意口音×任意音色"的组合 [4] - Speech-02模型在Artificial Analysis榜单持续位列全球第一,已帮助客户生成超1.5亿小时语音,与30多个国家客户合作落地 [5] - Voice Design解决了系统音色难以精准匹配细分场景和复刻音色成本高等问题,能根据文字描述自动拆解生成专属音色编码 [5] 百度发布Comate AI IDE - 百度发布Comate AI IDE,作为多模态、多智能体协同的原生AI编程工作台,已可在官网下载使用 [6] - 核心功能包括编程智能体Zulu全流程辅助编码、设计稿一键转代码(Figma to Code)、图片转代码,能自动推进前后端开发 [6] - 支持MCP开放平台,可接入GitHub等第三方工具,实现从"代码语言"到"意图语言"的进化,用户只需表达想法即可完成开发 [6] 强化学习教师新范式 - Sakana AI提出"强化学习教师"(RLT)新范式,让模型学习如何教学而非直接解决问题,通过生成解释来帮助学生模型理解 [7] - 仅7B大小的教师模型表现超过671B的DeepSeek-R1,且能有效教授32B等更大规模的学生模型,显著降低训练成本 [7] - RLT方法将教师模型的奖励机制与教学效果对齐,训练速度从传统RL的数月缩短至不到一天,为构建高效推理模型开辟新路径 [7] Deezer对AI音乐进行标注 - Deezer将对AI生成曲目专辑进行标注,每日拦截超2万首AI生成音乐,约占上传量18%,其中70%播放量为虚假的 [8] - AI生成歌曲目前仅占平台总流量0.5%但增长迅速,被标记的AI内容将不会出现在编辑精选歌单或算法推荐中 [8] - Deezer已为AI检测技术申请两项专利,能识别合成与真实内容的"独特特征",此举正值三大唱片公司与AI音乐初创公司洽谈授权合作之际 [8] 腾讯脑力锻炼软件获医疗器械注册证 - 腾讯"脑力锻炼"认知功能训练软件获医疗器械注册证,成为医生可开处方的数字疗法,针对轻度认知障碍患者 [10] - 该软件采用游戏化认知训练方法,将训练融入诗词、收纳、厨艺、音乐四大生活场景,针对不同认知域进行多维激活 [10] - 临床试验显示使用该软件训练后认知评分显著提高,目标人群为中国约3877万轻度认知障碍老人,可帮助延缓甚至避免向阿尔茨海默病发展 [10] 银河通用完成11亿元融资 - 银河通用获11亿元融资,宁德时代及溥泉资本领投,累计融资超24亿元,估值已达十亿美元,创人形机器人行业纪录 [11] - 公司技术实力强劲,已发布全球首款开源跨虚实人形机器人遥操作系统OpenWBT,并推出智慧零售解决方案,预计年内部署100家门店 [11] - 行业关注银河通用与宇树技术结合的可能性,两者在技术互补、资本关系紧密,未来合作前景广阔,中国人形机器人市场预计2025年达7300台,规模近24亿元 [11] AI失业潮预警 - 哈佛商学院视频预警:AGI可能在2-5年内实现,AI失业潮即将席卷全球,将导致经济体系崩溃风险 [12] - 弗吉尼亚大学经济学家Anton Korinek指出当前收入分配制度不可持续,随着AI发展人类工资必将下降,建议实施"全民基本收入" [12] - 专家警告各国政府必须紧急制定新收入分配制度,加强AI监管合作,防止AI技术导致大规模失业和社会不稳定 [12]