强化学习(reinforcement learning)
搜索文档
刚刚,中美机器人爆发一场论战
华尔街见闻· 2025-11-18 18:43
《真实的人类》剧照 这家成立不久的公司背景也不简单,创始人来自腾讯。他们使用的硬件,是另一家中国公司宇树科技(Unitree)的G1人形机器人。 "这是假的!" 美国CEO下场质疑 一段"无加速、无遥控"的机器人视频,竟然让 硅谷大佬坐不住了。 最近,这段来自中国初创公司的机器人视频 展示了令人惊艳的技术实力, 在全球范围内引发了轩然大波。 更有意思的是,这段视频还意外引发了一场跨越太平洋的"真假之辩"。 中美机器人爆发了一场"论战" 就在最近,一个视频在国内外科技圈引爆了。 视频的主角,是一个来自中国的人形机器人。它能浇花、扔垃圾、整理玩具、和孩子们玩飞盘,动作流畅得令人惊叹。 更关键的是,发布方——一家名为"灵启万物(MindOn Tech)"的深圳初创公司强调,整个过程 "无加速、无遥控" , 完全由机器人自主完成。 这个视频如同一块巨石投入平静的湖面,迅速激起千层浪。视频的火爆,很快引来了大洋彼岸的关注。 有美国网友直接在社交平台X上@了"美国宇树"Figure的创始人兼CEO——布雷特·爱德考克(Brett Adcock),问他:"这是真的吗?" 这位CEO的回应,给火热的讨论浇上了一盆冷水: 看起 ...
GPT-5进步有限,o3性能滑坡,OpenAI押注通用验证器 | Jinqiu Spotlight
锦秋集· 2025-08-02 14:16
GPT-5开发进展与性能特点 - GPT-5在编程能力和复杂任务自动化方面有改进,但进步幅度更接近实用性优化而非代际跃迁[1] - 新模型擅长编写应用程序的易用性和美观功能,并能以最少人类监督驱动AI智能体处理复杂任务[18] - 性能提升无法与早期GPT-3到GPT-4的飞跃相比,行业整体进展正在放缓[10][19] - 采用通用验证器技术,在软件编程和创意写作等主观领域均表现进步[8][40] OpenAI技术挑战与内部重组 - 猎户座项目(原GPT-5计划)因高质量数据短缺和预训练优化失效,最终降级为GPT-4 5发布[2][26][27] - o3预览版基准测试表现优异,但转化为聊天模型后性能显著下降,因推理模型与人类交流方式存在差异[3][13][34] - 面临高质量网络数据枯竭问题,且优化方法在小规模模型有效但无法扩展至大模型[27][29] - 内部重组压力包括研究人员流失(Meta挖走十多位核心成员)和高管意见分歧[24][15] 关键技术突破与资源投入 - 推理模型(如o1 o3)通过增加算力和强化学习实现性能提升,尤其在科学领域理解能力突出[29][31][32] - 使用更多英伟达芯片服务器开发o3母模型,并赋予其互联网搜索能力以增强复杂概念理解[31] - 强化学习系统被视为AGI基础,通用验证器技术可跨领域评估答案质量[40] - 计划未来三年半投入450亿美元租赁服务器支持开发[19] 行业竞争与商业化前景 - 自动化编程成为优先发展方向,应对Anthropic等竞争对手的挑战[21] - 微软可能获得OpenAI盈利部门33%股权,双方正就知识产权条款进行谈判[20][24] - 即使渐进式改进也能提升ChatGPT商业价值,增强投资者信心[19] - CEO萨姆·奥特曼公开表示现有技术路径可支持实现GPT-8乃至AGI目标[20][42]