物理图灵测试
搜索文档
特斯拉通过「物理图灵测试」,英伟达机器人主管爆吹,圣诞节刷屏了
36氪· 2025-12-26 14:50
特斯拉FSD v14,首个通过「物理图灵测试」的AI。 为特斯拉「颁发」这一殊荣的并非别人,而是英伟达大名鼎鼎的机器人主管——Jim Fan。 平安夜前夕,这位英伟达Project GR00T的领军人物,在亲眼看到自家特斯拉的一路自主护送自己回家后,大受震撼: 我入手特斯拉比较晚,但却是最早体验FSDv14的用户之一。这可能是我第一次真正感受到通过物理图灵测试的AI:结束一天漫长的工作后, 你只需按下一个按钮,放松地靠在座椅上,完全分不出开车的是神经网络还是真人司机。 Jim Fan表示,FSD带来的第一感觉是「不可思议」,并且很快就已经渗透进了他的生活,甚至开始有点「上瘾」。 一开始你会觉得这不太真实,然后它就成了日常。再然后,就像智能手机一样,一旦失去它,你就会非常难受。这就是人类如何被重新塑造, 并最终沉迷于技术。 当然,FSD v14.2.2不是独属于Jim Fan的专属礼物。在陆续收到新版FSD推送后,特斯拉车主们的反馈也迅速刷屏——一句话总结:玩疯了。 特斯拉圣诞狂欢 首个得到英伟达机器人主管「背书」、被称为通过「物理图灵测试」的AI,在这个圣诞节火遍全网。 这个圣诞节,特斯拉给车主们送来了一波至 ...
特斯拉通过「物理图灵测试」!英伟达机器人主管爆吹,圣诞节刷屏了
量子位· 2025-12-26 12:24
我入手特斯拉比较晚,但却是最早体验FSDv14的用户之一。这可能是我第一次真正感受到通过物理图灵测试的AI:结束一天漫长的工 作后,你只需按下一个按钮,放松地靠在座椅上,完全分不出开车的是神经网络还是真人司机。 Jim Fan表示,FSD带来的第一感觉是「不可思议」,并且很快就已经渗透进了他的生活,甚至开始有点「上瘾」。 一开始你会觉得这不太真实,然后它就成了日常。再然后,就像智能手机一样,一旦失去它,你就会非常难受。 这就是人类如何被重新塑造,并最终沉迷于技术。 Jay henry 发自 凹非寺 量子位 | 公众号 QbitAI 特斯拉FSD v14,首个通过「物理图灵测试」的AI。 为特斯拉「颁发」这一殊荣的并非别人,而是英伟达大名鼎鼎的机器人主管—— Jim Fan 。 平安夜前夕,这位英伟达Project GR00T的领军人物,在亲眼看到自家特斯拉的一路自主护送自己回家后,大受震撼: 当然,FSD v14.2.2不是独属于Jim Fan的专属礼物。在陆续收到新版FSD推送后,特斯拉车主们的反馈也迅速刷屏——一句话总结: 玩疯 了 。 特斯拉圣诞狂欢 首个得到英伟达机器人主管「背书」、被称为通过「物理图 ...
特斯拉最新FSD推送,英伟达机器人主管:分不清人还是AI在开
36氪· 2025-12-25 09:24
特斯拉FSD V14.2.2版本更新 - 特斯拉FSD(完全自动驾驶能力)V14.2.2版本已正式推送给北美地区的Model 3/Y/X/S及Cybertruck车主[1] - 此次更新为有监督版本,优化重点在于流畅度、感知能力和停车能力[5] - 更新覆盖北美普通车主,是面向用户的一次大规模推送[6] 核心性能与用户体验提升 - 行驶过程更“自信”,变道丝滑无犹豫,决策更快且执行果断[9] - 复杂场景处理能力增强,例如在旁车道有摩托车或维修车辆时会提前留出空间,表现更“礼貌”[10] - 解决了旧版本的部分难题,如死胡同场景[7],并修复了车道抖动问题[8] - 有车主实测实现38分钟无接管、完成30次自动变道并自动驶入车库[8] - 网友进行10小时实测后,评价其为“迄今为止最好的FSD版本”[3] 技术升级与功能新增 - 升级了神经网络视觉编码器,利用更高分辨率增强了对紧急车辆、道路障碍物及人体手势的识别能力[12] - 新增对警车、消防车、救护车等特殊车辆的识别与应对,会执行靠边停车或避让操作[12] - 推出了导航和路径规划功能,可实时应对堵车或绕行情况[12] - 在泊车方面,新增“到达选项”,允许车主根据偏好(如停车场、路边、地下车库)选择停车点,系统会记忆并保存这些偏好[14] - 全量推送两个新的速度模式:SLOTH模式(速度更低,车道选择更保守)和MAD MAX模式(速度更快,变道更频繁)[16] - “启动自动驾驶”按钮的“刹车确认”功能现已默认关闭,可直接通过触摸屏启动[16] 系统改进与可靠性增强 - 改进了对静态门、动态门以及道路碎片(如轮胎、树枝、箱子)的识别能力[18] - 改进了对无保护转弯、变道、车辆切入和校车等情况的处理[18] - 提高了系统管理故障的能力,并能从降级运行中平稳恢复,增强了可靠性[19] - 新增对挡风玻璃内侧残留物堆积的警报,并新增自动窄区域清洗功能以清洁前置摄像头[20] - 摄像头可见性的提高可增强注意力监控的灵敏度[21] 行业评价与未来展望 - 英伟达科学家Jim Fan实测后评价FSD V14或许已通过“物理图灵测试”,即其驾驶过程与结果已与人类司机无异,令人难以分辨[23][27] - 根据公司规划,无监督版FSD的目标发布日期(DDL)已不足10天,若如期兑现,这可能是最后一次有监督版更新[31] - 未来关键节点包括:比当前模型大一个数量级的新模型(可能为FSD V14.3版本)即将部署,以及FSD计划在明年全面进入中国市场[31]
特斯拉FSD通过物理图灵测试
新浪财经· 2025-12-24 22:07
特斯拉FSD v14技术评价 - 英伟达机器人业务总监Jim Fan表示,特斯拉的FSD v14首次让AI通过了他提出的“物理图灵测试” [1] - Jim Fan指出,该系统体验令人惊叹,但很快融入日常生活,效果类似智能手机,一旦失去会让人感到明显不适 [1] - 马斯克赞同此观点,称FSD v14让人感受到“感知能力正在成长”,并认为特斯拉AI是当前最强的现实世界AI [1]
全球TOP 13战队翻车实录,机器人极限求生,比科幻片还残酷
36氪· 2025-12-08 18:18
赛事概况与核心理念 - 第五届ATEC科技精英赛线下赛以“真实世界极限挑战赛”为主题,旨在测试机器人在复杂户外环境中的自主能力,暴露技术弱点以推动行业进步[18][20][22] - 赛事由香港中文大学主办,ATEC前沿科技探索社区、北京大学、北京师范大学和蚂蚁集团共同承办,蚂蚁集团技术战略部负责人表示其长期支持源于对AGI技术与物理世界深度融合的信念[21] - 比赛场地设在香港中文大学岭南体育场及小桥流水生态区,全户外场景包含拱桥、山地、缓坡、石阶等多样化地形,并伴有光照变化、风力波动等真实环境扰动[25] - 赛事设计了四大任务链:垃圾分拣、自主浇花、定向越野、吊桥穿越,旨在考验机器人“多模态感知融合与连续决策”的能力,形成完整的“感知-规划-执行-反馈”闭环[30][31][32] 技术挑战与瓶颈 - 第一大挑战是环境感知与认知,真实环境的不确定性和高动态性对算法构成巨大挑战,例如“垃圾分拣”任务中,物品的油渍、变形或堆叠会干扰机器人的识别[34][35][36][40] - 第二大挑战是智能决策与响应,机器人缺乏“举一反三”和适应新场景的能力,例如“吊桥穿越”任务要求机器人能自主判断木板位置、使用工具铺路,体现了包含判断、使用工具和规划步骤的“高级智能”[41][44][46] - 第三大挑战是硬件与算力承载,存在“身体跟不上脑子”的问题,包括部署LLM的高性能专用芯片不成熟制约实时处理能力,以及精细抓取和灵活操作的技术难度与高成本[47] - 评分规则强力引导“无遥操”的全自主方式,完成任务可获得10-25分的额外加分,以此倒逼团队开发机器人的“AI大脑”和自主决策能力[29] 参赛队伍表现与结果 - 全球共有396支队伍参赛,最终13支队伍进入线下决赛,覆盖QS百强高校及985/211顶尖学府[48] - 总榜冠军由wongtsai(旺财)团队以434分获得,IRMV战队以363分位列第二,CyberPrime战队以357分位列第三[48] - 参赛队伍普遍感受到真实户外环境最大的挑战在于“不确定性”,如物品堆叠、吊桥晃动、水壶重量变化等,远比实验室条件复杂[49] - 在执行任务时,许多队伍在“无遥操”任务上做出了取舍,部分队伍在如“吊桥穿越”、“定向越野”等任务中切换至远程操控模式,也有如wongtsai、CyberPrime等团队坚持全自主并成功完成了部分任务[50][52][53] 行业洞察与未来展望 - 根据国际机器人协会《2025世界机器人报告》,2024年全球共有54.2万台机器人“上岗”,其中中国以29.5万台占全球总量的54%,但行业仍存在核心技术瓶颈,许多演示依赖遥控或预设程序,离完全自主的智能相差甚远[59][60] - 赛事被视作“物理图灵测试”的真实写照,系统性地检验机器人跨越环境感知与认知、智能决策与响应、硬件与算力承载这三大技术瓶颈的能力[61] - 冠军团队wongtsai队长朱承睿预测,大约20年后机器人可以真正走进人类生活提供服务[54] - 参赛队伍技术路线呈现多元化,既有采用传统“模块化”方案(分工负责感知、运动控制),也有探索“端到端”大模型方案,但硬件能力边界(如防水性、抓地力、算力)普遍成为制约算法发挥的瓶颈[57][58] - 赛事暴露了具身智能从“演示可行”到“应用可靠”之间的鸿沟,比赛中留下的代码、调试数据和失败经验被视为通往通用具身智能道路上的宝贵路标[63]
英伟达Jim Fan深度分享:揭秘具身智能路线与障碍
36氪· 2025-05-14 10:23
机器人技术发展现状与挑战 - 大语言模型已突破传统图灵测试,但机器人在物理世界的表现仍远未达到人类水平,数据是最大瓶颈 [1] - 机器人需要物理交互的真实数据,这些数据无法从网页抓取,只能靠人类手动采集,效率极低 [1][14] - 当前机器人面临"物理图灵测试"挑战,例如人形机器人动作笨拙、机器狗易滑倒、执行任务时混乱 [8][10] 仿真技术的突破性应用 - 在超高速仿真数字孪生中,机器人可在2小时内完成相当于现实世界10年的训练量 [17][24] - 仿真1.0采用数字孪生范式,矢量化物理引擎运行速度达每秒1万-100万帧 [28] - 通过域随机化技术(改变重力/摩擦/重量等参数),在1万个并行仿真环境中训练机器人 [20][22] 生成式AI驱动的仿真2.0革新 - RoboCasa平台中除机器人本体外,所有视觉元素由AI生成(3D资产/纹理/布局) [30][32] - 视频生成模型仅用1年实现传统图形学30年的进步,可模拟软体/流体等复杂交互 [42][43] - "数字表亲"仿真混合AI生成与传统图形管线,虽非1:1复刻但捕捉关键特征 [38] 世界模型与物理API的未来展望 - 仿真2.0结合视频扩散模型,实现"数字游民"在梦境空间的无限训练场景 [47][49] - 物理API将像大模型API操控数字信息一样操控物质变化,催生"物理App Store"经济 [54] - GR00T系列模型持续开源,推动视觉-语言-动作模型在工业/灵巧操作的应用 [51][53] 技术商业化路径 - 环境生成技术将场景数量扩展N倍,运动生成技术将演示数据扩展M倍 [34] - 米其林大厨可通过传授烹饪技艺给机器人实现服务规模化,形成技能经济 [54] - 最终目标为机器人融入环境智能,突破物理图灵测试临界点 [2][54]
腾讯研究院AI速递 20250512
腾讯研究院· 2025-05-11 22:17
OpenAI强化微调功能上线 - OpenAI发布RFT(强化微调)功能,通过思维链推理和专属评分机制,可用极少样本快速提升模型在特定领域的专业表现 [1] - RFT主要应用于指令转代码、文本精华提取、复杂规则应用三大场景,已有ChipStack等多家公司取得显著成效 [1] - 实施RFT前必须创建评估体系,明确任务定义和强化评分方案,避免模棱两可的任务目标 [1] Gemini 2.5视频理解突破 - Gemini 2.5 Pro通过低媒体分辨率技术可处理长达6小时视频,在多个学术基准测试中创下新纪录 [2] - 实现视频内容与代码无缝结合,能将视频直接转化为交互式网页应用、p5.js动画等创新应用形式 [2] - 具备精准的视频片段检索和时序推理能力,可实现复杂场景计数、时间戳定位等高级分析功能 [2] ChatGPT深度研究功能升级 - ChatGPT深度研究功能现可直接连接GitHub,团队用户可实时访问和分析代码库内容,包括代码、README和文档 [3] - 系统会根据用户提问自动生成搜索关键词查找相关内容,支持代码库搜索但需5分钟同步时间 [3] - OpenAI承诺企业级产品用户数据不会用于模型训练,但个人版用户若开启"为所有人改进模型"选项,内容可能用于训练 [3] Meta发布AssetGen 2.0 3D模型 - Meta发布新一代3D内容生成AI系统AssetGen 2.0,采用单阶段3D扩散模型,能直接从文本和图像生成高精度3D模型和贴图 [4] - 相比前代产品,新系统在几何一致性和纹理细节上有显著提升,已在Meta内部用于创建3D世界 [5] - Meta正在研发"完整3D场景生成"功能,目标通过简单文本指令一键生成完整的3D虚拟世界 [5] Multiverse:AI生成多人在线游戏 - 以色列Enigma Labs团队开发出全球首个AI生成的多人游戏Multiverse,实现了实时多人交互的赛车游戏,总开发成本不到1500美元 [6] - 技术突破在于创新的多人世界模型架构,通过沿通道轴堆叠双方玩家视图,实现共享世界状态的一致性渲染 [6] - 团队公开所有代码及数据,并通过修改《GT赛车4》游戏实现数据采集,利用B-Spec模式自动生成训练数据集 [6] Genspark推出AI Sheets工具 - Genspark AI Sheets推出全新AI表格工具,用户通过自然语言对话即可完成数据收集、整理、分析和可视化 [7] - 工具支持多格式文档导入、自动数据清洗、智能分析与可视化,官方称处理速度比传统手动操作快数十倍 [7] - 该工具目前处于Beta测试阶段免费开放,适用于销售、市场、产品等多个领域 [7] 陶哲轩数学工具升级 - 陶哲轩迅速升级其数学估计验证工具至2.0版本,将其改造为更灵活的证明助手,支持Python符号代数包sympy [8] - 新版本能处理命题逻辑、渐近估计等多种数学任务,陶哲轩在开发过程中大量依赖Github Copilot辅助编程 [8] - 陶哲轩发布数学形式化证明实验视频,展示如何在33分钟内借助Copilot和Lean证明助手完成一页纸数学证明的形式化 [8] 红杉AI峰会商业模式转型 - 红杉AI峰会提出AI商业模式转型:从卖工具转向卖成果,客户为可度量的业务结果付费,被视为"万亿美元机会" [9] - AI正从应用工具进化为操作系统级入口,谁能成为"用户意图的第一承接者",谁就能控制系统分配权 [9] - 未来AI竞争关键在于组织架构重构,从确定性执行转向目标试探模式,建立人机混合的协作体系 [9] YC合伙人谈AI应用设计 - YC合伙人指出当前AI应用不足在于产品设计思维仍停留在传统模式,未能充分发挥AI潜力 [10] - AI原生应用应该让用户能自定义系统提示词,让AI按照用户个人风格工作,而不是开发者预设的统一模式 [10] - 未来AI应用应转向"Agent构建器"而非单纯的Agent,为用户提供工具和界面来训练和定制自己的AI助手 [10] 英伟达"物理图灵测试"概念 - 英伟达机器人主管Jim Fan提出"物理图灵测试"概念:机器人能否在物理世界完成任务且让人无法分辨是人还是机器完成的 [11] - 解决机器人训练数据不足的关键在于模拟:通过高速并行模拟和域随机化生成训练数据 [11] - 未来发展方向是物理API,让机器人能像LLM处理数字信息一样处理物理世界,将催生新的技能经济和服务模式 [11]