Workflow
AGI真方向?谷歌证明:智能体在自研世界模型,世界模型is all You Need
机器之心· 2025-06-13 10:32
机器之心报道 编辑:泽南、Panda 越通用,就越World Models。 我们知道,大模型技术爆发的原点可能在谷歌一篇名为《Attention is All You Need》的论文上。 如今,在通用人工智能(AGI)初现曙光,Scaling Laws 却疑似接近极限的当口,又是谷歌对未来方向进行了一番思考,想来想去还是只有五个词: 论文标题:General agents need world models 论文链接:https://arxiv.org/abs/2506.01622 香港中文大学博士 Richard C. Suwandi 撰写了一篇博客文章,详细解读了这篇开创性的论文及其对 AGI 未来的意义。 | AUTHORS | AFFILIATIONS | PUBLISHED | | --- | --- | --- | | Richard Cornelius Suwandi | The Chinese University of Hong Kong, Shenzhen | June 11, 2025 | 想象一下,如果我们能够构建一个像人类一样思考和计划的人工智能,未来会是什么样子。大语言模型(L ...
CVPR 2025 Highlight|北大联手智元发布首个基于说明书的家电操作评测基准
机器之心· 2025-06-13 10:32
本工作于 2024 年 11 月完成,目前已经被 CVPR 2025 接收并评选为 Highlight,第一作者为龙宇星,导师为北京大学董豪老师。课题组致力于研究统一的物体表征 操作研究,以实现具有可解释性和泛化能力的物体操作策略。 自 19 世纪末爱迪生发明电灯以来,电器的发展和革新不断提升人类的生活水平。如今,电器已经走进千家万户,成为我们的得力助手,与我们的生活密不可分。 赋予机器人使用家电的能力具有重要的学术价值和广阔的应用前景。 目前在机器人操作领域,一般物体(如刚体和铰接物体)的操作研究已经取得一定进展,但是现有操作策略主要执行单步原子操作。对于设备(如家电)而言, 必须按照正确顺序和方式进行多步操作,才能正确完成高层次任务。因此,参照说明书进行长程操作规划对于家电操作而言十分必要。 然而,受限于以下三大挑战,基于说明书的长程家电操作探索几乎处于空白状态: 为应对上述挑战, 北京大学联合智元机器人团队提出了全新的家用电器操作评测基准 CheckManual,这是首个专为研究基于说明书的家电操作而设计的评测框架 论文标题:CheckManual: A New Challenge and Benchm ...
伊方称伊朗武装部队总参谋长仍然存活
财联社· 2025-06-13 10:30
据CCTV国际时讯援引伊朗塔司尼姆通讯社报道,伊朗核科学家穆罕默德·马赫迪·塔赫兰奇、 法里顿·阿巴斯遭以色列袭击身亡。 央视新闻援引伊朗伊斯兰共和国通讯社13日报道称,伊朗武装部队总参谋长巴盖里仍然存 活,目前正身处指挥中心。当天早些时候,以色列12频道电视台报道称,伊朗武装部队总参 谋长穆罕默德·巴盖里遭到暗杀。但伊朗官方未证实。 多位伊朗核科学家遭以色列袭击身亡 以防长:以已到无法回头的地步 伊朗将付出沉重代价 据央视新闻报道,以色列国防军总参谋长扎米尔13日表示,以军之所以对伊朗的核计划和军 事设施发动打击,是因为"时机已到,我们已到无法回头的地步"。"我们不能再等别的时机行 动,我们别无选择。"扎米尔表示,我警告任何敢于挑战我们的人,他们都将付出沉重的代 价。 ...
o3-pro答高难题文字游戏引围观,OpenAI前员工讽刺苹果:这都不叫推理那什么叫推理
量子位· 2025-06-13 10:25
西风 发自 凹非寺 量子位 | 公众号 QbitAI 该测试引来 OpenAI前A GI Readine ss团队负责人Miles Brundage 的转发关注。 OpenAI"最新最强版"推理模型 o3-pro ,实际推理能力到底有多强? 全球 首位全职提 示工程师Riley Go odside 来给它上难度: 说出歌手Sabrina Carpenter的一首歌的歌名,回答这个问题时, 每个单词最后一个字母连起来看,也能对应这首歌名 。 结果,o3-pro在经过4分25秒的推理过后,成功给出正确答案。 经Sabrina Carpenter实测, o3只能做对个大概 ,通常只能把最后几个字母凑对。 虽然人已经不在OpenAI了,但Miles Brundage还是替老东家直接开大阴阳苹果:如果这都不叫推理那什么叫推理。 PS: 苹果前几天发了个新研究 ,用汉诺塔等四个小游戏测试大模型,称推理模型全都没在真正思考,只是另一种形式的"模式匹配",所谓思 考只是一种假象。 除了网友实测外,各大评测榜单已陆续同步更新排名。 总结来看,和官方给的测试结果略有不同。 官方测评中,o3-pro超越o3、o1-pro,成为当前 ...
让机器人学会系统2慢思考,叠衣服倒咖啡等不在话下 | 上海交大&智元机器人
量子位· 2025-06-13 10:25
Hume团队 投稿 量子位 | 公众号 QbitAI 机器人也能慢思考了! 上海交通大学携手智元机器人等团队推出了Hume—— 融合系统2(System-2)慢思考的双系统VLA模型 。通过动作价值 引导的动作采样与双系统级联动作去噪,实现深度推理与实时控制的完美结合。 在涵盖长时序规划、复杂柔性物体操作等多种任务场景的广泛实验中,Hume在多种机器人平台上均展露出了惊艳表现,显 著超越当前的最先进模型。 比如像 折叠短裤 、倒咖啡等操作,Hume加持下机器人也能得心应手。在各种复杂场景中达到了91%的平均成功率。 VLA模型缺失的慢思考能力 视觉-语言-动作(VLA)模型在构建通用机器人策略方面取得了显著进展,OpenVLA、π0、GR00T等最新研究已在不同任 务中展示了较强的适应能力。 然而当前的VLA模型大多依赖于直觉反应模式,即根据当前环境"本能地"预测动作,这使得它们在解决复杂、长时序的决策 任务时表现不佳。 与之相对的是,系统2慢思考已经通过测试时计算大幅提升了大语言模型(LLM)解决复杂逻辑推理问题的能力。但将这种 思考范式应用在需要与物理世界交互的机器人上仍是一个巨大挑战。 首先, 如何让V ...
超越英伟达B200!AMD最强AI芯:1.6倍大内存、大模型推理快30%,奥特曼都来站台
量子位· 2025-06-13 10:25
相比前代的MI300X,MI350系列的 算力提升了4倍,推理速度快了35倍 。 MI350系列也是叫板英伟达B200, 内存是B200的1.6倍,训练推理速度相当或更快 。 并且由于芯片功耗低于英伟达,在MI355X上 每花费1美元,可以比B200多跑40%的tokens 。 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI AMD大招逆袭,最强AI芯片号称大模型推理比英伟达B200快30%! CEO苏姿丰与OpenAI奥特曼共同登台发布。 这次AMD发布了 MI350X和MI355X 两款GPU,采用3nm工艺,包含1850亿晶体管,配备HBM3E内存。 同时,AMD还预告明年将会发 MI400 系列,并且奥特曼也来给苏妈站台,透露OpenAI参与了MI400系列的联合研发。 大模型运行更快,MI350系列叫板英伟达 MI350X和MI355X在核心设计上是相同的,二者的区别是针对不同的散热方式设计,前者采用风冷,后者则和B200一样采用了更先进的液 冷。 它们都基于 第四代Instinct架构 (CDNA 4),并配备 288GB的HBM3E内存和8TB每秒的内存带宽 ,这一容量是英伟达GB200 ...
8大领域仪器厂商注意:北京市设备更新贷款贴息实施方案发布
仪器信息网· 2025-06-13 10:12
特别提示 微信机制调整,点击顶部"仪器信息网" → 右上方"…" → 设为 ★ 星标,否则很可能无法看到我 们的推送。 近日,市发改委印发《关于开展重点领域设备购置与更新改造贷款贴息的实施方案》,进一步 加大对科技创新与研发等八大重点领域设备购置与更新改造贷款贴息的支持力度,预计获支持 的项目在贴息期内融资成本可下降超七成。 今年重点支持的领域包括:科技创新与研发、战略性新兴产业、未来产业、先进制造业和现代 服务业"两业"融合发展、新型基础设施、社会投资公共服务、文化旅游与消费场所改造升级、 农业等8个领域。这 八大领域覆盖基础研究、原创性引领性科技攻关,医药健康、集成电路、 汽车、人工智能等战略性新兴产业,生物制造、量子科技、具身智能、商业航天、智能机器人 等未来产业,数据中心、云计算、智慧交通基础设施等新基建 。 根据政策,本市将发挥政府投资引导带动作用,积极为社会投资项目降低融资成本,对符合条 件的项目给予最高不超过2.5个百分点的贴息,贷款实际利率低于2.5%的按照贴息率不超过贷 款实际利率安排。贴息期限2年。 "按商业银行中长期贷款利率、即5年期以上LPR为3.5%左右测算,预计获支持的项目在贴息 ...
早盘直击 | 今日行情关注
行情分析:大盘仍然在犹豫中缓慢前行,指数震荡幅度比较有限。本周中美进行新一轮贸易谈判, 市场对于贸易冲突的担忧情绪进一步缓解,市场在震荡中维持缓慢盘升的格局,均线慢慢开始发散,截 止周四收盘,沪指依然站在 5 日均线之上。6 月上中旬谈判和关税事件窗口已经慢慢过去,即将迎来 6 月中下旬的政策窗口期,预计市场仍将维持当前缓慢震荡上行的格局。 后市展望:6 月上中旬关税事件的反复摇摆窗口即将过去,6 月中下旬的政策窗口期即将打开。6 月上中旬市场仍在围绕关税事件进行预期博弈,包括 1)美国国际贸易法院的裁定和特朗普当局的上 诉,以及上诉期间所谓的"对等关税"是否要暂停;2)中美元首通话,新一轮贸易谈判结果落地等。即 将进入6 月中下旬,市场将开始展望增量政策,主要因为国家发改委曾在 5 月下旬表示:加快推出稳就 业稳经济推动高质量发展的若干举措,目前各有关部门正在抓紧落实,大部分政策举措将按计划在 6 月 底前落地。若增量政策及时有效推出落地,则 6 月下旬将有可能成为市场打破盘整格局的时间窗口。短 期来看由于银行、创新药等热门板块略显拥挤,已经积累了不小的涨幅,预计有可能出现短期震荡,而 TMT 和科技成长方 ...
申万宏源“研选”说——“ETF专区”,让您的ETF实战快人一步
申万宏源「研选」说 让您的ETF买战快人 风来了,怎么选择相应的投资风口? 【申财有道APP】-【ETF专区】看一看。 「ETF专区」 在哪里? 小手点一点,打开我们申万宏源【申财有道 APP】首页【更多】->【ETF专区】等着您。 He B 视频 热点 头景复模 【早报】中方回应美多次主动传递信息 e 最高增长273%!新能源汽车,数据爆表! = 美股收盘:三大指数集体收跌 伯克希尔大. FTF专区 LL (FF 业务办理 我是股神, 三秒钟, 我要我的ETF出现在我面前! 【ETF专区】->【股票选基】看一看,输入您 要的股票, 我们的ETF专区支持添加多个股票 哦。输入股票完毕后,直接点击【去选基】 搜索 < C ETF专区 入您要的股票 (+) 盘中热点 机多个股票 专培透加多个品里 去选基(1) ()童管 三秒钟都不用等,持有以上股票作为成分股的 ETF就显示出来了。 【ETF专区】->【TO交易】看一看,跨境、商 品、债券、货币,总有一款适合您。 √ T+0交易 跨境类 商品类 债券类 货币类 美股市场 | 其它市场 港股市场 最新价 基金名称 涨跌幅 ⇒ 1.1040 +3.27% 1.2810 ...
2025迎“牛友”!你值得长期信赖的一流投资银行与投资机构
II II II 你值得长期信赖的一流投资银行与投资机构 2025年1月1日至12月31日 约定年化收益率 先到先得 额度有限 · 参与方式 · 活动期间,下载并登录申万宏源申财有道APP 的"牛友",可领取以下权益: 牛友专享 "新"享专属理财 创造价值 投资之路千万里 理财收获第一金 质押式报价回购 新客理财权益 牛友专享 "新"享投顾服务 专业护航 股海搏击专业助力 享投顾服务体验权 投顾服务 价值398元/月的标准化投顾服务 3个月体验权 价值1194元体验权 注:满足适当性要求的客户可领取投顾服务体验权 牛友专享 "新"享特色指标 辅助决策 业内专家自主研发 增值指标诚邀体验 三大特色指标 狙击电波 | 财富阶梯 | 神奇九转 体验权各1个月 价值336元体验权 牛友专享 "新"享深度行情 体验Level-2 实战必备 唯快不破 送Level-2深度行情 Level-2 沪深A股Level-2 | 港股行情Level-2 3个月体验权 研究所专家解盘 | 每日市场综述 | 月度 大势 | 大类资产配置 | ETF专栏 | 北交 所来了 | 理财宝典 | 投资学堂 | ... "新"BUFF Leve ...