Workflow
RL
icon
搜索文档
Stellantis' 1.2M Ram Trucks Under Scrutiny for BTSI Failures
ZACKS· 2025-07-09 00:45
Key Takeaways STLA is under NHTSA investigation over BTSI failures in 1.2M Ram trucks from model years 2013-2018. Reports of deaths, injuries, and rollaways prompted the recall query into prior BTSI system fixes. STLA's vehicle output in Italy fell 26.9% in H1 2025, with no production rebound expected this year.Stellantis N.V. (STLA) is under investigation by the U.S. National Highway Traffic Safety Administration (NHTSA), which has initiated a recall query involving nearly 1.2 million of the company’s Ra ...
李飞飞:高校学生应追逐AI“北极星”问题
虎嗅· 2025-07-08 16:15
从开洗衣店谋生、到因学术成就被誉为"AI 教母",再到如今成为一家企业的 CEO,李飞飞一直处在"从 零到一"的历程,并享受其中。用她自己的话来说: "我喜欢从零开始的感觉,就像站在原点一样。忘记你过去所做的一切,忘记别人对你的看法。只是埋 头苦干,努力构建。那是我的舒适区,我就是喜欢那样。" 日前,李飞飞在 Y Combinator 的 AI Startup School 活动上,回顾了 ImageNet 项目的诞生历程、她早期 对数据驱动方法的信念,以及卷积神经网络(CNN)等突破如何催生图像描述、故事生成,最终发展 出生成式模型。她还解释了为何 3D 世界建模对通用人工智能(AGI)至关重要,在她看来,"没有空间 智能,AGI 就是不完整的。" 另外在现场,李飞飞还给了身处 AI 时代的硕士、博士研究生一些建议: 学术头条在不改变原文大意的情况下,做了简单的编译。内容如下: 一、我的梦想是让机器"看见" Diana Hu:我们非常高兴能够邀请到李飞飞博士,她在 AI 领域具有很长的职业生涯,被誉为"AI 教 母"。飞飞,2009 年,也就是 16 年前,你最初创建的项目之一是 ImageNet,引用量已 ...
2025秋招开始了,这一段时间有些迷茫。。。
自动驾驶之心· 2025-07-08 15:53
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 2025年的秋招已经开始了,不少双非的同学都很迷茫。。。 目前在实验室做的工作有些落伍,现在无论是自动驾驶还是具身智能公司都需要实力比较强、背景比较好的同 学。 以下是 知识星球 内部一位双非同学的提问,非常具有代表性: 各位大佬们好,我目前是一个双非的研究生,研究方向是多传感器融合定位的,然后学过python、深度学 习、ros等等,但都学的不是很精,现在想多学一点为以后找工作用,感觉算法岗我的学历可能不太行,请 问各位大佬们我应该往哪个方向学比较好呢?学些什么知识呢? 星主回答:你的技术栈都比较偏机器人一些,SLAM和ROS这块都可以尝试一下和机器人/具身智能打交道。这 块需求也比较大,可以做一些优化、集成类工作~ 另一方面,我们了解到大一些的公司各家的hc都不是很多,要求基本上都是端到端、大模型、VLA、强化学 习、3DGS这些比较前沿的方向。如果你做的是这块,是有机会的,很多tire 1的公司或者主机厂也正在follow前 沿的技术,大概是从无图往端到端转,差不多技术栈推迟1-2代。像LV融合、无图、 ...
AI版三个臭皮匠!ChatGPT/Gemini/DeepSeek合体拿下AGI测试最高分
量子位· 2025-07-08 15:30
文章核心观点 - Sakana AI提出的AB-MCTS算法通过多AI模型协作解决问题,其核心思想是“不同思想的协作能产生最伟大的成就”[1][38] - AB-MCTS在ARC-AGI-2基准测试中表现优于单一模型,多模型组合解决30%谜题,而顶尖独立模型仅解决23%[35][36] - 算法已开源为TreeQuest,结合深度搜索与广度搜索策略,动态平衡探索与利用[6][9][12] AB-MCTS算法原理 - **基础机制**:允许节点重复扩展并引入GEN节点,突破传统MCTS的固定分支限制[10][11] - **搜索策略**:通过贝叶斯后验预测和Thompson采样自适应选择“拓展宽度”或“深入挖掘”[12][27] - **技术变体**: - AB-MCTS-M采用分层贝叶斯推断共享子树信息[17] - AB-MCTS-A通过共轭先验简化计算,显式分离生成与优化动作[17] 基准测试表现 - **综合性能**:在LiveCodeBench、CodeContest、ARC-AGI等测试中平均排名最高,优于重复采样、序列优化等基线方法[15][16] - **任务适应性**: - LiveCodeBench:小预算时即超越基线[19] - CodeContest:预算≥32时表现更优[19] - ARC-AGI:与重复采样性能相当,动态扩展搜索范围[20] - **扩展性**:预算增至512时,AB-MCTS性能持续提升,而重复采样趋于平稳[29] 自然启发的研究路径 - **理论基础**:受生物进化与集体智能启发,从“混合创造”转向“混合使用”现有AI[38][39] - **延伸成果**:与哥伦比亚大学合作开发达尔文-哥德尔机(DGM),通过开放式搜索实现AI自我进化[41]
VolitionRX (VNRX) Earnings Call Presentation
2025-07-07 19:45
业绩总结 - 2024年首次实现超过100万美元的收入[19] - 2025年第一季度录得约25万美元的收入,同比增长44%[87] - 2024年售出约120,000个Nu.Q®兽医癌症测试及测试组件,较2023年增长100%[39] 用户数据与市场机会 - 肺癌筛查、预后和最小残留病(MRD)市场机会约为40亿美元,MCED液体活检市场约为200亿美元[21] - 脓毒症检测和监测ICU患者的市场机会超过10亿美元[21] - 预计2025年Nu.Q® Discover的收入增长目标为100%[52] 未来展望与财务状况 - 预计2025年将获得额外500万美元的里程碑付款(针对猫科动物)[20] - 2025年针对人类脓毒症和癌症领域的许可交易目标[10] - 截至2025年3月31日,现金及现金等价物总额约为260万美元,较2024年12月31日的330万美元下降[87] - 2025年第一季度每月平均运营活动净现金使用为140万美元,较2024年第一季度下降近50%[87] - 目标是在2025年实现年度现金中性,即收入(包括许可收入)与支出在现金基础上相匹配[87] 研发与专利 - 迄今为止已获得2300万美元的预付款和里程碑付款[20] - 71项专利已获批准,130项专利正在国际申请中,专利保护至2044年[21] - CircanBis研究显示,结合ctDNA的H3K27Me3水平可提高整体生存率的预后价值[61] - NTU Lung研究表明,改进LDCT的特异性,避免高达50%的不必要活检[61] - NucleoCircan研究发现,ctDNA单独检测的MRD患者中,额外识别出23%的患者[61] - 预计2025年第二季度提交OncoProLung研究结果,识别可能受益于免疫治疗的患者亚组[61] 融资与资本运作 - 2025年第一季度的资金收入为430万美元,其中约180万美元来自非稀释性融资,其余来自资本市场[87] - 在季度结束后,完成了一项可转换贷款票据,提供625万美元的总收益,24个月内以现金或股票偿还,初期有6个月的偿还宽限期[87]
大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱
量子位· 2025-07-07 14:13
henry 发自 凹非寺 量子位 | 公众号 QbitAI 学好数理化,走遍天下都不怕! 这一点这在大语言模型身上也不例外。 大家普遍认同:具备更强数学能力的模型往往也更智能。 但,常识就是用来打破的。 最近,来自CMU的团队发现,一些数学好的模型并没有将它们的"天赋"带到其他更加通用的领域。 研究发现, 只有用强化学习(RL)训练的模型才能将数学推理技能广泛迁移到其他任务上。而用监督微调(SFT)训练的模型则表现出有限 的迁移甚至没有迁移。 网友直呼:又一个 苦涩的教训(bitter lesson) 。 这数学题,不做也罢? 很明显,人们训练大模型并不只是让它来做数学题的。 研究者之所以热衷于提高模型的数学表现,是因为希望它能够把数学那里学到的严密逻辑应用到其他更广泛的领域。 但在此之前,我们有必要知道,对于一个大模型,专门优化数学推理(math reasoning),它在其他任务(推理任务、非推理任务)上会变 得更好,还是更差? 换句话说: 做数学推理训练,会不会帮助或者损害模型在其他领域的能力? 为了解决这一疑问,研究评估了20多个模型在数学推理、其他推理任务(包含医学推理、医学推理、智能体规划)和非推 ...
图像目标导航的核心究竟是什么?
具身智能之心· 2025-07-04 20:07
研究背景与核心问题 - 图像目标导航需要两种关键能力:核心导航技能(如检测自由空间、障碍物)和通过比较视觉观察与目标图像计算方向信息 [2] - 当前主流方法依赖专门的图像匹配或预训练计算机视觉模块进行相对位姿估计 [2] - 研究聚焦于是否可以通过强化学习对完整智能体进行端到端训练来解决该任务 [2] 核心研究内容与方法 - 探讨了多种架构设计对任务性能的影响,核心在于如何支持图像间的隐式对应计算 [3] - 主要架构包括Late Fusion、ChannelCat、SpaceToDepth + ChannelCat、Cross-attention [4] - 实验设计使用Habitat模拟器和Gibson数据集,动作空间包括前进、左右转向和停止 [7] - 评估指标包括成功率(SR)和SPL(成功路径长度与最优路径长度的比值) [7] 主要发现 - 早期patch级融合(如ChannelCat、Cross-attention)比晚期融合(Late Fusion)更关键,能更好支持隐式对应计算 [8] - ChannelCat(ResNet9)在Sliding=True时SR达83.6%,远高于Late Fusion的13.8% [6] - Cross-attention(DEBiT-b)在Sliding=True时SR达90.5% [6] - 低容量架构(如ResNet9)在Sliding=False时SR从83.6%降至31.7%,而DEBiT受影响较小(从90.5%降至81.7%) [8][9] - 能力迁移性:将Sliding=True训练的感知模块权重迁移到Sliding=False并微调后,SR从31.7%提升至38.5% [10][11] 导航与相对位姿估计的关联 - 导航性能与相对位姿估计性能存在相关性,DEBiT在两者上均表现最优 [12] - 导航成功率(SR)与相对位姿估计精度(误差<2m, 20°)呈正相关 [12] 结论 - 支持早期局部融合(如交叉注意力、ChannelCat)的结构对任务成功至关重要 [15] - 模拟器的Sliding设置显著影响性能,但通过迁移感知模块权重可部分迁移至真实环境 [15] - 导航性能与相对位姿估计能力相关,验证了方向信息提取的核心作用 [15] - 简单低容量架构仅通过RL训练难以成功解决图像目标导航,预训练仍不可或缺 [15]
李飞飞最新对话
投资界· 2025-07-04 20:05
李飞飞对AGI与空间智能的核心观点 - 空间智能是实现通用人工智能(AGI)不可或缺的组成部分 没有空间智能 AGI就不完整 [1][4][29][33] - 3D世界建模是人工智能领域最基础且最具挑战性的问题之一 包括理解三维世界 生成三维世界 推理三维世界和在三维世界中行动 [7][8][33] - 创建超越平面像素 跨越语言障碍 真正捕捉三维世界结构和空间智能的世界模型是当前AI研究的终极目标之一 [9][33] ImageNet项目的历史意义 - ImageNet项目始于2007年 旨在通过互联网下载十亿张图片并创建视觉分类体系 为机器学习提供数据基础 [17][18] - 该项目包含14,197,122张图片和21,841个synsets索引 为计算机视觉研究建立了标准化数据集 [20] - 2012年AlexNet在ImageNet挑战赛中取得突破性进展 识别错误率从30%大幅下降 标志着数据 GPU和神经网络首次成功结合 [22][23][24] 计算机视觉的发展历程 - 从物体识别(如ImageNet解决的"识别猫或椅子")发展到场景描述 再扩展到三维世界理解 是计算机视觉研究的自然演进 [25][26][30] - 2015年左右 图像字幕生成技术取得重大突破 为后来的生成式AI发展奠定了基础 [27] - 视觉智能的进化历史长达5.4亿年 远比语言进化(3-5亿年)更复杂 这解释了为什么空间智能研究更具挑战性 [32][33] 空间智能研究的挑战 - 空间智能面临数据严重缺失的问题 与语言数据不同 三维世界的信息主要存在于人类大脑中 难以直接获取 [36] - 3D建模的数学复杂度远高于一维语言处理 需要将2D投影反向推导为3D结构 并遵守物理规律 [34][35] - 人类视觉皮层处理数据的神经元数量远超语言处理区域 这暗示了空间智能模型的架构可能需要与LLMs完全不同 [37][38] World Labs的研究方向 - 公司专注于解决空间智能这一AI领域最困难的问题 正在构建能够输出3D世界的基础模型 [31][40][41] - 研究团队由多位顶尖专家组成 包括Pulsar创造者 Justin Johnson和Nerf作者等 [34] - 应用场景涵盖设计 建筑 游戏开发 机器人学习以及元宇宙内容生成等多个领域 [41][42][44] 行业研究方法论 - 数据驱动方法需要与高质量数据并重 避免"输入垃圾输出垃圾"的问题 [73] - 鼓励跨学科研究 特别是在科学发现领域与AI的结合 [60] - 小数据研究和理论突破是学术界在资源受限情况下的重要方向 [61][62]
Aalborg joins Copenhagen and Aarhus in adopting cBrain’s F2 Paperless Government Platform
Globenewswire· 2025-07-04 17:47
文章核心观点 cBrain与奥尔堡市签署协议,为其城乡事务部提供F2无纸化政府平台,这标志着公司业务重要发展,支持其全球增长战略 [1][5][6] 合作协议 - cBrain与奥尔堡市签署协议,将F2数字平台交付给该市城乡事务部 [1][2] - 实施预计在6 - 8周内完成,计划于2025年9/10月投入使用,涉及150名用户 [2] 平台情况 - 采购前,cBrain F2平台经过全面筛选,确保符合奥尔堡的IT架构原则 [3] - cBrain F2平台支持决策、沟通、案件管理等功能,哥本哈根部署规模最大,超3000名用户 [4] 业务发展与战略意义 - 该协议标志着cBrain重要业务发展,F2平台越来越受国家部委、大型复杂地方政府组织的青睐 [5] - 丹麦三大城市采用该平台,为cBrain提供国际参考,支持其全球增长战略和国际领先目标 [6]
可探索“内外结合”发展人民币稳定币丨杨涛专栏
21世纪经济报道· 2025-07-04 06:56
区块链与数字货币发展 - 央行行长指出区块链和分布式账本技术推动央行数字货币和稳定币发展,同时带来金融监管挑战 [1] - 香港《稳定币条例》将于8月1日生效,引发稳定币讨论热潮 [1] 离岸人民币业务格局 - 境外离岸人民币业务以香港为中心,新加坡、伦敦等多点发展 [1] - 境内离岸人民币业务具有"在岸"与"离岸"双重特征,以账户管理为核心运行机制 [1] 人民币稳定币发展建议 - 建议采取境内离岸与境外离岸人民币稳定币联动发展模式 [2] - 美元抵押型稳定币快速发展,需从金融安全与货币主权视角主动研究监管应对 [2] - 香港人民币离岸市场规模有限,可能难以独立支撑人民币稳定币规模经济效应 [2] - 稳定币监管涉及身份认证、反洗钱等挑战,需中央部门主导并寻求香港配合 [2] 上海自贸区与香港联动 - 上海自贸区已建立与国际经贸规则衔接的制度体系,可考虑与香港同步推动人民币稳定币创新 [3] - 央行支持上海国际金融中心建设,宣布在临港新片区开展离岸贸易金融服务综合改革试点等八项措施 [3] 境内离岸人民币稳定币模式 - 模式一:由清算组织、大型商业银行、支付机构等共同发起成立人民币稳定币发行机构,构建批发与零售市场 [3] - 模式二:依托数字人民币运营机构分支机构直接铸造运营人民币稳定币,需厘清具体路径与重点 [4] 人民币稳定币运营要求 - 需设置充足资产储备,包括人民币现金、短期国债及一定比例数字人民币 [5] - 发行主体需建立完善的风险识别、资产隔离与托管等合规运营机制 [5] - 借鉴上海自贸区FT账户"电子围网"特点,限制持有和使用主体为合格机构或个人 [5] 境外离岸人民币稳定币模式 - 模式一:境内外机构在香港共同发起人民币稳定币发行机构 [6] - 模式二:境内授权银行或支付机构依托香港法人机构发行境外离岸人民币稳定币 [6] - 形成CNYC与CNHC双重体系,探索交换与互通机制 [6] 人民币稳定币应用场景 - CNYC主要用于提升跨境贸易与商务活动支付结算效率 [7] - CNHC旨在强化香港人民币国际化地位,支持链上金融活动和大宗商品交易结算 [7] - 探索支持基于人民币资产的RWA,提升人民币及人民币资产全球影响力 [7] 监管与技术合作 - 境内外监管部门与发行机构需合作推动智能化技术创新,监测二级市场活动 [7] - 需防范非法资金流动与非法活动,严控风险并推动法律法规制定 [7] - 借鉴BIS"金融互联网"概念,推动数字人民币、银行代币化存款与稳定币协同发展 [7]