Workflow
AI科技大本营
icon
搜索文档
OpenAI研究负责人诺姆·布朗:基准测试比数字大小毫无意义,未来靠token成本衡量模型智能|GTC 2025
AI科技大本营· 2025-03-24 16:39
责编 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 今年英伟达大会(GTC 2025)邀请到了 OpenAI 的人工智能推理研究负责人、OpenAI o1 作者 诺姆·布朗(Noam Brown) 参与圆桌对话。 他先是带着大家回顾了自己早期发明"德扑 AI"的工作,当时很多实验室都在研究玩游戏的 AI,但大家都觉得摩尔定律或者扩展法则(Scaling Law)这 些算力条件才是突破关键。诺姆则在最后才顿悟发现,范式的更改才是真正的答案:" 如果人们当时就找到了正确的方法和算法,那多人扑克 AI 会提前 20 年实现 。 " 究其根本原因,其实还是很多研究方向曾经被忽视了。" 在项目开始前,没有人意识到 推理计算会带来这么大的差异。 " 毕竟,试错的代价是非常惨痛的,诺姆·布朗用一句很富有哲思的话总结了直到现在都适用的一大问题:" 探索全新的研究范式,通常不需要大量的计算 资源。但是,要大规模地验证这些新范式,肯定需要大量的计算投入。 " 左为英伟达专家布莱恩·卡坦扎罗,中为诺姆·布朗,右为主持人瓦尔蒂卡 在和英伟达专家的对话过程中,诺姆还对自己加入 OpenAI 之前、成为" 德扑 AI ...
小红书技术专家解密语音识别与推荐算法,干货满满|ML Summit 2025
AI科技大本营· 2025-03-24 16:39
4 月 18-19 日,由 CSDN&Boolan 联合举办的 2025 全球机器学习技术大会(ML-Summit 2025)将在上海虹桥西郊庄园丽笙大酒店隆重举行。大会 汇聚了超过 50 位来自学术界和工业界顶尖专家,共同探讨智能体、联邦学习、多模态大模型等热门 AI 技术实践。本次大会的一大亮点是小红书社区 技术部将派出两位技术负责人,分享他们在语音识别与推荐算法领域的最新研究成果与实践经验。 解奉龙毕业于哈尔滨工业大学-微软亚洲研究院联合培养博士毕业,是 2015 年"微软学者"称号获得者,并在 2023 国际语音合成大赛 Blizzard Challenge 中荣获单项冠军。目前,他在小红书负责语音识别与合成、语音交互、音乐技术在小红书全场景下的研发及落地,并主导打造了基于大模 型的语音/音乐技术前沿综合解决方案 FireRed。 小红书音频技术负责人解奉龙:FireRed-基于大模型的语音/音乐技术综合实践 在本次大会上,解奉龙博士将带来《FireRed-基于大模型的语音/音乐技术综合实践》的精彩演讲。他将分享小红书技术团队研发的一系列基于大模型 的语音/音乐技术详情及应用落地,包括: FireRe ...
杨立昆“砸场”英伟达:不太认同黄仁勋,目前大模型的推理方式根本是错的,token 不是表示物理世界的正确方式|GTC 2025
AI科技大本营· 2025-03-21 14:35
责编 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 黄教主的演讲 感觉才没过几天,今年的 GTC 英伟达大会也即将迎来尾声了。 而今年比尔·达利则是对话"AI 教父" 杨立昆 (Yann LeCun),很有前后呼应的感觉。 但 GTC 并不只有黄仁勋和杨立昆,还有许多精彩的演讲与对话,比方说: ………… 接下来的一段时间, CSDN AI 科技大本营 将会在「 GTC 2025 大师谈 」栏目持续更新这些精华内容的全文整理,尽情期待。 比尔·达利 自己就在采访杨立昆之后进行了一场 演讲 ,系统性地讲解了英伟达 2024 一整年的四大项目进展,内容干货很多; OpenAI o1 作者 诺姆·布朗 (Noam Brown)和英伟达的 AI 科学家来了一场 对话 ,他认为现在 AI 圈最需要来一场革命的,就是这些五花八 门的 基准测试 (Benchmark),而且改这个东西还不需要花太多算力资源; 2018 年诺贝尔化学奖得主 弗朗西斯·阿诺德 (Frances Arnold)围绕 AI for Sciense 还有蛋白质工程进行了一场相当硬核的 圆桌对话 ; UC 伯克利教授 彼得·阿比尔 (P ...
阶跃星辰 Tech Fellow 段楠:Step-Video 系列模型的关键技术解读
AI科技大本营· 2025-03-21 14:35
4 月 18-19 日,由 CSDN&Boolan 联合举办的「2025 全球机器学习技术大会」将在上海虹桥西郊庄园丽笙大酒店隆重举行,本次大会共设 12 大技术 专题,云集院士、IEEE Fellow、顶尖学者、一线科技企业技术实战专家组成的超 50 位重磅嘉宾。他们将以独特的视角,解读智能体、联邦学习、多 模态大模型、强化学习等前沿议题。 在 4 月 18 日下午,走在多模态研究前沿的阶跃星辰 Tech Fellow,多模态基础模型领域专家段楠博士将在「多模态大模型前沿」专场带来《视频生成 基础模型进展、挑战和未来》的主题分享,分享其在视频生成基础模型方面的最新研究成果和前瞻性思考。 段楠博士拥有深厚的学术背景和丰富的产业经验。他长期深耕自然语言处理、代码智能、多模态基础模型和智能体等领域,是中国科学技术大学和西安 交通大学兼职博导,天津大学兼职教授。在加入阶跃星辰之前,段楠博士曾在微软亚洲研究院担任资深首席研究员及自然语言计算团队研究经理长达十 二年,对自然语言处理和多模态技术的发展做出了卓越贡献。 在 2025 全球机器学习技术大会上,段楠博士将围绕阶跃星辰开源的 Step-Video 系列模型,深入 ...
3小时复刻传奇,OpenManus一作梁新兵:通用Agent的构建与赋能
AI科技大本营· 2025-03-20 17:07
4 月 18-19 日,由 CSDN&Boolan 联合举办的 2025 全球机器学习技术大会(ML-Summit 2025)将在上海虹桥西郊庄园丽笙大酒店隆重举行。大会 云集院士、顶尖学者、IEEE Fellow、一线科技企业技术实战专家组成的超 50 位重磅嘉宾。他们将以独特的视角,解读智能体、联邦学习、多模态大 模型、强化学习等覆盖 AI 当下热门的技术实践专题。 在大会首日下午的「AI 智能体」专题论坛上,来自 DeepWisdom 算法研究 员、OpenManus 项目一作,MetaGPT 开源核心贡献者梁新兵将带来 《通用 Agent 的构建与赋能:OpenManus 的实践与探索》分享。 梁新兵是 DeepWisdom 算法研究员,华东师范大学硕士。他不仅是 OpenManus 项目一作,同时也是论文 Data Interpreter /Self-Supervised Prompt Optimization 作者之一。如今,他正以其在智能体领域的丰富经验和 对开源的满腔热情,不断探索通用 Agent 的构建与赋能。 3 小时复刻传奇:OpenManus 背后的极速行动 作为 MetaGPT 开源 ...
黄仁勋年度演讲来了,Scaling Law失效只是假象,推理需求暴涨100倍,AI模型优化迎来新挑战|GTC 2025
AI科技大本营· 2025-03-19 09:49
作者 | 王启隆 出品 | CSDN(ID:CSDNnews) 北京时间 3 月 19 日凌晨,NVIDIA GTC 2025 的主会开场演讲来了! 在黄仁勋的这场演讲前,英伟达股票还是 119.53 美元 。刷推的时候又发现,马斯克的 Grok AI 都 在和网友们吐槽英伟达今年开年不济,相当艰难,需要一场演讲拯救股市,振奋投资者。还有些直 播,直接开了个股市页面实时盯着 NVDA 涨涨停停,画面相当喜感。 两小时的演讲结束后,股价居然还跌了将近 3%…… 今年的演讲主题是「 AI 工厂 」。 英伟达创始人兼 CEO 黄仁勋身穿标志性的皮衣,潇洒上台。 下面先简单总结演讲的内容有哪些(正好黄仁勋自己在最后强调了一遍本次主会的 五大亮点 ),后 文我们再来个 "事无巨细"的 全面回顾 ,带大家云体验一遍全程。 Blackwell 全面投入生产 第一代 Blackwell 芯片还没热乎,英伟达就推出了下一代 Blackwell Ultra,旨在 提升训练和扩展 推理能力。主会上展示了两个版本: 顺带一提,看外媒的现场返图,英伟达这次在 GTC 大会会馆前 摆了个摊卖煎饼 ,黄仁勋 亲自上阵 边吃边卖, 里面穿着 ...
基辛格遗世之作:AI 吞噬世界下的人类
AI科技大本营· 2025-03-19 09:49
【导读】 《人工智能时代与人类价值》是基辛格生前的最后一本著作。另外两位作者分别是谷歌前 CEO 埃里克·施密特,以及微软前首席研究和战略官克 雷格·蒙迪。三位作者以前所未有的深度和广度,审视了人工智能领域的最新进展,直面人工智能带来的关乎人类生存的最为紧迫的问题:人类与机器的区 别到底是什么?如果被迫与机器妥协,我们的底线是什么? 在技术迅猛发展的今天,我们如何定位人类的价值所在?阅读本文也许你会有所收获。 投稿 | 中信出版集团 责编 | Echo Tang 出品丨AI 科技大本营(ID:rgznai100) 康德曾提出一种尊严概念,其核心是人类主体作为能够进行道德推理的自主行为者的固有价值,且这种主体不应被作为达到目的的手段。人工智能能否 满足这些要求?我们相信,尊严的定义将帮助人类回答其中的一些问题,并鼓励与人工智能实现包容性共存,同时避免过早与人工智能共同进化的武断 尝试。 为了保持对自身的理解,也为了确保在机器学习的过程中能够将适当的人类概念传递给机器,我们人类需要重新致力于此类界定工作,且不能局限于学 术范畴。发挥能动性、好奇心和自由,重新激发和锻炼我们对其他人、对自然世界、对宇宙、对神性可能的 ...
诺奖采访深度学习教父辛顿:最快五年内 AI 有 50% 概率超越人类,任何说“一切都会好起来”的人都是疯子
AI科技大本营· 2025-03-18 11:29
作者 | 诺贝尔奖官方 采访中,辛顿表达了对人工智能未来发展的担忧。他认为, 人工智能可能在短短五年内超越人类智慧 ,并就此可能引发的社会风险,例如大规模失业 和虚假信息等问题,提出了警告。更令人深思的是,辛顿暗示,人工智能的潜在风险可能远超我们目前的认知。 编译 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 杰弗里·辛顿(Geoffrey Hinton),这位被誉为"人工智能教父"的科学家,于去年获得了诺贝尔物理学奖,引起了全网一阵讨论。 最近辛顿接受了诺贝尔奖官方的专访,他回忆起接到诺奖电话时的趣事时,第一反应竟然是疑惑,因为自己研究的并非物理学(这点和全网的疑惑倒是 一样)。 作为深度学习领域的先驱,辛顿最广为人知的成就是神经网络。但很多人其实不知道, 他曾说过自己这辈子"最自豪"也是"最失败"的成就,其实是与 特里·塞诺夫斯基(Terry Sejnowski)共同提出了玻尔兹曼机理论。 详见: 《 深度学习之父 Hinton 万字访谈录:中美 AI 竞赛没有退路可言 》 他们的工作,以及另一位诺奖物理学奖得主约翰·霍普菲尔德(John Hopfield)等神经网络先驱的早期研究,共同 ...
全栈自研,理想发布下一代自动驾驶架构 MindVLA
AI科技大本营· 2025-03-18 11:29
核心观点 - 理想汽车发布下一代自动驾驶架构MindVLA,融合视觉、语言和行为智能,赋予车辆3D空间理解、逻辑推理和行为生成能力,实现从运输工具到智能司机的转变[1][13][15] - MindVLA采用3D高斯表示、MoE混合专家架构LLM基座模型、Diffusion轨迹优化等关键技术,平衡模型参数规模与实时推理性能[1][4][7] - 该架构基于全栈自研,深度融合空间、语言及行为智能,通过端到端+VLM双系统架构实现感知、思考和适应环境的能力[1][3] 技术架构 - 采用3D高斯作为中间表征,提升多粒度、多尺度3D几何表达能力,利用海量数据自监督训练提升下游任务性能[4] - 自研MoE混合专家架构LLM基座模型,引入稀疏注意力实现模型稀疏化,加入3D数据训练使模型具备空间理解和推理能力[7] - 通过Diffusion将Action Token解码为优化轨迹,采用常微分方程采样器实现2-3步完成高质量轨迹生成,结合RLHF微调提升安全下限[7] 功能特性 - 实现"听得懂":支持语音指令改变路线和行为,如自主寻找超市或调整行驶速度[13] - 实现"看得见":具备通识能力识别商业招牌,通过环境照片定位用户位置[15] - 实现"找得到":自主漫游寻找车位,不依赖地图信息完成复杂空间推理[15] 性能突破 - 3D GS训练速度提升至7倍以上,显著优化场景重建与生成效率[10] - 采用并行解码技术和投机推理,充分发挥NVIDIA Drive AGX性能,实现实时推理[7] - 通过世界模型构建仿真环境,完成大规模闭环强化学习,实现"从错误中学习"[10] 行业影响 - 重新定义自动驾驶,如同iPhone 4重新定义手机,将汽车转变为能与用户沟通的智能体[15] - 探索物理世界与数字世界结合范式,未来有望赋能多个行业发展[1][15] - 展示跨场景适应性,不仅在驾驶场景优异,在室内环境也表现出延展性[12]