Workflow
脑电大模型
icon
搜索文档
用人类脑电波教 AI 开车,这位清华 90 后学者直言隐式信号里藏着 AGI 的关键 | 万有引力
AI科技大本营· 2026-01-26 18:03
文章核心观点 - 清华大学智能产业研究院(AIR)团队开发了一项名为E³AD的创新技术,首次尝试利用人类驾驶员的脑电波(EEG)信号来增强端到端自动驾驶模型的规划能力,旨在将人类“老司机”基于经验的、潜意识的风险预判“直觉”赋予人工智能,以解决自动驾驶在罕见但关键的复杂场景中缺乏预判能力的痛点 [3][4][36][38] 研究背景与动机 - 当前自动驾驶系统虽能识别多种物体和规则,但缺乏人类驾驶员基于经验形成的、能预判潜在风险的“驾驶直觉”或“车感”,在遇到未见过或视线受阻的复杂情况时容易不知所措 [2][3] - 人类驾驶员事故率低的关键在于“提前预判”和风险规避,而非事后补救,但这类隐性的认知过程难以用语言描述和标注 [35][38] - 研究团队旨在通过采集人类在风险发生前的隐式认知信号(如脑电波),将其作为监督信息,教会自动驾驶模型识别风险苗头并提前调整策略 [35][38] 技术方案:E³AD - **核心方法**:同步采集驾驶员在模拟复杂路况下的脑电信号,发现其在驾驶员尚未意识到或无法言说时,已能更早地“暴露”大脑对潜在风险的预警,团队将此隐式预警信号转化为对自动驾驶规划有用的监督信息 [38] - **技术选择**:采用**非侵入式脑电**技术进行信号采集 [41] - **系统架构**:选择**端到端自动驾驶(E2E-AD)范式**进行融合,而非传统模块化方案,原因在于端到端能更充分利用原始信息,减少因信息压缩和传递导致的误差放大,且更符合大脑执行任务时全脑协同、感知与决策高度整合的工作方式 [43] - **融合策略**:实验表明,将人类认知信号与自动驾驶系统在**任务层(即最终的规划与决策层)进行对齐和融合,效果最好**,收益最稳定,这为未来模型设计提供了启示 [44][45] - **底层模型支持**:研究引入了上海交通大学的**Large Brain Model(大脑大模型,LaBraM)**,该模型有助于处理脑电信号信噪比低、个体差异大的难点,提升从脑信号中提炼共性规律的能力,从而增强模型的泛化性能 [53][54][61] 成果与价值 - **解决痛点**:该方法为解决传统自动驾驶模型在训练数据中极端事件样本少、难以学习可靠安全行为的难题提供了新思路 [35][36] - **泛化能力**:在训练阶段利用脑信号教会模型识别风险线索后,在推理阶段仅使用视觉等常规输入,模型仍能保持“类脑认知”的风险预判能力,实现了能力的迁移 [54] - **开源计划**:作为高校科研团队,该项工作的代码、模型、权重及数据将尽可能完全开源,但涉及道路与影像的敏感数据会设置合规访问门槛 [75] 行业趋势与跨学科融合 - **领域融合**:人工智能研究正从数字世界(如大模型)与物理世界(如机器人)泾渭分明的状态走向“汇流”,具身智能(让AI在物理世界中行动)成为关键方向,但面临物理世界复杂度高和安全可靠性要求高等硬挑战 [33][34] - **范式创新**:该研究代表了一种范式转变,即**绕过传统的“概念翻译”,尝试在原始数据层面直接建立脑科学与AI的连接**,利用人类隐式认知信号作为新型监督信息源,这可能是构建更通用、更安全智能系统的关键路径 [46][49][56][73] - **信号扩展**:除了脑电,其他生理信号如**眼动信号(反映注意力分配)** 也被证明融合后能带来稳定提升,表明利用人类隐式认知线索是提升AI系统性能的重要方向 [73] 未来展望 - **发展愿景**:未来的具身智能或AGI更可能被理解为人类的“**认知伙伴**”,其核心在于更好地理解人类并与人类协同,为此需要在机制上与人类共享某些“可对齐”的逻辑框架,以降低社会协作成本 [60][61] - **技术终局**:让系统更接近“所想即所得”、更自然地读懂人的意图是一个长期演进方向,但需考虑相关的风险与伦理约束 [58][59] - **当前瓶颈**:该技术路径的**核心瓶颈在于数据**,包括多模态生理信号的采集难、对齐难、建库难和分析难,软件工程层面相对成熟 [70][74] 研究者背景与启示 - **研究风格**:主导该研究的龚江涛博士拥有从计算机科学到人机交互、再到脑科学和产业研究的交叉背景,其研究风格深受博士导师影响,强调**从问题的“根”出发,先理解底层机制(如生物智能如何工作),再进行创新设计** [8][19][21] - **产业结合**:在联想研究院的产业经历使其深刻理解如何将研究想法在产业中孵化,并认识到研究与产业更好连接有助于研究者找准社会定位,避免迷茫 [23][24][28][29] - **对开发者的建议**:在AI时代,**编程能力和计算机基础方法论(数据结构、算法、系统思维)是重要根基**,而真正的差异化优势在于**跨学科能力**,即深入理解目标领域的问题语境,并与领域专家深度协同,将技术落到真实场景中 [75][76]
岩山科技(002195.SZ):公司全资子公司岩思类脑自主研发的脑电大模型尚未应用在商业航天领域
格隆汇· 2026-01-14 15:23
格隆汇1月14日丨岩山科技(002195.SZ)在投资者互动平台表示,公司全资子公司岩思类脑自主研发的脑 电大模型尚未应用在商业航天领域。 ...
“意念下棋”成现实,非侵入式脑机接口破局
21世纪经济报道· 2025-12-31 20:49
行业技术路径与认知演变 - 脑机接口主要分为侵入式、半侵入式、非侵入式三大技术路径 长期以来侵入式因能采集更高质量信号被认为是“高性能” 而非侵入式因信号微弱、信噪比极低被认为缺乏可靠性 [2] - 随着脑电大模型等先进算法的引入 这一认知边界正在被打破 信号算法和模型能力的飞跃正持续推高非侵入式技术的性能上限 [2] - 非侵入式的性能边界正在上移 在部分需要高实时性和稳定性的交互任务中 现有非侵入式系统的表现已可比肩甚至超越部分侵入式案例 [3] 核心技术突破与研发路径 - 岩思类脑将重心放在解码大脑意图的通用算法与模型上 视硬件为信号载体 而算法才是理解大脑“意图语言”的灵魂 [3] - 公司确立了以脑电大模型为核心的技术路线 目前该模型参数量已达50亿 [3] - 核心突破在于用侵入式数据赋能非侵入式解码 训练脑电大模型时融合了侵入式与非侵入式两类脑电信号 使模型在处理非侵入式脑电时能更精准地区分真实大脑活动与采集噪声 [3] 行业竞争格局与中国特色优势 - 早期脑机接口公司多为硬件公司 专注于电极、芯片与外设研发 从数据分析角度切入的团队仍属少数 [2] - 自2023年7月发布高性能中文解码成果后 从8月份起各大脑机接口公司都开始招聘“脑电大模型工程师” [3] - 依托上海市科委、国家神经疾病医学中心等机构 国内累积的临床科研数据样本已展现出对海外的量级领先优势 欧美缺乏像中国一样如此规模的侵入式临床脑电数据生态 [3] - 在数据库和算法上 中国脑机接口研发不是“弯道超车”而是“换道超车” 这给了中国算法研发一个历史性窗口 [4] 应用场景落地与市场前景 - 非侵入式脑机接口首次应用于国家级体育赛事 在“天天象棋杯”中国象棋协会年度总决赛中 脑瘫棋手通过意念控制棋子与特级大师对弈 [1] - 短期内 非侵入式技术将在消费娱乐、健康监测、康复辅助等领域率先落地 因其安全性与可接受度更高 而侵入式技术则聚焦于严肃医疗场景下的极限性能突破 [4] - 长远看 随着非侵入式性能在侵入式数据赋能的持续推动下不断提升 两者应用场景的边界将动态变化 更多现有侵入式的应用可能会被更优的非侵入方案替代 [5]
意念说话!脑机接口临床新突破引国际权威学术期刊关注
第一财经· 2025-07-18 21:06
脑机接口技术突破 - 上海岩思类脑人工智能研究院与复旦大学附属华山医院合作,在脑机接口领域取得突破,10例受试者通过大脑植入电极实现"意念说话",解码大脑神经电活动并实时显示中文语句 [1] - 该技术已进入临床试验阶段,将为渐冻症、脑卒中等失语患者带来福音,代表了我国脑机接口语言解码技术的最新发展成果 [1] - 国际权威期刊《自然》报道中国在侵入式脑机接口领域的突破性进展,包括上海脑虎科技的实时运动解码与实时汉语言解码技术 [1] - 去年12月,一名语言功能障碍患者在植入脑虎科技的256通道柔性脑机接口后,首次实现用汉语交流 [1] 中文脑电信号解码技术 - 解读中文脑电信号比英文难度更大,英文音素约50个,中文音素多达400个以上 [2] - 岩思类脑应用多脑区立体脑电协同解码技术和颅内脑电数据集,自研脑电大模型破解中文复杂语言系统,中文声母识别准确率超83%,韵母识别准确率超84% [2] - 岩思类脑拥有全球最大的人类颅内脑电数据库,研发的脑电大模型类似ChatGPT底层预训练模型,能精准读取脑电信号意图 [2] - 该技术可将人的想法准确高效转化为文字,未来应用包括失语患者语言表达、意念操控设备、元宇宙交互和多模态绘画等 [2] 侵入式脑机接口技术 - 脑虎科技创始人认为侵入式脑机接口技术的核心难点在于平衡大脑功能利用与避免损伤 [3] - 脑虎科技采用将柔性电极植入硬脑膜下的方案,相比插入脑组织可大大降低损伤,相比硬膜上植入能获取更高质量和精度的脑电信号 [3]
意念说话!脑机接口临床新突破引国际权威学术期刊关注
第一财经· 2025-07-18 17:25
脑机接口技术突破 - 解读中文脑电信号比英文难度更高 因中文音素多达400个以上 而英文仅50个左右 [1][2] - 岩思类脑与华山医院合作实现重大突破 10例受试者通过植入电极实现"意念说话" 中文语句实时解码准确率超83% [1][2] - 脑虎科技在侵入式脑机接口领域取得两项临床试验成果 包括实时运动解码与实时汉语言解码技术 [1] 技术实现路径 - 岩思类脑采用多脑区立体脑电协同解码技术 依托全球最大人类颅内脑电数据库 开发出类似ChatGPT的脑电大模型 [2] - 脑虎科技采用硬脑膜下柔性电极植入方案 相比传统方法既能降低脑损伤 又能获取更高精度的脑电信号 [3] 应用前景展望 - 该技术将帮助渐冻症 脑卒中等失语患者恢复语言能力 已实现语言功能障碍患者汉语交流 [1][2] - 未来可拓展至意念操控智能设备 元宇宙交互 多模态绘画等创新应用场景 [2]
用意念“说”出想说的话 上海脑机接口技术取得突破 为失语患者带来福音
解放日报· 2025-07-17 09:47
脑机接口技术突破 - 上海岩思类脑人工智能研究院与复旦大学附属华山医院合作在脑机接口领域取得突破,10例受试者通过大脑植入电极后,电脑能实时显示他们想说的中文语句 [1] - 该技术已进入临床试验阶段,将为渐冻症、脑卒中等失语患者带来福音 [1] - 脑机接口技术可实现大脑与外部设备信息交互,在医疗、康养、教育等领域有广阔应用前景 [1] 产学研医创新生态 - 华山医院利用多年临床资源建立了高质量颅内脑电数据库,并与国内多家神经外科头部医院组建iBrain脑电数据联盟 [1] - 岩思类脑等联盟成员可获得高质量颅内脑电数据集用于技术研发 [1] - 该突破源自产学研医深度融合的创新生态 [1] 脑电大模型技术 - 团队研发出类似ChatGPT底层预训练模型的脑电大模型,能精准读取脑电信号意图 [2] - 模型采用多脑区立体脑电协同解码技术,中文声母识别准确率超83%,韵母识别准确率超84% [2] - 模型在54个汉字训练集基础上可解读1951个常用汉字,外推率达1∶36 [3] 技术应用前景 - 该技术能在半秒内解读出完整中文语句,理论上可达到很高输出率 [3] - 未来不仅能让失语患者重获语言能力,还可用于意念操控设备、元宇宙交互等多场景应用 [3] - 技术还可将脑海语言转化为画作,实现多模态表达 [3]