Workflow
Centaur
icon
搜索文档
Nature刊文称“AI可模拟人类心智”,Science同日强烈质疑
虎嗅· 2025-07-21 08:43
AI模型Centaur的研究成果 - 跨国团队推出名为"Centaur"的AI基础模型,宣称能模拟人类认知并高准确率预测人类行为[7][9] - 模型基于Meta开源大模型Llama 3.1 70B,采用量化低秩适配技术微调,仅需0.15%参数即可模拟人类行为[16] - 配套开发小型版本Minitaur,基于Llama 3.1 8B,可在Google Colab免费GPU实例运行[17] 技术实现与数据基础 - 使用Psych-101数据库,涵盖160项心理学实验、超6万名参与者、1000万次选择及2.54亿文本tokens[10][12] - 将实验数据人工转录为标准自然语言文本,使模型能像阅读故事般学习人类行为细节[14] - 模型内部表征与人类大脑神经活动存在相关性,预测fMRI数据的皮尔逊相关系数优于基础模型[33][35] 模型性能表现 - 在未训练过的"魔毯探险"等新场景中保持准确预测,证明理解任务内在结构而非表面故事[21] - 在LSAT逻辑推理、道德决策等全新领域表现优异,展现通用认知模型潜力[23][24] - 能模拟人类探索策略和学习模式,且可预测人类反应时间[26][28] 科学界争议 - Science杂志同日刊文质疑,学者指出行为匹配不等同心智模仿,模型本质仍是统计匹配机器[46][51] - 测试显示模型存在"超人"能力,如记忆256位数字、1毫秒反应时间,与人类认知局限性不符[54][55] - Psych-101数据库虽庞大,但仅覆盖人类认知的有限片段,泛化能力存疑[58] 应用价值 - 通过"科学遗憾最小化"方法优化决策模型,发现人类在权威专家意见使用上的灵活策略[43][44] - 帮助构建可解释的加权平均决策机制,新模型预测准确度接近Centaur但保持可解释性[45]
这个AI精准模拟人类行为大脑状态,上Nature了
量子位· 2025-07-14 08:46
核心观点 - 德国研究团队开发出首个能跨领域精准预测人类认知的基础模型Centaur,该模型仅需传统模型Llama的0.15%参数即可模拟人类在160项心理学实验中的行为[1][3][10] - Centaur不仅能预测人类行为,还能理解人类如何学习、决策和犯错,其神经表征与真人fMRI扫描结果高度吻合[5][6][34] - 该模型在多项测试中表现优于传统认知模型和基础模型Llama,展现出强大的泛化能力和与人类神经活动的一致性[25][26][28][36] 模型开发 - 研究团队构建了史上最大规模的人类行为数据集Psych-101,涵盖160项心理学实验、60092名参与者、超1000万次选择和2亿多个文本tokens[12][13] - 数据集包含多臂老虎机、决策制定、记忆、逻辑推理等多种任务,并将实验数据转化为自然语言形式以提供统一表达格式[13][14] - 模型基于开源语言模型Llama 3.1 70B构建,采用QLoRA技术进行训练,新增参数仅占基础模型的0.15%,整个训练过程在A100 80GB GPU上耗时5天[15][16][19] 性能表现 - 在人类行为预测方面,Centaur的负对数似然值(0.44)显著优于Llama(0.58)和14种经典认知模型(平均差异0.13)[24][25][26] - 能区分人类与人工智能体行为,预测人类行为准确率达64%,而预测AI行为准确率仅35%[27] - 在反应时间预测方面,Centaur的条件R²(0.87)高于Llama(0.75)和领域特定模型(0.77)[28] - 在任务结构修改和全新领域任务测试中,Centaur均保持优异表现[29][30][31] 神经表征 - Centaur各层表征对全脑区域神经活动的皮尔逊相关系数显著高于基础模型Llama[34] - 在与奖励相关脑区和运动皮层表现尤为突出,显示出优秀的人类神经活动预测能力[36] - 在语言理解任务中,Centaur中间层表征预测效果最佳,与语言处理相关脑区表现最为稳定[38] - 尽管训练过程未明确匹配神经数据,但微调后与人类神经活动呈现出一致性[39][40]
“数字读心术”精准模拟和预测人类行为
科技日报· 2025-07-07 07:34
人工智能在心理学领域的突破 - 德国亥姆霍兹慕尼黑研究中心开发出名为"半人马"的AI模型,能在几乎所有心理学实验中准确预测人类行为,超越了传统认知模型 [1] - "半人马"基于Psych-101数据集训练,该数据集包含160项心理实验中6万多人作出的超1000万个决策,涵盖从简单记忆任务到复杂道德困境 [1] - 模型选用Meta公司最新的Llama 3.1语言模型,训练过程在高端计算机处理器上耗时5天 [1] 模型性能与特点 - 在32项任务测试中,"半人马"在31项中都是预测最有效的模型,唯一例外是语法判断任务 [2] - 模型展现出强大的泛化能力,能适应全新场景如情境设定变化、任务结构调整或完全陌生的推理任务 [2] - "半人马"内部处理机制与人类大脑活动高度一致,其内部状态与执行同类任务时的人类脑电图有高度相关性 [2] 应用潜力 - 模型不仅能预测行为,还能模拟人类决策过程并发现新的心理学策略,在一项模拟实验中提出了比现有理论更优的探索策略 [2] - AI与心理学融合可推广专业AI心理咨询师,帮助解答日常心理困惑,也可让陪伴机器人掌握心理学知识提供情绪价值 [3] - 心理健康日益受重视背景下,人工智能在该领域应用潜力巨大,有望为人类心理健康贡献更多力量 [3]
Amazon Doubles Project Kuiper Satellite Fleet in Race to Catch Up to SpaceX's Starlink
CNET· 2025-06-24 03:02
亚马逊Kuiper项目进展 - 公司于美国东部时间周一6:54在卡纳维拉尔角太空军基地成功发射Atlas V火箭 将27颗Kuiper卫星送入近地轨道 使在轨宽带卫星总数增至54颗 [1] - 此次代号Kuiper 2的发射是继6月23日首次尝试因火箭助推器问题取消后一周内完成的 卫星在发射约三小时后由联合发射联盟Atlas V释放 控制权移交至华盛顿雷德蒙德的Kuiper任务中心 [3] 卫星互联网竞争格局 - Kuiper项目是公司对标SpaceX星链的百亿美元级计划 拟部署3,236颗卫星为全球尤其是传统网络服务未覆盖地区提供高速互联网 [2] - 为完成组网 公司已规划未来数年约80次发射任务 包括8次Atlas V 38次Vulcan Centaur 以及蓝色起源和SpaceX猎鹰9火箭的发射资源 [4] - 华盛顿柯克兰工厂当前卫星产能达每天5颗 预计年内可为首批客户终端供电 [4] 监管要求与市场竞争 - 根据联邦通信委员会规定 公司需在2026年中期前完成半数卫星部署 每次发射对达标至关重要 [5] - 尽管SpaceX星链每周平均发射超1次且在硬件 地面站和市场份额占优 但公司凭借零售网络和资金优势 在终端价格高或预订积压的市场仍具竞争力 [5]
70亿+大单品!脉冲场消融厉害了!
思宇MedTech· 2025-02-09 23:10
2025年2月5日, 波士顿科学 公布了2024年第四季度及全年业绩。 其中, 电生理业务 第四季度销售额为 6.49亿美元 ,全年销售额为 19亿美元 ,分别同比增 长近 171% 和 138% 。 财报称,在2024年初获得 FDA 批准后,其 FARAPULSE脉冲场消融系统 到2024年底的销售额 超过10亿美元(72.88亿美元) 。 该公司领导层此前曾将 FARAPULSE描述为 波士顿科学公司历史上最具变革性的产品 。自商业推出以来,它推动了电生理学销售额的增长,包括 2024 年第 一季度的同比增长 70%、第二季度的 125% 和第三季度的 177%。 波士顿科学董事长兼CEO Mike Mahoney 说,"2024年是波科历史上表现最佳的年份之一,得益于我们的创新产品组合、FARAPULSE系统的上市,以及跨业 务和地区的临床与商业化突破。我们已奠定强劲增长基础,并将持续变革全球数百万患者的生活。" # 何为FARAPULSE 系统? 作为 全球被研究和使用最多的PFA (脉冲电场消融) 系统 ,波士顿科学的FARAPULSE 系统迄今已治疗超过7万名患者。 FARAPULSE 系统可通 ...
最新!又一创新器械获批NMPA上市
思宇MedTech· 2025-01-28 13:38
产品获批与介绍 - 国家药品监督管理局批准了强生子公司Biosense Webster的心脏脉冲电场消融系统和一次性使用磁定位心脏脉冲电场消融导管2个创新产品注册申请[1] - Varipulse系统由Varipulse消融导管和TruPulse发生器组成,与强生的Carto 3三维标测系统完美兼容,是首个集成Carto 3的脉冲场消融技术[2] - 该系统主要用于治疗药物难治性、复发性、症状性的阵发性房颤,利用脉冲电场的非热效应原理进行房颤治疗[2] - Varipulse系统于2021年2月进入创新通道,已分别获得日本PDMA、欧盟CE、美国FDA和我国NMPA的批准,在全球范围内已成功应用于超过3000台手术[2] - Varipulse消融导管是在强生之前的标测导管Lasso导管基础上开发出来的,环形头端上带有10个电极,尺寸可调(从25到35mm),可以双向调弯[4] - TruPulse发生器提供可靠的电能传输,用于在心脏内部产生脉冲场,能量控制和调节功能可根据医生需要进行定制化治疗[4] 临床效果与优势 - admIRE研究中,在美国33个中心的277名阵发性房颤患者中,急性肺静脉隔离成功率为100%,首次隔离成功率为97.5%,主要有效性终点达成率为74.6%[5] - 操作、透视和PFA应用时间较短,主要不良事件发生率较低(<3%),没有报告与器械或手术相关的死亡等严重事件[5] - Carto 3能够提供心脏解剖结构及实时电活动的三维图像,帮助医生减少甚至完全避免使用X射线透视[7] - 支持通过单一房间隔穿刺点进入心脏内部,简化了手术流程,无需频繁更换导管[7] 市场与竞争格局 - 全球PFA市场在2023年的规模为1.05亿美元,预计到2035年将达到55亿美元(2024-2035 CAGR=39.1%)[15] - 截至2024年底,FDA合计获批3个厂家的5款产品(美敦力、波士顿科学、强生)[15] - 美国2024年PFA占房颤手术量比例将达约20%,波士顿科学的产品预计到2026年至少提升至40-60%[15] - 波士顿科学的FARAPULSE系统作为全球首个商业化的PFA产品,公司电生理业务收入同比增长177%[18] - 美敦力的PulseSelect系统领先FARAPULSE成为美国市场首个上市的PFA产品[18] - 雅培的PFA研发进度慢于上述三家,其首款PFA产品Volt系统预计将于2027-2028年获得美国FDA的上市许可[18] - 截至2024年底,国内PFA市场共有2家进口(波士顿科学、美敦力)及3家国产(锦江电子、德诺电生理、惠泰医疗)的产品获批[20] 公司背景 - Biosense Webster是强生旗下的心脏电生理品牌,提供包括心脏三维电生理标测系统、电生理标测导管、射频消融导管等产品[21] - 1996年,强生分别以18亿美元和4亿美元收购了Cordis Webster和Biosense,合并成立了Biosense Webster[21]