Workflow
脉冲神经网络
icon
搜索文档
传统大模型有何局限性?欧洲科学院院士金耀初:能耗比较大且没有自主学习能力
新浪财经· 2026-01-15 15:13
行业趋势:类脑具身智能的发展方向 - 当前研究重点在于将脉冲信息处理方式、不同信息处理路径与机制整合到具身智能系统中[3] - 研究致力于使系统能够适应不同任务并灵活改变其功能性结构[3] - 在具身导航领域,借鉴人脑海马体的基本机制来构建更稳定可靠的认知地图是重要工作方向[3] 技术对比:脉冲神经网络与传统大模型 - 传统大模型存在局限性,包括能耗较大且缺乏自主学习能力[3][7] - 脉冲神经网络采用事件驱动和稀疏激发机制,其能耗较低[3][7] - 实现自主感知、决策和行为,需要将大脑的可塑性、神经调控等工作机制融入当前数据驱动和大模型驱动的方法中[3][7] 核心挑战:具身智能的安全与价值观 - 具身智能的安全问题至关重要,其重要性超过当前已存在幻觉和安全隐患的大模型[1][4] - 安全挑战涵盖感知、推理以及人机、人人之间的交互等多个层面[1][5] - 更高层次的挑战是让具身智能系统具备与人类相似的价值观,以实现和谐共处,这可以从人脑工作机制中获取启发[3][7]
甲骨文:与OpenAI的合作安排“没有延迟”;宇树科技推出人形机器人App Store,用户可下载动作预设丨AIGC日报
创业邦· 2025-12-14 09:08
甲骨文与OpenAI数据中心合作进展 - 甲骨文公司否认了关于其为OpenAI建造的数据中心完工时间从2027年推迟至2028年的报道[2] - 甲骨文发言人表示,数据中心选址和交付时间表是与OpenAI密切协调并共同确定的,所有合同承诺的节点均未延误,里程碑按计划推进[2] 谷歌AI产品功能更新 - 谷歌宣布将Gemini模型的翻译功能引入其文本翻译服务[2] - 谷歌同时推出了耳机实时语音转语音翻译功能的测试版体验[2] 宇树科技人形机器人生态建设 - 宇树科技于12月13日宣布首发人形机器人App Store,用户可在其中下载动作和预设以实现一键复杂操作[2] - 目前公测已上线搞笑动作、扭扭舞、李小龙三大预设[2] 天桥脑科学研究院成立新AI实验室 - 天桥脑科学研究院于12月13日成立了尖峰智能实验室[2] - 该实验室由中国科学院自动化所李国齐教授领衔,采用In-House研发模式,主要致力于类脑大模型和脉冲神经网络的研发[2] - 实验室核心方向是研发基于神经动力学的类脑智能模型,借鉴人脑高效能计算特性,探索超越当前规模法则的AI新路径[2]
突破类脑模型性能瓶颈:校正频率偏置实现性能与能效双突破|NeurIPS 2025
量子位· 2025-11-26 14:37
文章核心观点 - 脉冲神经网络性能不佳的根本原因并非二进制激活导致的信息损失,而是其固有的频率偏置问题,即脉冲神经元本质上是一个低通滤波器,会抑制高频成分并倾向于传播低频信息[4][8][19] - 通过引入高频算子(如Max-Pooling和深度卷积)来补偿SNN的低频偏好,新提出的Max-Former架构在提升精度的同时实现了能效的显著优化[24][27][30] SNN性能瓶颈的传统认知与新发现 - 传统观点普遍将SNN的性能落后归因于二进制脉冲带来的信息损失[5][6] - 新研究指出二进制本身不应是瓶颈,因为低比特乃至二值网络在ANN中也能取得逼近全精度的性能,且SNN的脉冲序列在时间轴上可编码log(n)-bit精度的信息[7] - 真正的瓶颈在于脉冲神经元在网络层面是一个低通滤波器,导致高频成分快速消散,难以捕捉关键细节和纹理[8][10][12] 频率偏置问题的实验验证 - 在脉冲Transformer中,使用高通算子Max-Pooling(79.12%)比低通算子Avg-Pooling(76.73%)在CIFAR-100上性能提升2.39%[15] - 这一发现与ANN Transformer的研究结论相反,在ANN中倾向于捕捉全局低频模式的Avg-Pooling更常见[16][17] - 理论分析证明脉冲神经元的充电过程传递函数是一阶无限脉冲响应低通滤波器,其波形产生的高频成分是虚假的,无法在网络中有效传播[19][20][21] Max-Former新架构的设计与性能 - 架构通过两个轻量级高频算子补偿低频偏好:在Patch Embedding中添加额外Max-Pooling在信息源头注入高频信号,以及用深度卷积替代早期阶段的自注意力以保留局部高频细节[24][28] - 在ImageNet上,Max-Former-10-768(4时间步)取得82.39%的Top-1准确率,以更少参数量(63.99M vs 66.34M)大幅超越Spikformer达7.58%[27] - 在实现性能突破的同时,能量消耗降低超过30%[30] - 在小规模数据集(如CIFAR-10上达97.17%,CIFAR-100上达83.06%)和神经形态数据集上均达到SOTA性能[29][34] 新视角的普适性验证 - 将高频信息重要性的洞察延伸到经典卷积架构,提出的Max-ResNet仅通过添加少量Max-Pooling操作就显著提升性能[33][34] - 这项工作表明SNN的优化路径不应简单模仿ANN的成功设计,而需针对其固有特性进行频率层面的补偿[35]
专家访谈汇总:黄金再度强势飙涨,加仓还是观望?
黄金价格再度飙涨 - 现货黄金突破3300美元/盎司大关,为5月9日以来首次 [1] - 短期波动核心驱动:地缘冲突升温+美国一季度GDP负增长推升避险需求,但贸易摩擦缓和构成短期利空,金价或陷入3000-3300美元区间震荡 [1] - 国内消费强韧性:4月金银珠宝零售额同比+25 3%(环比+14 7%),国内黄金消费景气度独立于国际金价波动 [1] - 机构观点分歧:看多逻辑包括滞胀风险+美联储降息周期+央行购金潮支撑黄金长期趋势,谨慎信号包括当前金价已处高位,贸易战暂缓或触发获利了结 [1] - 关键价格锚点:花旗大幅下调3个月目标价至3150美元(原3500美元),技术面关注3000美元支撑位与3300美元阻力位突破方向 [1] 美国拟对东南亚太阳能设备征收高关税 - 东南亚太阳能产业链面临极端税率分化:柬埔寨厂商税率高达3521%,马来西亚仅34%,晶科/天合/晶澳等中资东南亚基地关税普遍超120% [1] - 美国80%太阳能进口依赖东南亚四国(2023年129亿美元),高关税倒逼采购转向本土或第三国(如印度、墨西哥) [1] - 美国光伏项目开发商成本骤增(东南亚组件占主流),装机进度可能延迟 [1] - 中国企业应对策略:头部厂商(晶科/天合/晶澳)或加速产能全球化调配,马来西亚低税率产能优先保供,泰国/越南高关税产能转向欧洲、中东等替代市场 [1] 人形机器人落地 - 人形机器人商业化核心逻辑取决于能否创造实际价值,解决生产生活痛点并通过场景验证 [2] - 技术突破周期类比自动驾驶需10-20年,短期内(<10年)家庭普及预期需理性下调 [2] - 未来1-3年或现质变突破,但形态不限于双足——类人形/轮臂式机器人可能率先落地 [2] - 2022年国家定调人形机器人为'下一代颠覆性产品'后,政策与地方产业链布局持续加码 [2] - 具身智能领域华人占全球70%顶尖人才,叠加低成本硬件平台(如宇树)加速试错 [2] - 已验证场景(电力/化工巡检)企业已跑通技术-商业闭环 [2] Agent进展与AI产业链 - Agent尚未形成统一标准,但应用场景快速扩展,技术路线分化 [2] - 北美B端厂商主攻Agent平台化工具,国内大厂延续流量逻辑推通用型产品 [2] - Agent单次交互Token消耗超常规AI产品10倍+,底层算力基础设施仍是关键制约因素 [2] - 当前面临意图混淆、多Agent协作失效、幻觉三大技术障碍 [2] - 已验证场景(ERP/政务)的软件企业、模型私有化需求带动的算力硬件(服务器/一体机)、以及定制化需求强的领域(金融/能源)为近期确定性机会 [3] 公募新规落地影响市场生态 - 基准偏离与盈利客户比率成核心考核指标,主动型公募将转向聚焦核心资产定价 [4] - 中美关税阶段性降至44%,贸易摩擦缓和超预期,市场风险偏好进入回升通道 [4] - 低基数效应推动社融增速至8 7%,宽货币+财政发力支撑二季度社融稳健 [4] - 热点持续性极弱(如合成生物、可控核聚变),小盘股换手率下降,资金流向波动加剧 [4]