Workflow
原生记忆力
icon
搜索文档
在WAIC现场,全球首个拥有「原生记忆力」的大模型亮相,但不是Transformer
机器之心· 2025-07-26 17:32
架构革新趋势 - Transformer架构统治大模型领域八年后,谷歌开始探索替代方案MoR,表明行业对架构革新已形成共识[1][2] - 国内企业RockAI推出非Transformer架构Yan 2.0 Preview,比谷歌变革更彻底,其3B模型在端侧设备实现多模态能力[3][4][5] - Yan架构显著降低计算复杂度,可在树莓派等低算力设备离线运行,突破Transformer的算力依赖限制[5][9] Yan架构技术突破 - 模型具备原生记忆能力,能将记忆融入参数实现持续学习,而Transformer模型每次对话需重新开始[6][16] - 通过可微的"神经网络记忆单元"实现生物式记忆存储/检索/遗忘,无需外挂知识库管理[17][19] - 在ARC-C(76.8)、ARC-E(91.7)等基准测试超越Llama3(79.6/92.3)、Gemma3(56.2/82.4)等同规模模型[14] - 机器狗Demo展示记忆持续性,重启后仍保留学习过的动作和偏好[20] 行业痛点解决方案 - 突破Transformer两大瓶颈:数据墙(高价值数据获取难)和算力依赖(端侧部署困难)[9] - 实现"训推同步",允许设备在推理时持续学习,解决剪枝/量化破坏再学习能力的问题[9][10] - 记忆机制带来时间维度和个性化特征,可能改变依赖海量数据的训练范式[21] 商业化应用前景 - 模型角色从回答者转变为用户思维延伸,实现长期陪伴和个性服务[22] - 离线智能使设备从工具进化为"数字大脑",硬件价值从配置转向智能进化能力[23][28] - 已在WAIC大会吸引硬件厂商合作,非Transformer架构开始扩散至AI硬件市场[34] 公司发展理念 - 三大核心理念:AI普惠化(端侧部署)、设备自主进化、群体智能涌现[24][25][26] - 定位"离线智能"而非端云结合,强调本地算力下的自主学习能力[27] - 坚持挑战反向传播算法等底层技术,展现长期主义研发态度[36][37]