在WAIC现场，全球首个拥有「原生记忆力」的大模型亮相，但不是Transformer

架构革新趋势 - Transformer架构统治大模型领域八年后，谷歌开始探索替代方案MoR，表明行业对架构革新已形成共识[1][2] - 国内企业RockAI推出非Transformer架构Yan 2.0 Preview，比谷歌变革更彻底，其3B模型在端侧设备实现多模态能力[3][4][5] - Yan架构显著降低计算复杂度，可在树莓派等低算力设备离线运行，突破Transformer的算力依赖限制[5][9] Yan架构技术突破 - 模型具备原生记忆能力，能将记忆融入参数实现持续学习，而Transformer模型每次对话需重新开始[6][16] - 通过可微的"神经网络记忆单元"实现生物式记忆存储/检索/遗忘，无需外挂知识库管理[17][19] - 在ARC-C(76.8)、ARC-E(91.7)等基准测试超越Llama3(79.6/92.3)、Gemma3(56.2/82.4)等同规模模型[14] - 机器狗Demo展示记忆持续性，重启后仍保留学习过的动作和偏好[20] 行业痛点解决方案 - 突破Transformer两大瓶颈：数据墙（高价值数据获取难）和算力依赖（端侧部署困难）[9] - 实现"训推同步"，允许设备在推理时持续学习，解决剪枝/量化破坏再学习能力的问题[9][10] - 记忆机制带来时间维度和个性化特征，可能改变依赖海量数据的训练范式[21] 商业化应用前景 - 模型角色从回答者转变为用户思维延伸，实现长期陪伴和个性服务[22] - 离线智能使设备从工具进化为"数字大脑"，硬件价值从配置转向智能进化能力[23][28] - 已在WAIC大会吸引硬件厂商合作，非Transformer架构开始扩散至AI硬件市场[34] 公司发展理念 - 三大核心理念：AI普惠化（端侧部署）、设备自主进化、群体智能涌现[24][25][26] - 定位"离线智能"而非端云结合，强调本地算力下的自主学习能力[27] - 坚持挑战反向传播算法等底层技术，展现长期主义研发态度[36][37]