小米公布大模型最新研究成果 10篇论文入选计算语言学顶级会议

公司技术成果 - 小米大模型团队共有10篇研究成果入选第63届国际计算语言学年会（ACL 2025），包括9篇主会长文和1篇findings长文 [1] - 入选的10篇论文中有5篇获得了小米揭榜挂帅科研专项的支持 [1] - 研究成果涵盖大模型端侧高效推理、大模型GUI智能体、大模型基础结构创新等多个领域 [1] 技术研究重点 - 研究包括无长期衰减的新型位置编码，以增强模型的上下文感知和外推能力 [2] - 开发了通过定制化KV缓存优化实现长上下文推理的混合框架 [2] - 提出了基于动态提示更新的新方法，以解决指令扩展过程中的“固定思维模式”问题 [2] - 在多图像场景的视觉语言模型方面取得进展，采用了以焦点为中心的视觉链范式 [2] - 从维度级别和深浅层平衡的角度解决KV缓存优化问题 [2] - 通过模拟人类“快慢思考”的规划过程来提升Web智能体的导航能力 [2] 行业会议背景 - ACL是计算语言学和自然语言处理领域的国际顶级会议，被中国计算机学会（CCF）列为A类会议 [1] - 第63届ACL年会将于2025年7月27日至8月1日在奥地利维也纳举行 [1]