Workflow
理想同学AI日历
icon
搜索文档
理想汽车基座模型团队近期斩获12篇顶会论文
理想TOP2· 2025-11-18 17:39
文章核心观点 - 公司在2025年三季度以来,其基座模型团队在人工智能基础研究领域取得重大进展,共有12篇高质量研究论文入选AAAI、NeurIPS、EMNLP、ACM MM、ICCV五大国际顶级AI学术会议 [4][6] - 这标志着公司正从传统车企向AI科技公司转型,通过深度布局人工智能基础研究,为智能汽车的下一代技术革新奠定基础 [6] - 研究成果呈现技术深度、应用广度和生态协同三大特点,技术正在从实验室走向量产车,形成“研究即产品,产品即研究”的双向循环 [9][51] AAAI 2026 研究成果 - 提出首个跨历法时间推理测试基准(SPAN),覆盖6种历法的10个历法推理方向,并采用创新的模板驱动的动态评估协议 [8] - 提出全新评测基准(LexInstructEval),通过建立形式化语法规则将复杂自然语言指令分解为机器可读的标准结构,以评估大型语言模型精确遵循复杂指令的能力 [11][13] - 提出SRSplat框架,一种仅需少量低分辨率视图即可重建高分辨率3D场景的前馈式框架,在多个数据集上的性能优于现有方法 [14][15][16] - 其中一篇SRSplat论文被选为Oral报告 [6] NeurIPS 2025 研究成果 - 提出类脑运动规划框架(NeuroMP),通过模拟人类大脑的路径寻优方法,以视觉空间感知和语义-情景协同决策解决车辆的感知-决策困境 [18][22] - 提出针对多角色姿态驱动动画的系统性解决方案(EverybodyDance),基于身份匹配图架构解决身份对应问题,在身份对应准确性和视觉保真度上显著超越现有方法 [23][24][25] EMNLP 2025 研究成果 - 提出新的评测框架(Collab-Overcooked)以评估大型语言模型多智能体协作能力,将协作解构为发起和响应两个关键阶段并设计细粒度过程化指标 [27][29][31] - 提出含数据集与预训练策略的解决方案(HED-COLD)以提升冒犯性语言检测模型对谐音攻击的防御能力,该方案在多个基准上均达到最优性能 [30][33][34] - 其中一篇Collab-Overcooked论文获得Senior Area Chair Highlight荣誉 [6][26] ACM MM 2025 研究成果 - 提出首个专门针对大型视觉-语言模型的跨模态知识一致性评测基准(PRISM),系统性地揭示并评估模型产生矛盾回答的知识不一致性现象 [36][38] - 提出VL-DynaRefine框架,通过实时验证与两阶段优化机制,让视觉语言模型在推理步骤中动态检测并纠正错误,在多项视觉任务上取得领先性能 [39][41] ICCV 2025 研究成果 - 提出业界首个大规模高质量人脸视频数据集DH-FaceVid-1K,具备多种族、高质量、大容量等特性,对视频生成领域有重要贡献 [43][45] - 提出全新的图像定制化微调范式QR-LoRA,训练参数为普通LoRA的一半,微调速度更快,可用于多属性组合生成等定制化场景 [46][48] - 提出自适应VLM Token压缩与推理加速方法Twig,通过Token剪枝和自投机解码策略,在长问答任务上可实现1.5倍的提速 [47][50] 技术应用与生态建设 - 研究成果已开始赋能实际产品,例如跨历法时间推理应用于AI日历,语言安全技术保障座舱交互安全,3D重建技术支撑辅助驾驶场景理解 [9][51] - 公司与10余所顶尖高校建立深度合作,形成“高校出理论、企业给场景、联合攻难关”的产学研新模式 [9]