大语言模型提示压缩框架 LLMLingua 和 LongLLMLingua - 财报，业绩电话会，研报，新闻

大语言模型提示压缩框架 LLMLingua 和 LongLLMLingua

搜索文档

AI科技大本营· 2025-04-15 16:17

大模型驱动的智能体系统发展 - 大模型快速发展催生了智能体系统（agentic system），彻底改变了人类与计算机的交互方式，其核心在于混合架构（传统编程语言+大模型指令）[1][4] - 智能体系统将成为大模型应用的普遍形式，其性能和使用成本决定了大模型的普惠范围，优化方向是提升单位算力的智能输出[4] - 大模型驱动的系统颠覆传统软件的两大特点：处理语义信息的能力（非语法层面）和用户只需指定任务目标无需说明执行步骤[5] 智能体系统的关键技术方向 - 提升效率的三大方向：面向大语言模型的编程、验证大模型输出、构建智能体原生服务系统[6][7][10] - 面向大语言模型编程的核心工具包括自动提示优化（APO）、提示压缩框架LLMLingua（压缩比达20倍）和动态稀疏注意力算法（推理延迟降低10倍）[11][14] - 验证大模型输出的方法包括构建DSEval和VisEval基准测试框架，以及V-Droid的实时验证器架构（移动端任务完成率创新高）[15][17][19] 智能体原生服务系统创新 - Parrot服务系统引入"语义变量"概念，通过构建请求间依赖关系图（DAG）实现端到端优化，多智能体编程任务性能提升11.7倍[21] - 当前公共大模型服务的局限性在于无法识别请求间关联，导致网络延迟、排队和冗余计算等问题[21] 跨领域协作与未来展望 - 智能体系统优化需要算法与系统协同创新，微软亚洲研究院采用网状团队合作模式（如YOCO和BitNet等底层技术研究）[24] - 行业未来重点在于通过低比特量化、系统架构优化等方法降低智能体系统成本，扩大应用范围[24] 行业应用案例 - RAG任务分类法已在医疗领域应用，将查询需求分为4级（显性事实查询到隐式推理查询），显著提升智能体性能[12][16] - 数据科学智能体通过DSEAL领域特定语言和校验原语实现全生命周期验证，确保技术准确性与用户意图匹配[15][17]

提示压缩工具（prompt compression）

大语言模型提示压缩框架 LLMLingua 和 LongLLMLingua

提示压缩工具（prompt compression）

大语言模型提示压缩框架 LLMLingua 和 LongLLMLingua

Parrot 服务系统