Workflow
AI应用架构
icon
搜索文档
智能投顾的大模型应用,为什么选择了“大小模型协同”?
AI前线· 2025-06-15 11:55
大模型在金融投顾领域的应用挑战与解决方案 - 大模型在金融投顾领域面临的最大技术挑战是如何在高合规门槛的业务中避免幻觉和误答,金融业务容错率低,错误输出可能带来法律风险 [1][2] - 大小模型协同架构通过限制大模型职责范围(任务扩写与流程编排)和核心内容交由小模型完成,在性能、准确性与合规之间找到平衡 [1][2] - 大小模型协同方案在更低算力消耗下实现更稳定、深入的回答效果,提高了回答深度/算力消耗的比率 [3][4] 大小模型协同架构的技术实现 - 架构采用模块化设计,每个环节的大小模型都是解耦且可快速替换的,例如资产配置场景可使用专训的3B或7B模型进行问题扩写 [5] - 通过专训小模型进行意图识别,精准调用对应的小模型完成任务,各环节的小参数LLM或传统小模型都可独立更新 [5] - 基础模型与应用层解耦设计提高了应用稳定性、成长性和私密性,避免过度依赖基础模型 [6] 解决幻觉问题的具体措施 - 采用大小模型映射方式和词向量匹配传统手段进行投顾任务分配 [7] - 产品设计中将不同场景(选股、配置等)分类处理,直接调用对应Agent提高命中率 [7] - 通过知识库约束回答范围、内容和黑名单词汇,避免不合规表述 [7] 实际应用效果与扩展性 - 大小模型协同方案在回答深度和合规性上优于DeepSeek 671B和Qwen72B等大模型 [8] - 方案支持基础模型无缝切换,在基础模型较差时保持专业性下限,强大基础模型时提高上限 [8] - 架构可扩展至保险、财富管理等其他金融领域,但需要为小模型建立特征向量和维护索引 [7][8] 未来AI应用架构趋势 - 未来金融行业AI架构将趋向"语言理解+工具调用"的组合形态,LLM+API将成为主流 [9] - Agent在AI架构的商业实现中越来越重要,复杂场景可能需要LLM+API+RPA组合 [9] - 新技术更可能通过LLM+API调用现有工具(如PS)而非完全替代,形成性价比更高的解决方案 [9]