文章核心观点 - AI在理解上下文和隐性知识方面存在挑战,导致聊天生硬且准确率不足[1][6][11] - RAG技术应用面临工程难度大、专业化要求高、数据护城河构建等核心问题[15][20][26] - 企业AI项目需关注可观测性而非绝对准确率,建立闭环迭代机制[45][46][52] AI技术瓶颈 - 当前AI能覆盖80%场景但业务要求95%准确率[1] - 大模型擅长有限集任务(如围棋)但难以处理语料残缺的隐性知识[8][9][10] - 专家系统需解决医生诊断中的微表情解读、伦理判断等非结构化问题[11] RAG技术实践 - 工程复杂度远超模型:50个SOP需25-50万字提示词,数据工程占80%工作量[15][17][19] - 垂直领域专业化优于通用AI,如法律Harvey、医疗Open Evidence等案例[20][22] - 数据是核心壁垒:企业非结构化数据构建的飞轮系统形成差异化优势[26][28] 生产环境挑战 - 试点项目70分易实现,但生产需处理千万级文档和数万场景[29][30] - 快速迭代比追求完美更重要,初期barely functional即可[33][34][35] - 竞争焦点转向试错速度与资源,但需平衡成本与差异化[36][37][38] 可观测性方法论 - 审计追踪和归因机制比准确率更重要,需记录错误上下文[45][47][48] - 财务审核案例展示4类错误闭环处理:费用标准、发票合规等[51] - 五步方法论:锁定关键字段、显性化规则、双跑道架构等[52] 行业落地建议 - 优先将业务SOP全量导入Workflow,强化基础数据[56] - 建立审计链闭环,积累可观测数据再优化推理[56] - 盘活非结构化资产,通过数据飞轮拉开竞争差距[56][58]
没有RAG打底,一切都是PPT,RAG作者Douwe Kiela的10个关键教训
虎嗅·2025-07-01 12:09