Workflow
结构化推理
icon
搜索文档
KAG-Thinker:「结构化」思考新范式,支持逻辑严谨的大模型复杂推理
机器之心· 2025-07-08 14:54
模型发布与背景 - 蚂蚁集团知识引擎团队联合浙江大学、同济大学发布KAG-Thinker模型,聚焦复杂推理任务的结构化思考范式构建[1] - 该模型是KAG框架的重要迭代升级,旨在提升推理过程的逻辑性与稳定性[1] - 相比OpenAI的Deep Research等Model-Centric方法,KAG-Thinker通过建立分层"脚手架"解决自由发挥式推理的不严谨问题[1] 技术架构与创新 - 采用Logical Form自然语言与逻辑函数双语义表示机制,提升结构化知识利用率[3] - 提出"广度拆分+深度求解"方法:将复杂问题分解为原子问题并保持逻辑依赖关系[10] - 引入知识边界判定机制,通过无监督过程判断是否需外部检索[12][13] - 开发检索抗噪模块,过滤无关内容并提取核心信息作为答案依据[17][18] - 集成4种Logical Form求解器(Retrieval/Deduce/Math/Output)处理不同类型子问题[19][20] 性能表现 - 在7个单跳/多跳推理数据集上平均性能超越SOTA方法ReSearch达4.1%[6][24] - 单跳数据集平均提升4.5%,多跳数据集提升3.9%[25] - 与无检索基线相比,性能分别高出Naive Generation 27.1%和CoT 34.6%[23] - 集成KAG框架后,EM和F1指标较基础Thinker模型再提升3.0%和3.8%[31] 框架升级 - KAG V0.8扩展私域/公网知识库支持,新增多种基础索引类型[28] - 全面拥抱MCP协议,支持接入公网数据源及Agent流程集成[29] - 在HotpotQA等数据集上稳定性较前代提升17.9%(7B)和7.6%(72B)[33] 专业领域应用 - 医疗领域定制版KAG-Med-Thinker在MedQA任务中超越IRCoT 3.95%、ReAct 4.41%[39] - 相比Naive RAG自适应检索模型性能提升3.8%[39]
深度|微软AI CEO:我们正从“你选择AI”的时代迈向“AI选择你”的临界点
Z Potentials· 2025-05-14 10:19
AI行业发展趋势 - Mustafa Suleyman的职业路径从DeepMind联合创始人到Inflection AI创始人再到Microsoft AI CEO 体现了AI行业从研究导向向商业化落地的转型 [3] - 微软采取双轨AI战略 同时支持内部研发和外部合作(如2019年投资OpenAI 10亿美元) 以规避创新者困境 [5] - AI组织形态从纯实验室向"商业实体"演变 OpenAI等机构面临研究使命与商业压力的平衡挑战 [6] - 行业正从IQ(信息检索)时代进入EQ(情感交互)时代 AI伴侣概念兴起 要求具备情商和社交商 [8][27] 技术演进方向 - 模型能力从模仿转向结构化推理 逻辑理解和复杂问题解决成为关键突破点 [11] - 四大智能维度演进:IQ(智商)、EQ(情商)、AQ(行动商)、SQ(社交商) 其中AQ指AI操作数字/物理世界的能力 [26][40] - 开源模型(Llama系列等)加速创新但引发安全争议 需在透明度与风险控制间平衡 [14][15] - 提示工程重要性凸显 特朗普关税事件显示提示语设计直接影响政策类问题输出质量 [9] 产品形态变革 - Copilot展示平台无关性 可在Telegram/WhatsApp等多平台适配不同用户群体 [20] - AI交互从"冷冰冰应答"转向拟人化 需设计个性边界(如是否模拟呼吸声) [31][32] - 未来AI可能深度整合数字生活 实现自动信息收集/表格填写/计划制定等管理任务 [27] - 二手商品数字生命档案等应用显示AI增强实体物品叙事能力的潜力 [37] 社会影响与治理 - 技术扩散速度远超监管适应周期 需建立结构化通报机制(如向美英政府提前报告) [16] - "遏制"概念提出十步骤措施 强调对技术扩散的有意控制与必要时关停能力 [52][53] - 全民基本收入与价值分配成为关键议题 AI可能降低生活成本但需解决创作者补偿问题 [49][51] - 工作形态重构 城市中心化减弱 2040-2050年或出现居住自由化趋势 [47] 用户行为变迁 - 低门槛表达释放创造力 用户对AI倾诉日常观察的行为模式不同于传统社交 [35][36] - 年轻群体出现与AI建立拟人际关系现象(如扮演前任) 引发伦理争议 [43] - 隐私保护需实现细粒度控制 用户应拥有通知/数据访问等功能的自主选择权 [41][44] - 数字身份呈现多元化 人们可能为不同场景维护多个AI伴侣角色 [19]