结构化推理 - 财报，业绩电话会，研报，新闻

结构化推理

搜索文档

机器之心· 2025-07-08 14:54

模型发布与背景 - 蚂蚁集团知识引擎团队联合浙江大学、同济大学发布KAG-Thinker模型，聚焦复杂推理任务的结构化思考范式构建[1] - 该模型是KAG框架的重要迭代升级，旨在提升推理过程的逻辑性与稳定性[1] - 相比OpenAI的Deep Research等Model-Centric方法，KAG-Thinker通过建立分层"脚手架"解决自由发挥式推理的不严谨问题[1] 技术架构与创新 - 采用Logical Form自然语言与逻辑函数双语义表示机制，提升结构化知识利用率[3] - 提出"广度拆分+深度求解"方法：将复杂问题分解为原子问题并保持逻辑依赖关系[10] - 引入知识边界判定机制，通过无监督过程判断是否需外部检索[12][13] - 开发检索抗噪模块，过滤无关内容并提取核心信息作为答案依据[17][18] - 集成4种Logical Form求解器(Retrieval/Deduce/Math/Output)处理不同类型子问题[19][20] 性能表现 - 在7个单跳/多跳推理数据集上平均性能超越SOTA方法ReSearch达4.1%[6][24] - 单跳数据集平均提升4.5%，多跳数据集提升3.9%[25] - 与无检索基线相比，性能分别高出Naive Generation 27.1%和CoT 34.6%[23] - 集成KAG框架后，EM和F1指标较基础Thinker模型再提升3.0%和3.8%[31] 框架升级 - KAG V0.8扩展私域/公网知识库支持，新增多种基础索引类型[28] - 全面拥抱MCP协议，支持接入公网数据源及Agent流程集成[29] - 在HotpotQA等数据集上稳定性较前代提升17.9%(7B)和7.6%(72B)[33] 专业领域应用 - 医疗领域定制版KAG-Med-Thinker在MedQA任务中超越IRCoT 3.95%、ReAct 4.41%[39] - 相比Naive RAG自适应检索模型性能提升3.8%[39]

深度｜微软AI CEO：我们正从“你选择AI”的时代迈向“AI选择你”的临界点

Z Potentials· 2025-05-14 10:19

AI行业发展趋势 - Mustafa Suleyman的职业路径从DeepMind联合创始人到Inflection AI创始人再到Microsoft AI CEO 体现了AI行业从研究导向向商业化落地的转型 [3] - 微软采取双轨AI战略同时支持内部研发和外部合作(如2019年投资OpenAI 10亿美元) 以规避创新者困境 [5] - AI组织形态从纯实验室向"商业实体"演变 OpenAI等机构面临研究使命与商业压力的平衡挑战 [6] - 行业正从IQ(信息检索)时代进入EQ(情感交互)时代 AI伴侣概念兴起要求具备情商和社交商 [8][27] 技术演进方向 - 模型能力从模仿转向结构化推理逻辑理解和复杂问题解决成为关键突破点 [11] - 四大智能维度演进：IQ(智商)、EQ(情商)、AQ(行动商)、SQ(社交商) 其中AQ指AI操作数字/物理世界的能力 [26][40] - 开源模型(Llama系列等)加速创新但引发安全争议需在透明度与风险控制间平衡 [14][15] - 提示工程重要性凸显特朗普关税事件显示提示语设计直接影响政策类问题输出质量 [9] 产品形态变革 - Copilot展示平台无关性可在Telegram/WhatsApp等多平台适配不同用户群体 [20] - AI交互从"冷冰冰应答"转向拟人化需设计个性边界(如是否模拟呼吸声) [31][32] - 未来AI可能深度整合数字生活实现自动信息收集/表格填写/计划制定等管理任务 [27] - 二手商品数字生命档案等应用显示AI增强实体物品叙事能力的潜力 [37] 社会影响与治理 - 技术扩散速度远超监管适应周期需建立结构化通报机制(如向美英政府提前报告) [16] - "遏制"概念提出十步骤措施强调对技术扩散的有意控制与必要时关停能力 [52][53] - 全民基本收入与价值分配成为关键议题 AI可能降低生活成本但需解决创作者补偿问题 [49][51] - 工作形态重构城市中心化减弱 2040-2050年或出现居住自由化趋势 [47] 用户行为变迁 - 低门槛表达释放创造力用户对AI倾诉日常观察的行为模式不同于传统社交 [35][36] - 年轻群体出现与AI建立拟人际关系现象(如扮演前任) 引发伦理争议 [43] - 隐私保护需实现细粒度控制用户应拥有通知/数据访问等功能的自主选择权 [41][44] - 数字身份呈现多元化人们可能为不同场景维护多个AI伴侣角色 [19]