Workflow
多智能体架构
icon
搜索文档
DeepRare 重磅发布:全球首个可循证智能体诊断系统,直击医学Last Exam难题
机器之心· 2025-07-24 14:50
罕见病诊断现状 - 全球超过3.5亿人受罕见病影响,病种超7000种,80%为遗传性疾病 [1] - 患者确诊前平均经历5年以上延迟、7次以上就诊、3次以上误诊,误诊率高达40%-50% [1] - 罕见病症状异质性高、诊断路径长,传统AI模型难以胜任,临床专家经验难规模化复制 [2] DeepRare系统创新 - 由上海交大联合新华医院等机构发布全球首个罕见病推理型智能体诊断系统 [4] - 结合大语言模型和多智能体架构,模拟临床医生诊断思维路径,实现可解释的主动诊断 [6] - 系统支持多模态输入(自由文本、表型数据、基因组数据等),具备自适应能力 [8] 系统架构与工作流程 - 中央控制单元统筹全局,调用多个功能智能体分工协作 [7] - 诊断流程分两阶段:信息收集阶段(调用40余类医学工具)和自我反思验证阶段 [13] - 五大智能体:基因分析、搜索与知识匹配、病例匹配、疾病抽取、表型分析 [11] 临床案例验证 - 成功诊断一例Prader-Willi综合征患儿,该病发病率仅1/10,000至1/30,000 [18][19] - 在8个临床数据集评估中覆盖6401例患者、2919种疾病,Recall@1达57.18%,较最优方法提升23.79个百分点 [22][23] - 新华医院真实病例测试Recall@1达70.6%,优于Exomiser(53.2%) [24] 性能优势 - 在2919种疾病中34.7%(1013种)实现100%召回率 [24] - 专科表现:肾脏与泌尿系统准确率66%、内分泌系统60%、消化系统49% [30] - 多模态输入场景下Recall@1从46.8%提升至70.6% [33] 可溯源性与落地应用 - 诊断证据链条专家验证准确率达95.4%,引用Nature等权威知识库 [35][36] - 已上线在线推理平台(http://raredx.cn),支持中英文切换 [38] 行业意义 - 重塑罕见病诊断范式,推动精准医学落地 [40] - 未来可扩展至科研场景,加速意义未明变异解读 [41]
从代码生成到信贷风控 AI加速重构金融价值链
新华财经· 2025-07-02 20:19
AI Agent在金融行业的应用 - 信贷尽调时间从数月压缩至2小时,风险预警时效提升80% [1] - AI Agent成为驱动金融业效率与创新的核心引擎,多智能体架构适配复杂业务场景 [1][2] - AI推动金融软件研发从瀑布式向AI增强式、敏捷式转型,形成需求分析到智能化测试的闭环 [2] AI在金融研发中的实践 - 神州信息与OpenCSG合作完成AI Coding PoC验证,生成代码解决90%问题,综合提效20%-30% [3] - AI嵌入研发环节后显著提升代码质量与效率,未来有望介入决策类工作 [3] - Agent超级智能体推动AI技术向更智能、更精准方向发展 [3] AI重构信贷生态 - AI Agent解决客户经理效率痛点,信贷流程耗时最长环节大幅优化 [4] - 客调报告生成时间从一周至数月缩短至2小时,人工优化后达中等专家水平 [4] - 大模型在贷前风险研判中结合非结构化数据,实现实时监控与预警 [5] 银行差异化AI应用策略 - 国有大行搭建一体化智能平台覆盖多场景 [6] - 股份制银行聚焦卡类、理财等业务,通过高精数据与智能Agent调度实现精准营销 [6] - 城商行建议与厂商联创,以知识库搭建为切入点逐步延伸至核心业务 [6] 数据治理与AI落地挑战 - 大模型存在AI幻觉、数据隐私等问题,知识图谱技术可构建合规知识库提升准确性 [7] - 大模型替代传统手工操作提升本体构建效率,建议银行业设立专门AI部门 [7] - AI服务平台集成大模型与Agent,降低技术门槛成为未来关键基础设施 [8] 行业合作与价值变现 - Agent竞争力在于业务场景深度绑定,与科技企业合作减少试错成本 [8] - 整合行业解决方案加速AIGC在数据分析领域的价值变现 [8]
AI智能体(七):多智能体架构
36氪· 2025-05-21 07:13
AI智能体架构模式 - 单智能体架构在简单明确任务中表现高效 但随着任务复杂度提升会面临工具过载、上下文膨胀和错误增加等挑战 [9][10] - 多智能体架构适用于需要专业知识协作、动态复杂且需扩展性的场景 各智能体专注专业领域可提升解决方案质量并降低开发难度 [11] - 实践表明并非所有场景都适合多角色架构 某些情况下简单架构反而更高效经济 [8] 多智能体系统模式 并行模式 - 多个智能体同步处理任务不同部分 如三个智能体并行完成文本摘要、翻译和情感分析 [12] - 典型特征包括执行独立性、通过队列实现结果安全收集 适合大规模文本的并行处理 [20] - 实际案例显示并行处理可显著节省时间 三个子任务累计耗时6.5秒而实际总耗时仅3.01秒 [19] 串行模式 - 任务按严格顺序处理 前一智能体输出作为后一智能体输入 如企业三级审批流程 [20] - 关键机制包括状态继承和熔断机制 任一节点拒绝即终止后续处理 [24] - 典型应用场景包括多步审批流程 提案对象在流程中持续累积审批意见 [28] 循环模式 - 智能体按迭代循环执行 根据反馈不断改进输出 如代码编写与测试的迭代过程 [25] - 具备全面反馈机制 测试模块报告所有失败案例供编写模块逐步修复 [34] - 循环终止条件智能设定 测试通过后即终止避免无意义迭代 [35] 路由器模式 - 中心路由器根据输入决定调用特定智能体 如客户支持工单分类路由 [37] - 采用动态路由机制和条件驱动流程 通过关键词实现初步分类 [38] - 系统扩展性强 新增团队服务模块无需修改核心路由框架 [46] 聚合器模式 - 由聚合器智能体收集各子智能体输出并合成最终结果 如社交媒体情绪分析 [47] - 实际案例显示Twitter、Instagram和Reddit的情绪分析结果被聚合为整体报告 [55] - 采用并行数据收集与串行聚合相结合的模式 显著提升处理效率 [59] 智能体通信机制 - 主要通信方式包括图状态传递和工具调用 需考虑模式兼容性问题 [81] - 共享消息列表可分为完整历史共享和最终结果共享两种策略 各有优劣 [84] - 不同状态模式处理需定义输入输出转换逻辑或私有状态模式 [83]