Workflow
人工智能应用评测
icon
搜索文档
医疗AI有了“评审员”!北京启动医疗人工智能应用评测服务
新华社· 2025-11-08 23:12
行业监管动态 - 北京市卫生健康委设立医疗人工智能应用评测中心 旨在建立医疗AI评测的制度体系与规范标准 筑牢应用安全底线 [1] - 评测中心将验证医疗AI的临床辅助决策能力和效果 依托首都高水平医院和专家队伍、高质量医疗数据 [1] 评测体系与标准 - 评测中心建立多维度考核标准 形成6个核心维度的评测指标体系 包含70多项具体评测任务 [3] - 6个核心维度为医学合规伦理、医学循证与知识、通用辅助能力、专科诊疗质控管理、诊疗流程适配性、诊疗决策准确性 [3] - 医疗人工智能应用需从安全(合规伦理)、专业(医学知识)、实用(流程适配)等多个角度一起测评 [3] 评测方法与数据 - 评测中心联合重点医院、科研机构和权威专家团队 用临床案例、权威医学教材和最新临床诊疗指南构建高质量评测数据集 [3] - 评测考题由国内顶级专科高年资医师全程深度参与编撰与审核 确保科学性和权威性 [3] - 系统根据应用类型自动匹配评测任务并生成报告 由临床专家复核 [4] - 创新引入基于人工智能的评分机制 综合诊疗思路、推理逻辑、答题结果进行量化打分 避免只看最终结果的片面性 [4] 未来发展计划 - 评测中心后续将陆续开展更多医学领域的评测服务 覆盖内科、外科、儿科等专业领域 [5] - 发展目标是助力医疗人工智能产业健康发展 更好地服务人民群众健康需求 [5]
北京启动医疗人工智能应用评测服务
央广网· 2025-11-07 19:05
政策发布与评测启动 - 北京市卫生健康委正式发布通知,为企业和研究机构提供医疗领域人工智能应用评测服务 [1] - 本次评测是医疗领域国家人工智能应用中试基地首次对外提供评测服务,初期主要聚焦胸外科诊疗领域 [1] - 评测结果将根据参评单位意愿公布,表现优秀的应用将优先纳入国家基地推广渠道,向各级医疗机构重点推荐 [1] 评测体系核心要求 - 评测要求具备全面性,需从安全(合规伦理)、专业(医学知识)、实用(流程适配)等多个角度综合评估 [2] - 评测要求具备权威性,需使用真实临床案例和最新诊疗指南构建高质量数据集,以区分AI在严肃医疗场景下的真实差异 [2] - 评测要求具备科学性,需对AI的思考和答题过程进行评价,防止仅凭结果判断的片面性 [3] 评测中心与实施框架 - 评测中心旨在建立医疗AI评测的制度体系与规范标准,依托首都高水平医院和专家队伍开展验证 [4] - 评测内容涵盖6个核心维度的70多项具体任务,包括医学合规伦理、医学循证与知识、诊疗决策准确性等 [4] - 评测数据由重点医院和权威专家团队共同构建,确保基础扎实并与临床实践同步,覆盖常见病、罕见病及疑难病 [5][6] 评测流程与创新方法 - 评测流程严格实施用户申请、系统评测、专家复核三个环节,由系统自动匹配任务并生成报告 [6] - 评测方法创新引入基于人工智能的“裁判模型”判卷,综合诊疗思路、推理逻辑和答题结果进行量化打分 [6] - 计分方式避免只看最终结果的片面性,为推理逻辑更严谨的应用打更高分,确保结果客观公正 [6]