文章核心观点 - 中国基层医疗机构(尤其是乡镇卫生院)每年产生海量影像数据(如2024年诊疗人次达13.8亿),但由于设备操作水平和人才短缺导致数据质量粗糙,难以被用于训练高质量的医疗AI模型,造成了巨大的数据资源浪费 [3][5][12] - 高质量数据是AI医疗发展的核心燃料,但当前AI技术与基层医疗之间存在“能下不能上”的单向流动:AI产品可下沉至基层应用,但基层难以向上贡献可用数据,这主要源于医疗资源分配不均及数据采集标准化程度低 [4][6][7][8] - 构建基于独有、高质量数据的壁垒是医疗AI企业的核心竞争力,而解决数据治理、集成复杂性及打破医疗机构“数据孤岛”是行业面临的关键挑战 [10][11][12] 行业现状与挑战 - 基层医疗数据规模庞大但质量低:中国有超过3万家乡镇卫生院,2024年诊疗人次达13.8亿,年增0.7亿人次,产生的影像数据量巨大,但质量粗糙,在训练医疗大模型时“很多就不能用” [3][5] - 医疗资源不均导致数据标准化程度低:与欧美医疗体系均质化程度高不同,中国城乡医疗水平差异大,乡镇医疗机构放射科大夫多为大专水平,而县级医院临床大夫可达博士水平,导致数据采集端标准化低,转化应用成本高 [8][9] - 数据治理与集成复杂:医院系统独立、架构与数据标准各异,医疗术语缺乏标准化,非结构化病历数据普遍,数据质量不佳(错误、字段缺失)削弱了AI模型可靠性并增加开发成本 [12] 企业实践与商业模式 - 医疗服务企业深入基层网络:例如一脉阳光在全国20个省份建设了117个影像服务中心,合作机构超1100家,业务覆盖省市医院乃至乡镇卫生院,旨在将约10万家医疗机构数字化 [4][5] - AI企业投入数据标准化采集:为解决基层数据质量问题,部分医疗AI企业通过5G等技术远程控制异地设备,进行标准化数据采集,使乡镇数据与一线城市数据趋于一致,但研发成本高昂,其中算力和数据构建是主要支出 [10] - 构建独有数据壁垒:行业认为,发表在高质量医学杂志上的公共数据已被充分利用,未来AI医疗的独特优势与长期壁垒在于企业独有的、可不断优化模型精度的活数据 [11] 技术应用与市场动态 - AI已成为医疗设备关键驱动力:飞利浦等跨国企业及联影等中国公司已将AI视为塑造医疗未来的关键,例如飞利浦近半数展出的创新产品已与AI紧密相关,新一代能量CT将带来数据量的爆炸式增长 [6] - “垃圾数据进,垃圾模型出”:行业共识指出,数据质量直接决定模型质量,低质量数据不仅产出低效模型,还会导致企业难以判断算法本身的问题,可能因此否定优秀算法 [6] - 数据质量决定AI上限:中国庞大的人口基数本可提供充足的医疗数据助力AI发展,但若因采集不标准和机构孤岛化问题无法充分利用,则意味着巨大浪费 [12]
三万乡镇医院的数据,为什么人工智能用不了
第一财经·2026-05-01 19:53