人机对齐
搜索文档
王江平:用上善AI的东方智慧,平衡技术发展的激进与焦虑
南方都市报· 2025-12-20 13:26
AI治理的核心理念与愿景 - 提出“上善AI”理念,以道家“上善若水”的东方智慧勾勒中国AI治理愿景,旨在平衡AI发展的激进与焦虑 [2][10] - 认为当前国际AI治理理念分歧大、阵营化趋势明显,国内AI监管需要一套科学、敏捷的框架体系 [2] - 将“上善AI”英译为“The Tao of AI”,旨在推动中国AI治理理念全球化,体现中国文化生命力 [10] AI技术演进与安全风险 - AI系统正从“技术工具”向“智能实体”转变,其正负面影响均将呈指数级扩大,但治理进展滞后于技术发展 [3][5] - AI安全风险正向内容生态、物理安全等领域传导,形成对经济社会稳定等宏观层面影响,并呈现层级穿透态势 [3] - 预计未来三到五年,AI领域性风险将呈现更多样化的形态 [3] - 大模型加速落地,由模型幻觉引发的内容风险成为热点,自动驾驶、具身智能发展带来物理世界安全风险 [3] 人机对齐的技术、挑战与重要性 - 人机对齐是智能时代核心议题,旨在确保AI系统的目标、行为和输出与人类价值观、意图及社会规范保持一致 [5] - 当前主流模型采用基于人工反馈的强化学习(RLHF)和检索增强生成(RAG)技术来实现对齐,以提高输出准确性、可靠性并减少模型“幻觉” [5] - 人机对齐面临挑战:人类价值观复杂动态,难以设定普适目标函数;数据偏差可能导致歧视性输出;为节省算力成本,一些模型公司可能降低对齐水平 [6] - 强调若对齐速度跟不上AI发展,可能出现由技术领先者单方面定义人类价值观的风险,因此治理和监管非常重要 [6] 主权AI与文化对齐 - 引用英伟达CEO观点,每个国家都需要自己的AI基础设施以保护文化和经济安全,使“主权AI”成为热门词汇 [7] - AI模型训练数据包含特定国家、文化元素,在不同地区应用时会体现各自特色,AI服务于本国利益离不开文化对齐问题 [7] - 文化对齐基本范畴包括价值观、制度、哲学,以及艺术、语言、习俗等 [7] “上善AI”理念的实践框架与原则 - 价值对齐应遵循“共通底线+多元分支+动态演变”根本原则,理解并适配人类价值观的多元结构 [8] - 制度对齐需通过法律、法规、标准与伦理准则等工具,将AI发展约束在符合社会共识的框架内 [8] - 哲学对齐核心是在智能时代重新定义“人类的位置”,划定“不可逾越的底线”与“合理探索的边界” [8] - 提出“四位一体”的AI治理框架体系,包括自律、社会监督(行业伦理委员会、第三方检测评估)、行政部门监管和司法,缺一不可 [10] - 倡导“敏捷治理”,与时俱进,既管住要害又为创新留足空间 [10] AI发展中的关键争议与应对 - AI时代存在“智能鸿沟”,技术垄断企业掌握先进技术和数据资源,弱势群体面临技术鸿沟、就业冲击等问题,双方在治理规则和利益分配上存在显著分歧 [11][12] - 主张遵循“天之道,损有余而补不足”,通过开源共享、技术转移和能力建设来填平AI鸿沟,让技术红利普惠 [12] - 对于AI监管松严之争,认为治大国若烹小鲜,不应过度干预技术发展,而应建立稳固的伦理底线和原则性指导,为创新留出空间 [12] - 指出中美人工智能博弈是一场双方都输不起的竞争 [12] - 针对“AI泡沫论”,认为真正的泡沫是“五色令人目盲”的狂热,应对之道在于“见素抱朴”,回归本质,关注技术是否解决真实问题,以“真需求”挤压泡沫 [12][13] 各相关方的行动建议 - 对于开发者与企业,建议在算法设计和产品理念中嵌入“利而不争”思维,优先考虑技术普惠性和社会价值,而不仅仅是商业回报 [13] - 对于监管机构,认为治理应像水一样柔而克刚,设定明确的伦理和安全边界(如“人机对齐”框架),但在具体技术路径上保持包容和开放,鼓励试错 [13] - 对于整个社会,应共同培养开放心态学习AI知识,同时坚守人的主体性和价值观,确保技术最终服务于人的全面发展 [13]
AI步入“立体化变革”深水区 “AI+”时代的中国路径逐渐清晰
中国经营报· 2025-12-02 00:52
文章核心观点 - 中国人工智能发展正经历从“技术狂飙”向“系统构建”的深刻转型,核心是构建以善治为锚、以场景为舟、以人才为帆的系统性生态 [1] - 发展路径强调兼顾效率与伦理、创新与安全,实现产业升级与人才培养的协同 [1] 人工智能治理 - 提出以“上善若水”哲学思想为基础的治理愿景,核心是解决“人机对齐”难题,确保AI目标行为与人类价值观一致 [2] - 倡导“以人为本、智能向善、敏捷治理、伦理先行”的治理理念,并创新提出“文化对齐”的三层结构:价值对齐、制度对齐、哲学对齐 [2] - 强调国家必须掌握数据、模型、应用与算力四大“AI主权”,以降低对外依赖风险 [3] - 尝试以东方智慧走出一条兼顾边界与包容的第三条道路,既要“道法自然”顺应大势,也要“知止不殆”明确底线 [3] - AI革命将带来“两次解耦”:能力解耦(数字助手赋能个体)与劳动解耦(体力脑力劳动非必需),需建立兼具前瞻性与包容性的治理体系 [3] 产业落地与效率革命 - 2025年是中国AI大年,目标为2027年率先实现六大重点领域深度融合,2035年全面步入智能经济与智能社会 [4] - 中国AI正经历“三大效率革命”:模型效率(用10%成本训练接近顶级性能的模型)、算力效率(池化技术提升资源利用率60%—90%)、数据效率(湖仓一体等推动数据主动理解) [4] - 2025年,中国开源模型全球月下载量占比超63%,远超美国;国产芯片与国产模型深度适配,形成自主生态 [4] - 企业实践中,AI在广告创意、客服问答、医疗辅助等场景显著提效,例如广告业务增收30%,汽车客服准确率从35%提升至84% [5] - 提出“分布式存算”创新模式,让每一个创新主体都能低成本参与数字经济发展,保护原创者利益并助力中小企业 [5] 人才培养与组织变革 - 启动“创新领航企业家提升工程”,直击企业家存在的政策迷茫、创新乏力、转型紧迫三重焦虑 [6] - 工程将组织企业家进入中央党校沉浸式学习,以企业真实问题为导向,提供“研究+实践+陪跑”服务,聚焦AI场景实战 [6] - 当前AI人才缺口不仅是技术型,更是认知型,需让企业家掌握AI技术,未来企业或设“智能资源部”统筹实体与数字员工 [6] - AI转型的实质是“对人和机器智能在生产关系中的重新设计”,对员工的替代不可避免,需关注如何保障劳动者权益及重构教育体系 [5] - 人才培养需与产业升级同步,通过“AI+”行动催生更多初创企业与新职业,形成人才与产业的良性循环 [7]
报告:“AI+医疗”行业步入调整期 从“野蛮生长”向“精耕细作”转变
证券时报网· 2025-10-17 14:11
行业融资趋势 - 2020年至2021年为行业快速增长期 相关企业融资数量在2021年达到280家 融资金额超400亿元 [1] - 2023年至2024年行业投融资逐渐下降并趋于平稳 行业进入调整期 从野蛮生长向精耕细作转变 [1] 技术应用与突破 - AI已渗透到药物研发各个环节 包括药物靶点发现、合成路径优化和临床试验设计 [1] - 在精准医疗领域 AI通过深度神经网络模型优化 将基因编辑准确率从传统方法的85%提升至98%以上 [1] - AI在疾病早筛、影像辅助判读、靶点发现及药物合成路径优化中展现显著效率优势 正加速重塑医疗价值链 [2] 行业挑战与治理 - 医疗数据高度敏感、决策后果不可逆、责任归属复杂 决定了行业不能仅追求技术性能 更需实现人机对齐的深度治理 [2] - 人机对齐指通过算法透明、伦理约束、监管协同等机制 确保AI行为逻辑与人类医学准则和社会价值一致 [2] 未来发展方向 - 行业发展将不仅取决于算力与数据规模 更考验企业在合规性设计与跨学科整合上的战略能力 [2] - AI、5G、大数据等技术与生物信息学、纳米技术等领域深度融合 催生了AI制药、医药外包组织及中药科创等新兴领域 [2] - 政策驱动下 中国生物科技领域正迎来系统性支持 形成以全链条协同创新、资本生态重构、审评审批提速、支付机制改革为核心的四大支柱 [2]
有了赛博医生,就不用怕过度诊疗?
虎嗅APP· 2025-06-03 21:52
核心观点 - AI在医疗领域存在系统性偏见,导致不同人群获得差异化诊疗服务,高收入人群更易获得CT和核磁检查,中低收入人群则被安排基本检查或不检查[2][3] - 医疗数据质量问题和人类医疗活动中的无意识偏见是AI偏见的根源,包括数据代表性不足、标注质量不高以及医生对女性患者的疼痛评分低于男性患者等[8][9] - 人机对齐技术如RAG、RLHF被用于减少AI偏见,但成本高昂且效果有限,OpenAI超级对齐团队因消耗20%算力而解散[15][16] - 医疗行业需要从以疾病为中心转向以病人整体为中心,功能医学等整体医学分支和新技术如可穿戴设备有助于减少过度诊疗[20][21] AI在医疗领域的偏见表现 - 美国西奈山伊坎医学院研究发现,高收入人群获得CT和核磁检查的机会更高,无住房患者更频繁被指向紧急护理和侵入性干预[2][3] - AI仅凭X射线就能预测患者种族和性别信息,导致比人类医生更精于"看人下菜碟"[3] - 女性患者疼痛评分比男性低10%,心梗误诊率高出50%,候诊时间比男性长30分钟[9] 数据质量问题 - 医疗数据代表性不足,经济收入较低人群和特殊人群如儿童、孕妇数据较少[8] - 数据标注质量不高,存在个人偏见和主观判断,标注标准不统一[8] - 中国女性肺癌患者过度诊疗率从2011-2015年的22%增长至2016-2020年的50%,女性肺腺癌患者中近90%是过度诊断[11] 人机对齐技术 - 人机对齐技术包括训练阶段增加数据过滤、指令微调、奖励函数等[15] - RAG(检索增强生成)、RLHF(基于人工反馈的强化学习)是人机对齐工具[15] - OpenAI超级对齐团队计划消耗20%算力,但因成本过高而解散[16] 医疗行业转型 - 精准医疗和过度医疗之间存在灰色地带,需要足够多的数据来明确边界[19] - 功能医学需要检测200多项指标来绘制健康地图,关注整体健康而非单一疾病[20] - 打破信息不对称可减少过度诊疗达40%,新技术如可穿戴设备有助于压缩过度诊疗空间[21]
有了赛博医生,就不用怕过度诊疗?
虎嗅· 2025-06-03 09:03
医疗AI偏见问题 - 大模型在医疗诊断中表现出基于收入水平的偏见 高收入人群更可能获得CT和核磁检查机会 中低收入病例通常只进行基本检查或不检查[1] - 住房状况影响诊疗决策 无住房患者更频繁被指向紧急护理 侵入性干预或心理健康评估[2] - 研究覆盖9个自然语言大模型 评估1000个急诊病例(500真实+500合成)的170万个看诊结果[2] 数据质量缺陷 - 医疗数据存在代表性不足问题 经济收入较低人群就诊频率低导致数据缺失 儿童孕妇等特殊人群药物研究数据不足[6] - 数据标注质量存在偏差 标注时带有个人偏见和主观判断 数据标注标准不统一[6] - 医疗活动本身存在无意识偏见 女性患者疼痛评分概率比男性低10% 女性心梗患者误诊几率高出男性50%[7][8] 技术局限性 - AI仅凭X射线就能预测患者种族性别信息 比人类医生更精于"看人下菜碟"[2] - 临床医生使用有系统偏见的AI模型时 诊疗准确性显著下降11.3%[4] - 生成式人工智能本质是概率模型 小概率损害事件难以避免 对容错率趋近零的医疗行业构成挑战[12] 人机对齐解决方案 - 通过RAG检索增强生成和RLHF基于人工反馈的强化学习等技术 在大模型中注入人类价值观[11] - 训练阶段增加数据过滤环节 加入指令微调让模型理解人类语言 利用奖励函数引导符合价值观的回答[11] - OpenAI超级对齐团队原计划消耗20%算力解决对齐问题 但项目最终解散[12] 医疗体系升级需求 - 精准医疗与过度医疗存在灰色地带 需要足够多数据来清晰界定边界[14][15] - 功能医学需要检测200多项指标来绘制健康地图 强调从以疾病为中心向以病人整体为中心转变[16] - 患者跨机构交叉验证诊断方案可使过度医疗降幅达40% 可穿戴设备和AI技术正在压缩过度诊疗空间[17] 医学发展现状 - 中国女性肺癌患者过度诊疗率从2011-2015年22%增长至2016-2020年50% 女性肺腺癌患者近90%属过度诊断[8] - 西医分科制度存在局限性 如皮肤科与消化科缺乏交集导致湿疹病因难以识别[16] - 许多生理性改变如7mm以下肺结节 甲状腺结节 窦性心律等并不需要过度关注或治疗[17]
医疗AI 必须以“人机对齐”为前提
经济网· 2025-04-30 10:21
AI伦理治理体系化推进 - 我国提出《全球人工智能治理倡议》并出台《科技伦理审查办法(试行)》,工信部正在研究编制人工智能科技伦理服务管理办法,标志着AI伦理治理进入体系化推进阶段 [2] - 医疗AI需要解决人机对齐问题才能成为可信赖的医疗助手 [2] 人机对齐技术 - 人机对齐是通过技术手段与伦理框架让AI的目标、行为和输出与人类价值观、社会规范一致,是"技术人性化"的准入要求 [3] - 人机对齐在医疗领域有三大核心作用:可解释性、信任性和人类和谐性 [4][5] - 人机对齐技术如RLHF、RAG已被主流模型采用,RLAIF方法可解决人类专家标注耗时长的问题 [6] 医疗AI特殊性 - 医疗AI具有数据敏感性、结果不可逆性和责任主体复杂性三大特殊性 [7] - 医疗数据包含敏感信息,受GDPR、HIPAA和《个人信息保护法》等法规严格保护 [7] - 医疗AI必须追求"零失误",需清晰界定责任主体 [7] 医疗AI伦理合规措施 - 应从技术架构、数据集建设、医院管理、患者知情和行业监管五大环节协同发力 [7] - 技术架构环节需在预训练阶段引入"医学伦理知识图谱",微调阶段通过人工反馈强化学习 [7][9] - 数据集建设环节需运用隐私计算技术实现数据"可用不可见",设立"数据过滤器"屏蔽不良数据源 [9] - 医院管理环节需实施"双保险机制",高风险场景AI建议需医生实时复核 [9] - 患者知情环节需提供"可理解的AI决策报告",保障患者否决权 [9] - 行业监管环节需建立国家统一的医疗AI对齐认证标准体系,开展"红蓝对抗演练"等测试 [10] 数据飞轮机制 - "数据飞轮"是用户对AI输出进行标注反馈从而实现模型持续优化的闭环机制 [11] - 医疗AI应建立"数据飞轮"机制,形成"模型输出评估—数据收集—应用反馈—模型优化"闭环 [11] - 需建立准入机制确保数据干净合规,激励机制让数据共享双向受益 [12]