古德哈特定律
搜索文档
兰德公司:2025AI应用与行业转型报告,对医疗、金融服务、气候、能源及交通领域的影响
欧米伽未来研究所2025· 2025-09-26 11:17
报告核心观点 - AI已处于能力跃迁的拐点,其进展将重塑经济与社会关键部门[3] - 报告提出一套五级AI能力框架,用于跨行业比较和评估AI从基础任务到组织级决策复制的演进过程[2][3] - 报告系统梳理了AI在医疗、金融服务、气候与能源、交通运输四大领域的应用现状、能力跃迁与政策影响[2] AI能力框架 - Level 1“语言理解与基础任务”已实现,Level 2“增强推理与问题求解”涌现中,Level 3“复杂环境中的持续自治运行”、Level 4“创造性与创新能力”、Level 5“组织级人类决策流程的全面复制”属于未来态[3] - 该框架帮助政策制定者在不同行业与不同成熟阶段识别随能力升级而来的新型风险[3] 医疗健康行业 - AI总体仍处Level 1—2区间,实际采用以临床文书、病案编码、授权审批与收费等语言工作为主[5] - 美国FDA批准的AI医疗器械从2015年的22件增至2024年的940件,十年跃升四十余倍,但2020年仅约三成放射科医师报告在使用AI工具[5] - 截至2025年年中,尚无“AI设计药物”获得批准上市,从模型到药的最后一公里仍艰难[5] 金融服务行业 - AI有望带来更快的风控与个性化服务,但随着能力逼近Level 3“持续自治运行”,行业面临策略收敛、羊群效应与“同步化操作”等新型系统性风险[7] - 市场结构可能被重塑:头部平台凭借算力、数据与模型优势加速集中,提升“单点失灵”脆弱性;平台化服务同时有降低门槛、扩大普惠的可能[7] - 服务农村与低收入群体的小型机构因人财技短板难以及时获得AI红利[7] 气候与能源行业 - AI可通过电网优化、绿色投资规划与可再生能源并网调度等环节促进脱碳,但面临“越高效—越扩张—越排放”的“排放—生产率增长悖论”[8] - AI本身的用电飙升与数据中心扩张正与社区用能与绿色转型目标直接“争地盘”,暴露出现有电网的先天不足[8] - 加州独立系统运营商(CAISO)已试点使用AI软件开展实时分析并具备自治决策能力,用于管理停电等场景[8] 交通运输行业 - Level 1的驾驶辅助已成为标配,Level 2—3的能力正在货运与出行中扩展,例如Kodiak开展无人卡车运力运营,Waymo在加州获得无驾驶员载客许可[10] - AI在交管中心、信号优化、事件预测与资产巡检上的“系统级智能”开始形成网络效应,从“车端智能”进化为“路网智能”时贡献将呈指数级放大[10] 交叉性挑战 - 随着模型自主性增强,指标驱动的优化可能触发“古德哈特定律”加速效应,人类对系统的干预能见度与能动性可能被稀释[11] - “能力与资源的不均衡”可能导致AI红利难以及时惠及乡村医疗机构、小型银行和低收入社区,甚至加剧原有不平等[11] - “跨部门联动失败”的尾部风险可能演化为连锁冲击,例如电网AI缺陷外溢至金融清算与医疗服务等环节[11] 治理路径 - 报告主张将“AI能力分级”作为治理共用语言,实现监管强度与技术风险的“精准匹配”[12] - 跨行业层面建议系统刻画潜在冲击与关键系统之间的关系,明确角色分工与政策干预的“触发条件”[12] - 对于AI能耗与环境成本,主张将全生命周期评估纳入项目准入与投融资尽职调查,引导资本配置[12]
陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了
36氪· 2025-09-14 13:16
核心观点 - 人工智能公司Math开发的AI智能体Gauss在数学形式化验证领域取得重大突破 仅用三周时间完成陶哲轩等数学家18个月未能解决的强素数定理形式化挑战 展示出AI在复杂数学问题求解上的巨大潜力 [1][2][4][6] 技术突破 - Gauss作为首个协助顶级数学家进行形式验证的自动形式化Agent 能够将人类数学内容转换为机器可读的形式语言并验证正确性 [4][5] - 该智能体生成约25000行Lean代码 包含上千个定理和定义 这种规模的形式化证明传统上需要多年时间完成 [7] - 项目突破复分析核心难题 Gauss作为硅基生命可持续工作 极大压缩顶尖形式化专家的工作量 [6] 性能表现 - 相比历史上最大的单个形式化项目(最多50万行代码) Gauss的产出规模达到同数量级 [7] - Lean标准数学库Mathlib包含200万行代码和35万个定理 由600多位贡献者耗时8年完成 而Gauss三周的产出效率显著超越人类团队 [7] - 团队计划在未来12个月内将形式化代码总量提升100到1000倍 目标实现"可验证的超级智能"和"通才型机器数学家" [9] 基础设施 - 为支撑Gauss运行 团队与Morph Labs合作开发Trinity环境基础设施 [8] - 系统涉及数千个并发Agent 每个Agent拥有独立Lean运行环境 消耗数TB集群内存 属于复杂系统工程挑战 [8] 团队背景 - Math公司创始人Christian Szegedy为ICML'25时间检验奖得主 其2015年提出的Batch Normalization技术引用量超过6万次 是深度学习领域的里程碑突破 [13][15][17] 行业影响 - AI工具采用与人类截然不同的方法 可能专注于明确目标而忽略隐含目标 这要求项目组织者需要更明确阐述所有目标 [10][11] - 陶哲轩指出随着强大AI工具出现 需要重新评估形式化项目的多重目标 包括知识传承、社区建设等隐含价值 [10][11]
啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了
量子位· 2025-09-14 13:05
核心观点 - Gauss AI Agent在数学形式化领域取得突破性进展 仅用三周时间完成陶哲轩等人18个月未完成的强素数定理形式化挑战 展现AI在复杂数学验证任务中的巨大潜力 [1][2][8] 技术突破 - 生成约25000行Lean代码 包含上千个定理和定义 此类规模的形式化证明传统需多年完成 [10][11] - 项目规模达历史最大单个形式化项目的十分之一级别(历史最大项目为50万行代码) [12] - 对比Lean标准数学库Mathlib的200万行代码(35万个定理)由600多位贡献者耗时8年完成 Gauss效率显著提升 [13] 基础设施要求 - 与Morph Labs合作开发Trinity环境基础设施 支持数千个并发Agent运行 [14] - 每个Agent需独立Lean运行环境 集群内存消耗达数TB级别 属于复杂系统工程挑战 [14] 发展目标 - 计划未来12个月内将形式化代码总量提升100到1000倍 [16] - 致力于构建"可验证的超级智能"和"通才型机器数学家"新范式 [17] 团队背景 - 母公司Math由Christian Szegedy创立 其为2015年Batch Normalization技术共同发明人 [22][24] - Batch Normalization是深度学习从实验走向大规模实用化的关键技术之一 [26] 行业影响 - AI工具可能改变传统形式化项目中明确目标与隐含目标的实现方式 需重新定义项目目标体系 [18][19] - 陶哲轩指出AI优化算法可能专注于名义目标而忽略隐含目标(如社区建设、知识传承等) [19]
AI 创业,需要重读 Paul Graham 的「创业 13 条」
Founder Park· 2025-08-22 19:15
创业公司核心原则分析 - 创业公司成败几乎完全取决于创始人团队 联合创始人的重要性堪比房地产地段 想法可调整但更换联合创始人极其困难 [3][6] - 早期投资本质是投资创始人 创始人团队是创业公司最重要的资产 优秀团队的价值远大于个体成员总和 [7][8] - 团队是"非线性系统" 需考虑相对适配性 技能互补 目标一致 关系持久性 创始人散伙是创业失败常见原因 [8] 产品开发与市场验证 - 快速启动产品是核心原则 推出产品后才真正开始工作 之前都是浪费时间 产品推出能帮助理解用户需求 [3][9] - 采用"发布-学习-迭代"循环 接触真实用户前一切努力都是纸上谈兵 快速迭代促进快速成长 [9][10] - 避免"虚假精准感"和"掌控欲" 需要向现实低头顺势而为 创业需要持续迭代而非一次性交付 [10][11] 产品理念与用户聚焦 - 爱上问题而非解决方案 对交付方式保持灵活 随着产品成熟度和市场变化迭代解决方案 [12][13] - 采用"观点坚定 态度灵活"原则 基于现有认知坚定执行 但需根据市场反馈灵活调整 [13][14] - 理解用户是核心 创业本质是创造价值 最能掌控的维度是产品对用户生活的改善程度 [3][15] 增长策略与价值创造 - 专注于做出用户真正热爱的产品 而非单纯追求增长 用户增长路径取决于价值传递 [15][16] - 增长容易但理解用户核心需求困难 产品不解决用户问题则增长无意义 需先创造价值再谈增长 [16][17] - 创业原则往往反直觉 需先为一小群用户传递巨大价值 再考虑扩大影响 [17][18] 市场定位与用户服务 - 缩小目标用户范围至极致窄群体 在细分领域形成垄断再逐步扩大 满足部分用户全部需求优于满足所有用户部分需求 [19][20] - 提供超出预期的客户服务 无法规模化的客服是创业公司优势 能建立极强用户忠诚度 [21][22] - 用无法规模化的事为可规模化产品铺路 亲自做客服是用户探索的重要方式 [23][24] 指标衡量与资本效率 - 选对衡量指标至关重要 避免仅关注营收而忽略规模化潜力 需聚焦活跃用户数 CAC LTV等关键指标 [26][27] - 警惕古德哈特定律 当指标成为目标时就不再是好指标 指标只是核心目标的替代品 [27][28] - 专注资本使用效率 每分钱追求最大回报 低成本运营保持公司灵活敏捷 延长试错时间 [30][31] 融资与盈利能力 - 实现"泡面盈利"可改变与投资人关系 获得谈判筹码 但不适用于所有人生阶段 [32][33] - 让自己处于能对投资人说不的位置 不迫切需求资金反而更容易融资 [33][34] - 利用阶段优势 年轻时靠低成本生活 年长后靠经验和人脉 避免完全受制于投资人 [34][35] 专注力与持久力 - 避开内外干扰保持专注 创业核心是搞懂用户痛点并快速迭代 需要设计低干扰环境 [36][37][38] - 坚持是成功关键 面对挫折保持韧性 交易告吹不是个人否定 需记住初心持续前进 [39][40]
每个程序员必知的13条魔鬼定律:90%代码终将沦为垃圾
36氪· 2025-04-29 15:11
工程管理定律概述 - 文章系统梳理13条工程管理领域的经典定律,涵盖效率优化、团队协作、系统设计等维度,为技术管理者提供实战思维模型 [1][3][4] 效率管理定律 - 帕金森定律揭示工作会填满所有可用时间,设定合理截止日期可提升效率但需平衡范围、资源、时间三角关系 [5][6] - 侯世达定律指出项目耗时必然超预期,即使预留缓冲时间,建议时间估算需经历多次翻倍调整 [6][8] - 布鲁克斯定律警示延误项目增加人力反而降低效率,类比"9个女人无法1个月生育"生动说明边际效益递减 [10][11] 系统设计定律 - 康威定律表明系统架构会复刻组织沟通结构,Flo公司通过逆用该定律将发布周期从3周缩短至每日20-30次 [13][15] - 海勒姆定律揭示API所有可观察行为终将被用户依赖,导致功能删减阻力,需警惕功能开关滥用 [24] - 扎温斯基定律描述软件必然功能膨胀直至被更简方案取代,AI时代需防范非必要功能堆砌 [21][24] 团队效能定律 - 普莱斯定律量化团队产出分布:50%产出由总人数平方根成员贡献,100人团队中10人产出等同其他90人 [25] - 林格尔曼效应显示团队规模与个体效率负相关,1913年拔河实验证实,PostHog公司通过拆分为15个小团队提升效能 [26][27][29] - 古德哈特定律警示指标异化风险,代码行数等量化指标易被操纵而失真 [30][34] 实践方法论 - 坎宁安定律提出"错误诱导法"促进协作,故意提交问题PR可倒逼流程优化 [16][22] - 斯特金定律指出90%功能属无效投入,10倍工程师价值在于聚焦核心10%高价值产出 [18][20] - 吉尔布定律主张不完美测量优于无数据,与古德哈特定律形成制衡,开发者效能领域已实践此原则 [32][35][37] - 墨菲定律强调必须验证所有小概率事件,复杂边界案例未测试必导致生产事故 [38][40]