Scaling Law（规模定律） - 财报，业绩电话会，研报，新闻

Scaling Law（规模定律）

搜索文档

Altman承认“搞砸了”！曝 GPT-5.2 牺牲写作换顶级编程，明年成本降 100 倍，实锤Agent 已能永久干活

AI前线· 2026-01-27 11:50

OpenAI战略方向与模型发展蓝图 - OpenAI正在引领行业进入一个智力成本极低、软件形态从“静态”转向“即时生成”的剧变期[4] - 公司承认在GPT-5.2的研发中“搞砸了”写作能力的优先级，将有限算力资源倾斜于推理、编码和工程能力等硬核智力指标[4][8] - 公司战略重心是通过Scaling Law先攻克人类智力的最高地带，再回头填补审美和表达的细节，最终在全维度实现“智力平权”[5] - 公司目标是到2027年底，让GPT-5.2级别的智力成本至少降低100倍[5][11] - 公司认为智力是一种“可塑的资源”，当模型具备顶级推理引擎后，写作等能力的回归只是时间问题[5][9] 成本、速度与未来软件形态 - 市场出现微妙转向，开发者对“速度”的渴求正在超越对“成本”的关注，特别是当智能体处理长程任务时[6][11] - OpenAI未来可能提供两种路径：一种是极致廉价的“智力自来水”，另一种是极速反馈的“智力推进器”[6] - 未来的软件不应是静态的，计算机应能直接生成“即时应用”来解决特定问题，形成“随需随生、用完即弃”的模式[6][7] - 软件将根据用户习惯进行极致定制，工具会不断进化并向个人需求收敛，最终形成独属于个人的、动态进化的生产力系统[7][12] - 在OpenAI内部，员工已习惯用编程模型来定制自己的工作流，每个人的工具都完全不同[12] 对创业者与开发者的建议 - 建立成功初创公司的核心规则未变，仍需解决获客、市场策略、创造粘性及形成网络效应等问题[13] - 创业者应构建“模型越强，产品就越强”的业务，避免只在模型边缘做“小补丁”[13] - 对于智能体执行长流程任务，开发者应先拆解任务，让智能体能够自我验证每一个中间步骤，再逐步扩大其职责范围[14] - 目前通过SDK运行的特定任务已经可以近乎永久地运行下去，实现长期自主运行的关键在于任务复杂度和理解深度[13][14] AI的能力边界与科研应用 - AI模型本质上是一个“通用推理引擎”，未来的里程碑是模型能通过一次解释或自主探索，极其可靠地学会使用全新的环境、工具或技术[16] - 当前的AI对科学家而言像是“无限量的博士后”，能帮助同时探索多个新问题，进行广度搜索[17] - 实现完全闭环的自主科研仍有很长的路要走，顶尖研究者仍需深度参与以纠正模型的直觉偏差[17] - 在物理实验方面，倾向于构建一个由全球科研社区贡献实验数据的、更分布式、更聪明、更高效的科研生态，而非公司自建自动化实验室[17] - GPT-5.2已经让内部科学家感受到了非平庸的科学进展[15] AI安全与治理范式转变 - 在AI安全，尤其是生物安全领域，世界需要完成一次根本性的转变：从“封堵”转向“韧性”[19] - 类比火灾安全，社会需要制定规范、发明阻燃材料并建立体系来提高对AI潜在风险的韧性，而非仅仅试图禁止或限制[19] - AI在生物恐怖主义和网络安全方面会成为真实的问题，但同时也是这些问题的重要解决方案[19] - 如果2026年AI出现一次“明显、严重”的失败事件，生物安全是一个相当合理的“风险爆点”方向[20] - 需要全社会层面的努力来建设具有韧性的基础设施，而非依赖少数受信任的实验室封堵风险[20] AI对社会协作与教育的影响 - 在一个充满AI的世界里，人与人之间的连接会变得更有价值，而不是更没价值[24] - AI会以前所未有的方式让多人协作成为可能，例如五人团队与一个AI共同工作，生产力会被大幅放大[24] - 总体上反对在幼儿园阶段使用电脑和AI，认为该阶段应注重户外活动、接触真实物体和人际互动[30] - 当前的教育体系需要改变教学和评估思考能力的方式，以适应AI工具的存在，而非假装其不存在[23] - 那10%极端自学能力很强的学习者已表现出色，需要找到新方式重构课程体系以带动其他学生[23] Agent大规模部署的潜在风险 - 随着智能体开始大规模运行并直接操作生产系统，最被低估的风险是人们因其强大的能力和便利性而放松警惕[25][26] - 工具的失败概率可能很低，但一旦失败，后果可能是灾难性的，例如在系统中埋下安全漏洞[26] - 随着模型变强、变复杂，如果存在微妙的错位或在长期使用后出现新的系统性问题，风险会加剧[26] - 围绕构建整体性的安全基础设施，本身值得诞生一家伟大的公司[28] - 人们可能会习惯并信任某个阶段的模型行为，却没有构建足够健全的安全设施，从而在不知不觉中走向危险状态[26][27]

对话：“扎堆上市”后，具身智能还值得投资吗？

36氪· 2025-12-23 18:29

行业热度与融资动态 - 具身智能是2025年全球最热门的创新创业领域之一，多家新创公司迅速成为估值超10亿美元的“独角兽”[1] - 2025年上半年，该领域的融资额已超2024年全年[1] - 2025年12月19日，人形机器人公司银河通用完成超3亿美元新一轮融资，刷新单轮融资纪录，估值超200亿元，超越宇树科技6月融资时的120亿元估值和智元3月融资时的150亿元估值[1] - 截至2025年11月，已有近30家机器人产业链公司向港交所递交上市申请[1] - 传统制造业、汽车、手机及互联网公司均在跨界进入该领域[1] - 国家发改委于2025年11月底提示，中国人形机器人公司已超150家，其中半数以上为初创或“跨行”入局，需防范产品重复“扎堆”上市及研发空间被压缩的风险[1] 投资逻辑与行业阶段认知 - 投资人认为具身智能仍处于非常早期的阶段，需要更多耐心与投入，行业大幕刚刚拉开[2][4][6] - 投资逻辑更关注行业底层技术的微小跃升，而非即刻的产线应用[6] - 具身智能的长期愿景是“解放人的生产力”，以可负担的成本让大众享受如保姆、司机等服务[2][7] - 该领域被视为至少以十年为周期的长跑[4] - 针对市场过热与“泡沫”的讨论，投资人认为当前投入不是太多而是太少，需要更多人才与资金以引领进步[9][10] - “扎堆上市”现象部分源于“泛概念”公司更名蹭热点，需要监管引导以分辨“新质生产力”[10] - 投资实践会让初期可能存在的“泡沫”变得越来越薄，最终转化为真正的价值输出[11] 中美发展对比与中国特色优势 - 中国在硬件储备、产业链响应速度和工程化人才上具备明显优势，能更快做出可落地的成绩[4][8] - 在算法原创性上与美国尚有差距，但在软硬件结合与产业化程度上全球领先[4][8] - 中国在特定落地场景收集数据的难度和成本比海外竞争对手更低，这是一项优势[13] - 美国Figure AI一家公司在2024年的融资金额可能超过中国整个行业，显示资金投入的差距[9] - 中国创业者跟进学术发展和落地可实现的能力在变强，参与全球竞争没有问题[11][13] - 行业发展可参考中国新能源车产业从追赶至领先全球的发展规律[10] 代表性公司与技术路径 - 特斯拉因其灵魂人物和完整逻辑闭环（电车自动驾驶验证映射至机器人）而备受关注，但其交付情况仍需观察[12] - Figure AI的演示（Demo）具有好莱坞大片级质感，其背后体现了“讲故事”（story telling）和想象力的重要性[14][15] - 除Figure AI外，Physical Intelligence (Pi)公司在大脑（软件算法）方面也很领先，受到国内公司关注[12] - 技术路径尚未收敛，存在真机数据派、合成数据派等不同探索方向，争论价值有限，重点应集中于实现最终目标[15] - 行业存在不同“流派”，大致可分为可移动人形机器人和专注于精细操作的机器人两类[16] 商业化进展与未来展望 - 目前尚不能说哪家产品能在具体场景解决复杂问题并高过人工效率，但部分被投公司技术进步迅速，成功率有望通过训练提高至超过90%[16] - 行业遵循“沿途下蛋”模式，技术解锁部分场景即可提供价值，在工业产线、酒店服务等领域已取得可喜进步[17] - 预计2026年在可商用化方面会有越来越清晰的苗头[17] - 在文娱场景（如拳击赛、长跑、跳舞）中，机器人的运动能力已达到惊艳水准，体现了产业链快速的集成迭代[19] - 让投资人兴奋的突破往往来自底层技术进步，如灵巧手更精细、电机参数变强、积累更多真机数据（如20万小时）等，这些可能受规模定律（Scaling Law）驱动产生更大阶跃[20] - 该行业需要较大资金量，早期公司估值已接近传统中后期（PE阶段）投资，但它们仍是需要大量资源投入的“小苗子”[21]

地平线苏箐：未来三年自动驾驶行业将告别范式迭代狂飙

中国经营报· 2025-12-11 12:28

行业技术范式变革 - FSD V12的发布成为自动驾驶行业的分水岭其端到端架构实现了从“光子输入”到“控制输出”的全链路神经网络决策将深度学习的应用从感知延伸至规控完成了技术革命的闭环 [2][3] - 此前行业技术仅完成一半深度学习仅重构了感知环节决策规控仍依赖规则主导这种半吊子的技术重构仅能发挥20%—30%的效能 [2] - 新范式打通了L2与L4的技术壁垒让两者得以共享开发体系、传感器配置与ODD区域方案 [3] 未来发展趋势判断 - 未来三年自动驾驶行业将告别范式迭代的狂飙进入极致优化的“苦日子” [2][3] - 当前深度学习已显露天花板迹象 AGI基础理论暂无突破信号下一轮内核重构至少还需5—20年的技术沉淀 [3] - 假设AI/AGI理论在未来3—5年没有全新突破产业将进入技巧型优化演进状态 [3] 公司战略与应对之策 - Scaling Law在自动驾驶领域刚刚开始公司将推动每代AD产品实现10倍算力提升支撑10倍参数规模的系统进化 [3] - 以统一的底层技术范式重点投入城区L2与L4两大关键节点并持续强化工程体系与组织能力建设 [3] - 核心命题是将现有技术潜力发挥到极致包括持续提升芯片算力与模型容量以统一范式推进L2到L4的融合 [4] - 目标让城市L2从20万级车型下探至10万级市场让准L4系统以平民化价格走进大众 [4] 行业现状与挑战 - 研发团队承受智力与体力的双重压榨数亿元投入未能“激起水花” [2] - 行业面临稠密场景下的海量corner case、紧迫的SOP时限一度陷入路径迷茫 [2] - 未来阶段需要应对海量长尾场景的打磨强化工程与组织能力是穿越周期的关键 [4] 行业终极目标 - 自动驾驶的终极目标是造出能替代人类司机的机器 [4] - 在范式革命之后行业考验的是沉下心来做“精活”的耐力 [4] - 未来几年内的意义在于能够把L4级别的车以平民化的价格送到用户手上 [4]

「紫荆智康」获近亿元天使轮融资，加速AI医院系统开发及落地 | 36氪首发

36氪· 2025-11-11 08:04

公司融资与背景 - 公司完成近亿元天使轮融资，由星连资本领投，英诺天使和尚势资本跟投，资金将主要用于紫荆AI医院系统的研发、迭代与升级 [1] - 公司成立于2024年9月，由清华大学智能产业研究院孵化，清华大学计算机系教授刘洋发起，并获得清智资本种子轮投资 [1] 核心技术：AI医院系统 - 核心逻辑为模拟真实医院设施和流程，构建超拟人、广分布、多样化的AI患者以满足初始训练数据需求，进而开发具备自我进化功能的AI医生，最终打通用户全周期健康管理 [1] - 采用“基于拟像的可进化智能体”技术路径，利用“大模型+医学知识库+少量病例库样例”通过多步逆采样自动合成病例，并将合成病例转化为AI虚拟患者 [2] - 已构建超50万个AI患者，覆盖不同国家、年龄段与疾病类型，作为训练AI医生的重要补充路径 [2] - 团队设计了特定的记忆与反思算法机制，使AI医生能在问诊闭环中积累“经验”，其能力进化曲线初步符合规模定律 [3] - 已研制42位AI医生，在国际权威MedQA数据集上准确率超过96%，超过人类医生平均水平 [3] 产品功能与进展 - 产品设置患者端APP、医生端工作站和医院系统三个端口，实现“院前-院中-院后”全周期闭环管理 [3] - 诊前患者可线上挂号并通过AI机器人完成智能预问诊、生成结构化病历；诊中AI医生为真人医生提供检查、诊断建议；诊后系统管理患者健康档案并提供咨询与解读服务 [3] - 紫荆AI医院系统于2025年6月30日发布，并于同年8月在清华大学医院部分科室开展内部测试 [4] - 计划于2025年底开展系统公开测试，测试范围将从北京扩展至全国更多城市，涵盖不同等级医院及更多科室 [4] 行业背景与政策 - AI赋能医疗领域长期面临数据资产合规性、产品商业化落地等痛点 [1] - 2025年10月国家相关部门印发促进“人工智能+医疗卫生”应用发展的实施意见，公司发展方向与文件精神高度契合 [4] 投资方观点 - 投资方认可公司在技术上具备原创性突破，其“虚拟医院+可进化智能体”技术路径突破了医疗数据瓶颈 [5][6] - 投资方看好公司通过智能体技术重塑医疗效率与公平性，以及其背靠清华资源与享受国家政策红利的优势 [5][6]

人工智能+医疗卫生

Scaling Law（规模定律）

人工智能医疗

紫荆AI医院（Agent Hospital）系统

人工智能+医疗卫生

Scaling Law（规模定律）

人工智能医疗

紫荆AI医院（Agent Hospital）系统

模型训练最重要的依然是 Scaling —— 对话阿里通义千问 Qwen 多语言负责人杨宝嵩 | Open AGI Forum

AI科技大本营· 2025-06-25 14:49

通义千问多语言战略 - 通义千问(Qwen)从项目启动就将国际化作为核心战略，优先考虑多语言数据优化以服务全球用户[2][9] - 模型支持全球119种语言，在Hugging Face平台下载量位居前列，衍生模型数超过10万个[2][6] - 英语社区用户量最大，中文用户仅排第三或第四，体现其国际化影响力[8][9] 多语言技术突破 - 建立覆盖上千细粒度分类的文化标注体系，解决不同语言文化禁忌与安全合规问题[3][13] - 采用"英语内部推理+目标语言输出"的折中方案应对多语言混杂难题，提升小语种稳定性[16] - 通过数据合成与人工审核结合提升低资源语言数据质量，文化对齐投入占研发重要比重[14][16] 模型能力演进方向 - 提出"知识密度"概念，4B参数小模型性能已超越早期70B大模型，反映数据质量优化成效[19][20] - 持续探索Scaling Law延续路径，重点布局合成数据两大方向：创造新知识与提升数据纯度[21][22] - 针对"数据回流"现象采取混合比例控制，保留人类数据多样性避免模型风格趋同[25] 产品生态布局 - 采取大小模型并行策略，4B级小模型适配终端设备部署需求，已应用于车载、穿戴设备场景[26][28] - 与硬件厂商合作开发Mobile-Agent系统，实现视觉操作手机等基础功能，复杂场景仍需技术突破[30][31] - 规划将语音翻译、文字识别等能力深度集成至操作系统，但涉及安全的核心功能保持审慎[32][34] 行业趋势展望 - 多语言技术面临三大挑战：文化多样性对齐、小语种生成流畅度、多模态融合[39][41][43] - 合成数据与跨模态迁移被视为解决小语种数据匮乏的关键路径，需社区共建高质量数据集[42][45] - AI技术替代催生新职业形态，如AI编程师、Prompt工程师等协同型岗位将成就业增长点[37][38]

Artificial Intelligence

Artificial Intelligence

通义千问（Qwen）

智谱发布智能体产品“AutoGLM沉思” 公司CEO张鹏：智能体也存在规模定律

每日经济新闻· 2025-03-31 14:07

产品发布与核心能力 - 公司于3月31日中关村论坛正式发布具备深度研究和实际操作能力的智能体“AutoGLM沉思”，推动人工智能Agent进入“边想边干”阶段 [1] - 智能体展现出自主规划能力，例如在未经专门训练的情况下，能规划通过访问巨潮资讯网来收集指定研报的解决方案 [1] 技术演进与模型参数 - “AutoGLM沉思”的技术演进路径为：GLM-4基座模型→GLM-Z1推理模型→GLM-Z1-Rumination沉思模型→AutoGLM模型 [1] - 公司基于最新技术积累，重新训练了参数规模达320亿的基座模型GLM-4-Air-0414，该模型在工具调用、联网搜索等智能体任务上能力大大加强 [2] - GLM-4-Air-0414模型在预训练阶段加入了更多代码类和推理类数据，并在对齐阶段针对智能体能力进行了优化 [2] 行业洞察与生态战略 - 公司CEO提出Agent存在类似Scaling Law的特点，通过扩展训练时的推理计算，Agent性能会更强 [1] - 公司计划于4月14日正式开源核心链路的模型和技术，以此推动行业生态发展 [1]