Scaling Law(规模定律)
搜索文档
Altman承认“搞砸了”!曝 GPT-5.2 牺牲写作换顶级编程,明年成本降 100 倍,实锤Agent 已能永久干活
AI前线· 2026-01-27 11:50
OpenAI战略方向与模型发展蓝图 - OpenAI正在引领行业进入一个智力成本极低、软件形态从“静态”转向“即时生成”的剧变期[4] - 公司承认在GPT-5.2的研发中“搞砸了”写作能力的优先级,将有限算力资源倾斜于推理、编码和工程能力等硬核智力指标[4][8] - 公司战略重心是通过Scaling Law先攻克人类智力的最高地带,再回头填补审美和表达的细节,最终在全维度实现“智力平权”[5] - 公司目标是到2027年底,让GPT-5.2级别的智力成本至少降低100倍[5][11] - 公司认为智力是一种“可塑的资源”,当模型具备顶级推理引擎后,写作等能力的回归只是时间问题[5][9] 成本、速度与未来软件形态 - 市场出现微妙转向,开发者对“速度”的渴求正在超越对“成本”的关注,特别是当智能体处理长程任务时[6][11] - OpenAI未来可能提供两种路径:一种是极致廉价的“智力自来水”,另一种是极速反馈的“智力推进器”[6] - 未来的软件不应是静态的,计算机应能直接生成“即时应用”来解决特定问题,形成“随需随生、用完即弃”的模式[6][7] - 软件将根据用户习惯进行极致定制,工具会不断进化并向个人需求收敛,最终形成独属于个人的、动态进化的生产力系统[7][12] - 在OpenAI内部,员工已习惯用编程模型来定制自己的工作流,每个人的工具都完全不同[12] 对创业者与开发者的建议 - 建立成功初创公司的核心规则未变,仍需解决获客、市场策略、创造粘性及形成网络效应等问题[13] - 创业者应构建“模型越强,产品就越强”的业务,避免只在模型边缘做“小补丁”[13] - 对于智能体执行长流程任务,开发者应先拆解任务,让智能体能够自我验证每一个中间步骤,再逐步扩大其职责范围[14] - 目前通过SDK运行的特定任务已经可以近乎永久地运行下去,实现长期自主运行的关键在于任务复杂度和理解深度[13][14] AI的能力边界与科研应用 - AI模型本质上是一个“通用推理引擎”,未来的里程碑是模型能通过一次解释或自主探索,极其可靠地学会使用全新的环境、工具或技术[16] - 当前的AI对科学家而言像是“无限量的博士后”,能帮助同时探索多个新问题,进行广度搜索[17] - 实现完全闭环的自主科研仍有很长的路要走,顶尖研究者仍需深度参与以纠正模型的直觉偏差[17] - 在物理实验方面,倾向于构建一个由全球科研社区贡献实验数据的、更分布式、更聪明、更高效的科研生态,而非公司自建自动化实验室[17] - GPT-5.2已经让内部科学家感受到了非平庸的科学进展[15] AI安全与治理范式转变 - 在AI安全,尤其是生物安全领域,世界需要完成一次根本性的转变:从“封堵”转向“韧性”[19] - 类比火灾安全,社会需要制定规范、发明阻燃材料并建立体系来提高对AI潜在风险的韧性,而非仅仅试图禁止或限制[19] - AI在生物恐怖主义和网络安全方面会成为真实的问题,但同时也是这些问题的重要解决方案[19] - 如果2026年AI出现一次“明显、严重”的失败事件,生物安全是一个相当合理的“风险爆点”方向[20] - 需要全社会层面的努力来建设具有韧性的基础设施,而非依赖少数受信任的实验室封堵风险[20] AI对社会协作与教育的影响 - 在一个充满AI的世界里,人与人之间的连接会变得更有价值,而不是更没价值[24] - AI会以前所未有的方式让多人协作成为可能,例如五人团队与一个AI共同工作,生产力会被大幅放大[24] - 总体上反对在幼儿园阶段使用电脑和AI,认为该阶段应注重户外活动、接触真实物体和人际互动[30] - 当前的教育体系需要改变教学和评估思考能力的方式,以适应AI工具的存在,而非假装其不存在[23] - 那10%极端自学能力很强的学习者已表现出色,需要找到新方式重构课程体系以带动其他学生[23] Agent大规模部署的潜在风险 - 随着智能体开始大规模运行并直接操作生产系统,最被低估的风险是人们因其强大的能力和便利性而放松警惕[25][26] - 工具的失败概率可能很低,但一旦失败,后果可能是灾难性的,例如在系统中埋下安全漏洞[26] - 随着模型变强、变复杂,如果存在微妙的错位或在长期使用后出现新的系统性问题,风险会加剧[26] - 围绕构建整体性的安全基础设施,本身值得诞生一家伟大的公司[28] - 人们可能会习惯并信任某个阶段的模型行为,却没有构建足够健全的安全设施,从而在不知不觉中走向危险状态[26][27]
对话:“扎堆上市”后,具身智能还值得投资吗?
36氪· 2025-12-23 18:29
行业热度与融资动态 - 具身智能是2025年全球最热门的创新创业领域之一,多家新创公司迅速成为估值超10亿美元的“独角兽”[1] - 2025年上半年,该领域的融资额已超2024年全年[1] - 2025年12月19日,人形机器人公司银河通用完成超3亿美元新一轮融资,刷新单轮融资纪录,估值超200亿元,超越宇树科技6月融资时的120亿元估值和智元3月融资时的150亿元估值[1] - 截至2025年11月,已有近30家机器人产业链公司向港交所递交上市申请[1] - 传统制造业、汽车、手机及互联网公司均在跨界进入该领域[1] - 国家发改委于2025年11月底提示,中国人形机器人公司已超150家,其中半数以上为初创或“跨行”入局,需防范产品重复“扎堆”上市及研发空间被压缩的风险[1] 投资逻辑与行业阶段认知 - 投资人认为具身智能仍处于非常早期的阶段,需要更多耐心与投入,行业大幕刚刚拉开[2][4][6] - 投资逻辑更关注行业底层技术的微小跃升,而非即刻的产线应用[6] - 具身智能的长期愿景是“解放人的生产力”,以可负担的成本让大众享受如保姆、司机等服务[2][7] - 该领域被视为至少以十年为周期的长跑[4] - 针对市场过热与“泡沫”的讨论,投资人认为当前投入不是太多而是太少,需要更多人才与资金以引领进步[9][10] - “扎堆上市”现象部分源于“泛概念”公司更名蹭热点,需要监管引导以分辨“新质生产力”[10] - 投资实践会让初期可能存在的“泡沫”变得越来越薄,最终转化为真正的价值输出[11] 中美发展对比与中国特色优势 - 中国在硬件储备、产业链响应速度和工程化人才上具备明显优势,能更快做出可落地的成绩[4][8] - 在算法原创性上与美国尚有差距,但在软硬件结合与产业化程度上全球领先[4][8] - 中国在特定落地场景收集数据的难度和成本比海外竞争对手更低,这是一项优势[13] - 美国Figure AI一家公司在2024年的融资金额可能超过中国整个行业,显示资金投入的差距[9] - 中国创业者跟进学术发展和落地可实现的能力在变强,参与全球竞争没有问题[11][13] - 行业发展可参考中国新能源车产业从追赶至领先全球的发展规律[10] 代表性公司与技术路径 - 特斯拉因其灵魂人物和完整逻辑闭环(电车自动驾驶验证映射至机器人)而备受关注,但其交付情况仍需观察[12] - Figure AI的演示(Demo)具有好莱坞大片级质感,其背后体现了“讲故事”(story telling)和想象力的重要性[14][15] - 除Figure AI外,Physical Intelligence (Pi)公司在大脑(软件算法)方面也很领先,受到国内公司关注[12] - 技术路径尚未收敛,存在真机数据派、合成数据派等不同探索方向,争论价值有限,重点应集中于实现最终目标[15] - 行业存在不同“流派”,大致可分为可移动人形机器人和专注于精细操作的机器人两类[16] 商业化进展与未来展望 - 目前尚不能说哪家产品能在具体场景解决复杂问题并高过人工效率,但部分被投公司技术进步迅速,成功率有望通过训练提高至超过90%[16] - 行业遵循“沿途下蛋”模式,技术解锁部分场景即可提供价值,在工业产线、酒店服务等领域已取得可喜进步[17] - 预计2026年在可商用化方面会有越来越清晰的苗头[17] - 在文娱场景(如拳击赛、长跑、跳舞)中,机器人的运动能力已达到惊艳水准,体现了产业链快速的集成迭代[19] - 让投资人兴奋的突破往往来自底层技术进步,如灵巧手更精细、电机参数变强、积累更多真机数据(如20万小时)等,这些可能受规模定律(Scaling Law)驱动产生更大阶跃[20] - 该行业需要较大资金量,早期公司估值已接近传统中后期(PE阶段)投资,但它们仍是需要大量资源投入的“小苗子”[21]
地平线苏箐:未来三年 自动驾驶行业将告别范式迭代狂飙
中国经营报· 2025-12-11 12:28
行业技术范式变革 - FSD V12的发布成为自动驾驶行业的分水岭 其端到端架构实现了从“光子输入”到“控制输出”的全链路神经网络决策 将深度学习的应用从感知延伸至规控 完成了技术革命的闭环 [2][3] - 此前行业技术仅完成一半 深度学习仅重构了感知环节 决策规控仍依赖规则主导 这种半吊子的技术重构仅能发挥20%—30%的效能 [2] - 新范式打通了L2与L4的技术壁垒 让两者得以共享开发体系、传感器配置与ODD区域方案 [3] 未来发展趋势判断 - 未来三年 自动驾驶行业将告别范式迭代的狂飙 进入极致优化的“苦日子” [2][3] - 当前深度学习已显露天花板迹象 AGI基础理论暂无突破信号 下一轮内核重构至少还需5—20年的技术沉淀 [3] - 假设AI/AGI理论在未来3—5年没有全新突破 产业将进入技巧型优化演进状态 [3] 公司战略与应对之策 - Scaling Law在自动驾驶领域刚刚开始 公司将推动每代AD产品实现10倍算力提升 支撑10倍参数规模的系统进化 [3] - 以统一的底层技术范式 重点投入城区L2与L4两大关键节点 并持续强化工程体系与组织能力建设 [3] - 核心命题是将现有技术潜力发挥到极致 包括持续提升芯片算力与模型容量 以统一范式推进L2到L4的融合 [4] - 目标让城市L2从20万级车型下探至10万级市场 让准L4系统以平民化价格走进大众 [4] 行业现状与挑战 - 研发团队承受智力与体力的双重压榨 数亿元投入未能“激起水花” [2] - 行业面临稠密场景下的海量corner case、紧迫的SOP时限 一度陷入路径迷茫 [2] - 未来阶段需要应对海量长尾场景的打磨 强化工程与组织能力是穿越周期的关键 [4] 行业终极目标 - 自动驾驶的终极目标是造出能替代人类司机的机器 [4] - 在范式革命之后 行业考验的是沉下心来做“精活”的耐力 [4] - 未来几年内的意义在于 能够把L4级别的车以平民化的价格送到用户手上 [4]
「紫荆智康」获近亿元天使轮融资,加速AI医院系统开发及落地 | 36氪首发
36氪· 2025-11-11 08:04
公司融资与背景 - 公司完成近亿元天使轮融资,由星连资本领投,英诺天使和尚势资本跟投,资金将主要用于紫荆AI医院系统的研发、迭代与升级 [1] - 公司成立于2024年9月,由清华大学智能产业研究院孵化,清华大学计算机系教授刘洋发起,并获得清智资本种子轮投资 [1] 核心技术:AI医院系统 - 核心逻辑为模拟真实医院设施和流程,构建超拟人、广分布、多样化的AI患者以满足初始训练数据需求,进而开发具备自我进化功能的AI医生,最终打通用户全周期健康管理 [1] - 采用“基于拟像的可进化智能体”技术路径,利用“大模型+医学知识库+少量病例库样例”通过多步逆采样自动合成病例,并将合成病例转化为AI虚拟患者 [2] - 已构建超50万个AI患者,覆盖不同国家、年龄段与疾病类型,作为训练AI医生的重要补充路径 [2] - 团队设计了特定的记忆与反思算法机制,使AI医生能在问诊闭环中积累“经验”,其能力进化曲线初步符合规模定律 [3] - 已研制42位AI医生,在国际权威MedQA数据集上准确率超过96%,超过人类医生平均水平 [3] 产品功能与进展 - 产品设置患者端APP、医生端工作站和医院系统三个端口,实现“院前-院中-院后”全周期闭环管理 [3] - 诊前患者可线上挂号并通过AI机器人完成智能预问诊、生成结构化病历;诊中AI医生为真人医生提供检查、诊断建议;诊后系统管理患者健康档案并提供咨询与解读服务 [3] - 紫荆AI医院系统于2025年6月30日发布,并于同年8月在清华大学医院部分科室开展内部测试 [4] - 计划于2025年底开展系统公开测试,测试范围将从北京扩展至全国更多城市,涵盖不同等级医院及更多科室 [4] 行业背景与政策 - AI赋能医疗领域长期面临数据资产合规性、产品商业化落地等痛点 [1] - 2025年10月国家相关部门印发促进“人工智能+医疗卫生”应用发展的实施意见,公司发展方向与文件精神高度契合 [4] 投资方观点 - 投资方认可公司在技术上具备原创性突破,其“虚拟医院+可进化智能体”技术路径突破了医疗数据瓶颈 [5][6] - 投资方看好公司通过智能体技术重塑医疗效率与公平性,以及其背靠清华资源与享受国家政策红利的优势 [5][6]
模型训练最重要的依然是 Scaling —— 对话阿里通义千问 Qwen 多语言负责人杨宝嵩 | Open AGI Forum
AI科技大本营· 2025-06-25 14:49
通义千问多语言战略 - 通义千问(Qwen)从项目启动就将国际化作为核心战略,优先考虑多语言数据优化以服务全球用户[2][9] - 模型支持全球119种语言,在Hugging Face平台下载量位居前列,衍生模型数超过10万个[2][6] - 英语社区用户量最大,中文用户仅排第三或第四,体现其国际化影响力[8][9] 多语言技术突破 - 建立覆盖上千细粒度分类的文化标注体系,解决不同语言文化禁忌与安全合规问题[3][13] - 采用"英语内部推理+目标语言输出"的折中方案应对多语言混杂难题,提升小语种稳定性[16] - 通过数据合成与人工审核结合提升低资源语言数据质量,文化对齐投入占研发重要比重[14][16] 模型能力演进方向 - 提出"知识密度"概念,4B参数小模型性能已超越早期70B大模型,反映数据质量优化成效[19][20] - 持续探索Scaling Law延续路径,重点布局合成数据两大方向:创造新知识与提升数据纯度[21][22] - 针对"数据回流"现象采取混合比例控制,保留人类数据多样性避免模型风格趋同[25] 产品生态布局 - 采取大小模型并行策略,4B级小模型适配终端设备部署需求,已应用于车载、穿戴设备场景[26][28] - 与硬件厂商合作开发Mobile-Agent系统,实现视觉操作手机等基础功能,复杂场景仍需技术突破[30][31] - 规划将语音翻译、文字识别等能力深度集成至操作系统,但涉及安全的核心功能保持审慎[32][34] 行业趋势展望 - 多语言技术面临三大挑战:文化多样性对齐、小语种生成流畅度、多模态融合[39][41][43] - 合成数据与跨模态迁移被视为解决小语种数据匮乏的关键路径,需社区共建高质量数据集[42][45] - AI技术替代催生新职业形态,如AI编程师、Prompt工程师等协同型岗位将成就业增长点[37][38]
智谱发布智能体产品“AutoGLM沉思” 公司CEO张鹏:智能体也存在规模定律
每日经济新闻· 2025-03-31 14:07
产品发布与核心能力 - 公司于3月31日中关村论坛正式发布具备深度研究和实际操作能力的智能体“AutoGLM沉思”,推动人工智能Agent进入“边想边干”阶段 [1] - 智能体展现出自主规划能力,例如在未经专门训练的情况下,能规划通过访问巨潮资讯网来收集指定研报的解决方案 [1] 技术演进与模型参数 - “AutoGLM沉思”的技术演进路径为:GLM-4基座模型→GLM-Z1推理模型→GLM-Z1-Rumination沉思模型→AutoGLM模型 [1] - 公司基于最新技术积累,重新训练了参数规模达320亿的基座模型GLM-4-Air-0414,该模型在工具调用、联网搜索等智能体任务上能力大大加强 [2] - GLM-4-Air-0414模型在预训练阶段加入了更多代码类和推理类数据,并在对齐阶段针对智能体能力进行了优化 [2] 行业洞察与生态战略 - 公司CEO提出Agent存在类似Scaling Law的特点,通过扩展训练时的推理计算,Agent性能会更强 [1] - 公司计划于4月14日正式开源核心链路的模型和技术,以此推动行业生态发展 [1]