Workflow
规模定律
icon
搜索文档
2025乌镇互联网峰会:蚂蚁集团已部署万卡规模国产算力群
环球网· 2025-11-08 19:03
算力部署与技术能力 - 公司已部署万卡规模的国产算力集群,适配自研与主流开源模型 [1] - 训练任务稳定性超过98%,训练与推理性能可媲美国际算力集群 [1] - 算力资源全面应用于安全风控领域的大模型训练与推理服务 [1] 行业趋势与挑战 - 通用人工智能在"规模定律"推动下快速发展,部分能力已超越人类基准 [1] - 主流旗舰级语言大模型的训练数据量已超过20T,参数规模迈入"万亿"时代 [1] - 算力资源紧张与成本上升成为制约行业继续突破的关键因素 [1] 技术创新路径与成果 - 公司通过优化模型参数效率、数据应用效率、计算效率"三大效率"来提升模型响应速度与知识规模 [2] - 公司构建了涵盖语言、推理、多模态的全尺寸、全模态、全面开源的大模型体系 [2] - 全球首个开源的万亿思考大模型Ring-1T展现了领先的逻辑推理和代码能力,数学能力达国际数学奥林匹克竞赛银牌水平 [2] 效率提升与成本优化 - 通过创新训练方法,Ring-1T模型将训练效率提升了近一倍 [2] - 采用演进式思维链技术,在保障思考正确率的同时显著降低token资源消耗 [2] - 实现了任务效果与计算成本之间的"帕累托最优" [2] 发展理念与未来展望 - 公司认为理想的未来是AI助力人类放大能力,实现人机高度融合与协作 [2] - 在提升智能化水平的同时,强调确保AI技术遵循伦理与安全可信 [2]
张亚勤院士:AI五大新趋势,物理智能快速演进,2035年机器人数量或比人多
机器人圈· 2025-10-20 17:16
AI产业规模与代际演进 - 人工智能时代产业规模预计将比前一代(移动互联时代)至少大100倍[5] - 移动互联时代产业规模比PC互联时代至少大10倍[5] AI技术发展的五大新趋势 - 趋势一:AI技术从鉴别式、生成式走向智能体AI,过去7个月智能体AI任务长度翻倍且准确度超过50%[7] - 趋势二:预训练阶段规模定律放缓,更多工作转移至训练后阶段如推理和智能体应用,前沿模型智力上限仍在提升但迭代速度放缓[7] - 趋势三:物理智能和生物智能快速发展,VLA模型推动智能驾驶规模化落地,预计2030年10%车辆将具备L4功能[7] - 趋势四:AI风险快速上升,智能体出现使AI风险至少增加一倍[8] - 趋势五:AI产业新格局形成,呈现基础大模型+垂直模型+边缘模型架构,后两者未来发展空间更大[8] 大模型发展格局预测 - 预计2026年全球基础大模型约8-10个,中国占3-4个,美国占3-4个[8] - 中国大模型发展具独特性,表现为更快算法、更高效率、更低价格[8] - 未来开源模型将成为主流,开源与闭源模型比例预计为4:1[8] 成本与算力动态 - 过去一年推理成本降低10倍,但智能体复杂性使算力需求上涨10倍,形成乘数效应[7] 长期产业机遇 - 新一代人工智能是原子、分子和比特融合,是信息智能、物理智能和生物智能融合[3] - 具身智能快速爆发,预计2035年机器人数量有望超过人类[8]
专家:2035年机器人数量或比人多
21世纪经济报道· 2025-10-04 13:41
AI产业规模与代际演进 - 新一代人工智能是原子、分子和比特的融合,是信息智能、物理智能和生物智能的融合 [1] - 移动互联时代产业规模比PC互联时代至少大10倍,人工智能时代产业规模将比前一代至少大100倍 [1] AI产业发展五大新趋势 - 第一大趋势是从鉴别式AI到生成式AI,并走向智能体AI,过去7个月智能体AI的任务长度翻倍、准确度超过50% [3] - 第二大趋势是预训练阶段的规模定律(Scaling Law)放缓,更多工作转移至训练后阶段如推理和智能体应用,推理成本降低10倍,但智能体复杂性使算力上涨10倍 [3] - 第三大趋势是物理智能和生物智能快速发展,如VLA模型规模化落地智能驾驶,预计2030年10%的车辆将具备L4功能 [3] - 第四大趋势是AI风险快速上升,智能体出现后让AI风险至少增加一倍 [4] - 第五大趋势是AI呈现新的产业格局,形成基础大模型+垂直模型+边缘模型局面,未来更大发展在于垂直模型和边缘模型 [4] AI模型产业格局与预测 - 预计2026年全球基础大模型约有8至10个,其中中国有3至4个,美国有3至4个 [4] - 中国在发展大模型方面呈现独特性,表现为更快的算法、更高效率、更低的价格 [4] - 未来开源模型将成为主流,开源与闭源模型之间的比例预计约为4:1 [4] 具身智能发展预测 - 具身智能将快速爆发,预计到2035年机器人数量有望超过人类数量 [4]
揭秘小鹏自动驾驶「基座模型」和 「VLA大模型」
自动驾驶之心· 2025-09-18 07:33
小鹏自动驾驶技术方法论 - 提出自动驾驶软件3.0时代概念 即"AI模型即软件" 整个软件栈由端到端AI模型构成 基于以数据为中心的方法迭代[6] - 公司处于将整个自动驾驶软件栈构建为端到端AI模型驾驶汽车的阶段[8] - 基于规模定律(scaling law) 利用每天从数十万辆真实世界车辆收集的大量数据训练大型视觉模型作为"工厂"[8] 基础模型与部署架构 - 通过大数据构建基础模型 无需依赖三维空间先验知识和空间问题 类似世界模型概念[8] - 通过深度裁剪 量化 蒸馏将基础模型压缩为更小版本 部署到车端硬件[8] - 在云端构建VLA(视觉语言动作)基础模型 通过蒸馏剪枝和微调训练部署到车端[32] 内外循环训练机制 - 内循环为每个模型创建训练流 扩展数据后进行再训练和监督微调(SFT) 持续提升模型性能[9] - 外循环通过数十万辆车作为现实世界数据采样器 持续采样数据 根据返回数据持续训练(协同训练)[11] - 重复内外循环过程直至性能达到L4级自动驾驶 公司目标2026年实现L4级智驾车型量产[11][13] VLA模型训练方法 - 采用阿里Qwen作为原始VLM模型 使用公司整理的驾驶数据进行预训练和对齐[15] - 预训练数据分类包括静态交通元素 动态交通参与者 点对点轨迹数据 占用网络 交通信号灯和交通流信息[18] - 基于Chain-of-Thought思维链进行四步推理:提供基本驾驶知识 CoT SFT 强化学习CoT 考虑延迟的CoT SFT[22][23] 模型优化与安全强化 - 监督微调(SFT)建模为"指令遵循"任务 使用筛选的好数据专门训练导航 舒适刹车等专用指令[27] - 后期训练(post-training)采用强化学习解决长尾案例 建立奖励模型确保行动一致性[29] - 强化学习设计三重奖励机制:安全(避免碰撞) 效率(避免卡壳) 合规(遵守交通规则)[30] 行业竞争核心要素 - 底层算法和架构相通 行业差距取决于高质量数据 大算力以及算法产品化和工程落地能力[32] - VLA概念需要基础成熟的LLM作为底座 针对性训练交通驾驶行为[32] - 基础模型蒸馏上车思路可加速开发并快速部署到不同算力平台 但前提需要大算力和高质量数据[32]
本轮AI算力行情的驱动因素
淡水泉投资· 2025-09-17 18:06
AI算力投资趋势 - AI行情经历从ChatGPT突破到Sora浪潮再到科技巨头加注的三阶段演进 算力需求从训练主导转向推理驱动 资本开支持续攀升推动市场成长预期 [1] - 推理端规模定律成为算力增长核心动力 AI应用需求落地推动编程/搜索/图像处理等使用量增长 用户调用与人机交互实时消耗算力 tokens消耗量激增 谷歌Gemini月消耗tokens一年增长50倍 [4][7] - 每年数千亿美元算力投资驱动产业链上游机遇 涵盖GPU及配套高速互联方案/电源/散热系统等环节 [7] 海外算力投资逻辑 - 产品升级与价格敏感上游环节受关注 芯片升级与互联升级构成产品迭代两大核心动力 [8] - 芯片升级推动配套系统持续迭代 英伟达从H系列过渡到B系列并计划推出R系列 芯片功耗提高推动电源规格从3kw升至5.5kw并可能达10kw以上 散热方案从风冷转向液冷 单系统价值量持续提升 [10] - 互联升级要求材料技术革新 高速线缆互联速率从112G向224G升级并可能向448G演进 对PCB和铜缆等材料提出更高要求 [10] - 价格敏感上游环节存在供给滞后效应 PCB产业链扩产存在传导滞后 上游扩产周期更长导致供给紧张价格弹性明显 [9] 国产算力发展机遇 - 中美算力储备增速出现差距 美国互联网公司算力储备几乎每年翻倍 国内受高端芯片禁运影响存在算力缺口 需国产算力芯片补足 [13] - 国产GPU单卡性能已可对标英伟达对华特供版 H20芯片性能低于部分国产GPU产品 [15] - AI算力从训练转向推理的趋势利好国产算力 推理对超大集群互联要求较低 有利于国产算力在特定场景满足需求 [15] - 国产算力需关注高壁垒与远期空间两大维度 晶圆制造/GPU芯片/半导体设备等上游环节壁垒高竞争格局优 GPU/AIDC/服务器ODM等环节远期市场空间大 [15] 产业趋势特征 - AI发展伴随高度不确定性 DeepSeek大模型曾引发算力通缩担忧 推理端需求增长使叙事重回乐观 需紧密跟踪产业趋势变化 [16]
张宏江外滩大会分享:基础设施加速扩张,AI步入“产业规模化”
贝壳财经· 2025-09-11 15:09
大模型规模定律 - 大模型参数越高性能越好 规模定律仍是大模型性能提升的第一性原则 [3] - 推理模型塑造大规模发展新曲线 推理规模定律成为新增长动力 [3] - 上下文和记忆等层面持续推升计算需求 推动模型持续扩展 [3] 大语言模型通缩效应 - 大模型单位token价格三年内快速下降 使用成本随性能提升持续降低 [3] - 模型通缩现象进一步强化规模定律 成本下降推动应用普及 [3] AI基础设施扩张 - OpenAI的Stargate和Musk的Colossus等项目驱动基础设施扩张 100万个GPU耗电量相当于北京市用电量八分之一 [3] - 2025年美国主要科技公司AI相关资本开支预计超3000亿美元 产业链经历大规模建设热潮 [3] - IDC产业大规模建设带动电力生态和经济发展 体现AI产业规模化核心特征 [3] 智能体经济变革 - 人类进入智能体群时代 数量庞大的智能体交互执行任务交换数据信息 [4] - 模型和GPU算力成为未来组织核心资产 企业需扩大算力强化模型丰富数据 [4] - 智能体重塑企业流程 超级个体与智能体结合带来巨大结构性变革 [4] 行业平台建设 - 外滩大会连续举办四届 打造全球金融科技产业高规格开放对话平台 [5] - 大会获得上海市地方金融管理局和黄浦区人民政府支持 成为重要行业交流载体 [5]
源码资本张宏江:AI 步入“产业规模化”
华尔街见闻· 2025-09-11 14:07
大语言模型发展趋势 - Scaling Law仍然有效 推理模型的出现塑造了大规模发展的新曲线即"推理规模定律" 上下文和记忆等层面对计算需求持续推升scaling up [1] - 大语言模型通缩现象进一步强化规模定律 单位token价格过去三年快速下降 模型性能持续提升导致使用成本不断降低 [1] AI基础设施扩张 - AI驱动基础设施大规模扩张 OpenAI的Stargate和Musk的Colossus等项目需100万个GPU 耗电量相当于北京市用电量的八分之一 [2] - 2025年美国主要科技公司AI相关资本开支预计超3000亿美元 AI数据中心产业链经历大规模建设热潮 [2] - IDC产业大规模建设带动电力生态和经济发展 体现AI产业规模化核心 [2] 智能体经济发展 - 人类正进入"智能体群"时代 数量庞大的智能体彼此交互执行任务交换数据和信息 [2] - 人类与智能体群的交互构成"智能体经济" 模型和GPU算力成为未来组织核心资产 [2] - 企业需要扩大算力使模型更强大数据更丰富 Agent将重塑企业流程带来巨大结构性变革 [2]
张宏江:基础设施加速扩张 AI正步入“产业规模化”
央广网· 2025-09-11 13:07
大模型规模定律 - 规模定律仍然有效 大模型参数越高性能越好 是性能提升的第一性原则 [1][2] - 推理规模定律成为新发展曲线 上下文和记忆等层面持续推升计算需求 [2] - 大语言模型通缩现象强化规模定律 单位token价格过去三年快速下降 使用成本持续降低 [2] AI产业化发展 - AI驱动基础设施大规模扩张 AI数据中心产业链经历大规模建设热潮 [2] - IDC产业大规模建设带动电力生态和经济发展 体现AI产业规模化核心 [2] 智能体经济变革 - 人类进入智能体群时代 数量庞大的智能体彼此交互执行任务交换数据信息 [3] - 模型和GPU算力成为未来组织核心资产 企业需要扩大算力增强模型和数据 [3] - Agent重塑企业流程 超级个体与agent结合带来巨大结构性变革 [3]
GPT-5“让人失望”,AI“撞墙”了吗?
华尔街见闻· 2025-08-17 11:00
核心观点 - OpenAI发布的GPT-5未能达到市场预期,未带来革命性突破,引发用户和投资者失望 [1][3][4] - AI行业竞争格局改变,OpenAI一家独大局面被打破,Google、Anthropic、DeepSeek和xAI等竞争对手已缩小差距 [4] - AI发展重心从追求AGI转向产品化和商业应用,资本市场更关注实际增长而非技术突破 [2][7][8] - "规模定律"面临瓶颈,数据枯竭和算力限制制约大型语言模型发展 [5] - 技术进步放缓引发对"AI寒冬"的担忧,但资本仍在持续涌入AI领域 [6] 技术表现 - GPT-5发布后因技术故障表现"笨拙",用户抱怨其不如前代产品,犯下低级错误如错误标注美国地图 [1][3] - CEO Sam Altman承认发布"坎坷",解释称底层"自动切换器"失灵导致系统调用较弱模型 [3] - 资深用户对其性能和"个性"变化不满,认为基准测试表现平平 [1] - 评估发现GPT-5在不同任务中表现并非明显逊色,但在成本效益和速度方面表现出色 [7] 行业竞争 - OpenAI一家独大局面不复存在,Google、Anthropic、DeepSeek和xAI等竞争对手已缩小前沿开发差距 [4] - 行业竞争焦点从模型能力极限转向更务实、更具成本效益的产品化落地 [2] - AI公司开始派遣"前线部署工程师"入驻客户公司帮助集成模型,显示战略转变 [7] 技术发展瓶颈 - "规模定律"面临两大制约:数据枯竭和算力限制 [5] - AI公司几乎耗尽互联网上所有免费训练数据,正寻求与出版商和版权所有者达成新数据交易 [5] - 训练和运行大型AI模型消耗巨大能源,GPT-5训练动用数十万颗英伟达下一代处理器 [5] - Altman承认底层AI模型仍在进步,但像ChatGPT这样的聊天机器人"不会变得更好了" [5] 资本市场反应 - 尽管技术前景争论不休,AI相关股票和初创公司估值持续飙升 [7] - 英伟达市值攀升至4.4万亿美元接近历史高点,OpenAI投资方软银集团股价过去一个月上涨超过50% [7] - ChatGPT为OpenAI带来年经常性收入达120亿美元 [8] - 今年AI已占全球风险投资总额的33% [6] 未来趋势 - 行业焦点从AGI转向产品化和商业应用创新 [2][7][8] - 纯文本训练的LLM进入回报递减阶段,基于多模态数据的"世界模型"仍有巨大潜力 [7] - 投资者认为当前模型中仍有巨大价值未被挖掘,商业和消费应用开发"刚刚触及皮毛" [8] - 即使无法实现AGI,仍有很多创新机会可创造商业价值 [8]
苹果和多家科技巨头唱反调
快讯· 2025-07-12 22:55
AI推理能力竞赛 - 行业焦点转向"推理能力" 各大科技公司包括OpenAI 谷歌 Anthropic正竞相推出具备推理能力的大模型 [1] - 规模定律被广泛接受 英伟达CEO黄仁勋表示模型越大 训练数据越多 智能系统效能和质量越好 [1] - 苹果发布《思考的错觉》研究报告 测试显示主流大模型在复杂推理任务上准确率接近零 [1] - 有观点认为苹果报告可能是战略行为 因该公司在大模型竞赛中落后于对手 [1]