规模法则(Scaling Law)
搜索文档
周伯文:缺乏专业推理能力是当下前沿模型的一大短板
新浪财经· 2026-01-28 18:32
人工智能发展阶段的演进 - 人工智能发展呈现阶段性跃迁,可分为三个关键阶段:ANI(狭义人工智能)、ABI(广义人工智能)与AGI(通用人工智能)[1] - ANI在2016年已趋于成熟,通往AGI的必经之路是率先实现具备跨领域泛化能力的ABI[2] - ChatGPT的问世验证了从有监督学习转向自监督学习、从任务级联系统转向端到端架构、从判别式工具进化为生成式助手这三方面技术范式变革,宣告了ABI阶段的到来[2] 通用人工智能(AGI)的核心路径 - 通往AGI的下一步不仅仅是计算量的堆叠,“通专融合”是一条可探索的路径[2] - 真正的AGI必须打破“专业性”与“通用性”的二元对立,构建能够动态融合直觉式“系统1”与逻辑式“系统2”的智能架构[2][3] - 目标是构建一种能够在保持通用认知基座的同时,通过持续学习与深度推理在特定任务上实现专家级专精的智能[3] - 上海AI实验室提出的智者SAGE技术架构旨在弥合广泛泛化与深度专精的鸿沟[3] 科学发现作为AI的下一个前沿 - 人工智能的下一个前沿领域是科学发现(Scientific Discovery, SD)[4] - 科学发现是推理智能的终极考验,涵盖了从假设生成、实验验证到理论总结的全过程[4] - 科学发现对AI提出三重挑战:处理“已知的未知”(如组合爆炸问题)、泛化“未知的未知”、应对稀疏与延迟的实验奖励反馈[4] - 尽管AI for Science(AI4S)在特定领域取得成就,但过度依赖现有深度学习模型可能局限新知识的探索边界,甚至阻碍创新[4] 当前AI模型在科学发现中的能力短板 - 传统深度学习擅长处理数据充足、定义明确的任务,但难以应对科学发现中“未知的未知”[5] - 一项由上海人工智能实验室联合100位科学家进行的评估显示,前沿模型在通用科学推理任务中得分可达50分(满分100分)[5] - 但在专项文献检索、具体实验方案设计等专业推理任务中,模型得分骤降至15-30分[5] - 这种明显的“木桶效应”表明,科学发现全周期的效能正受制于专业推理能力的薄弱环节[6] 从AI4S向AGI4S的迭代演进 - 需要整合通用推理与专业能力,推动科学智能从AI4S向AGI4S迭代[6] - 从AI4S迈向AGI4S旨在推动研究者、研究工具与研究对象的协同演进,通过三者相互作用创造革命性工具,推动科研范式变革[6] - 当前已身处通用人工智能的前夕,但仍缺失通专融合的智能,亟需推动科学智能从1.0向2.0迭代演进[1][6] - 实现AGI的可行路径是发展“可深度专业化通用模型”,其关键挑战在于需要低成本、可规模化的密集反馈,并具备持续学习、主动探索及提供多视角解决方案的能力[6]
面壁李大海谈端侧模型竞争:元年开启,巨头涌入印证前景无限可能
环球网· 2025-08-15 15:48
行业趋势与战略判断 - 公司CEO提出2025年将迎来"端侧元年" 标志着机遇大门开启但市场格局尚在成形初期[1] - 端侧模型优势及"端云协同"成为行业共识 越来越多大模型厂商开始关注端侧领域[1] - 行业呈现多元化发展态势 除公司外阿里通义千问 腾讯混元开源多款小尺寸模型 OpenAI首次开源两款模型包括尺寸较小的GPT-oss-20B[1] 公司竞争定位与战略 - 公司认为压力并非来自友商竞争 更多创业公司和巨头涌入印证了赛道正确性与前景无限可能[1] - 公司核心压力在于将技术优势转化为商业优势 需要极致追求技术与用户价值的平衡[1] - 公司确立"高效"为核心竞争力 追求"同等性能我最小 同等参数我最强"的端侧模型方案[1] 技术突破与行业贡献 - 研究团队发现并提出描述大模型知识密度的"密度法则(Densing Law)" 在大模型规模法则遇到挑战时开辟新的认知视角[1] - 2024年初面壁小钢炮MiniCPM端侧模型诞生 以2.4B参数能力超越Mistral 7B模型实现以小博大[2] - 系列端侧模型累计下载量超过1300万 与高通 NVIDIA MTK Intel 华为 瑞芯微电子等国内外主流芯片厂商方案全面适配[2] 商业化进展与落地应用 - MiniCPM模型作为"端侧大脑"核心在汽车 手机 PC 家居等终端领域成功落地[2] - 在智能化汽车的新一代人机交互(AI座舱)方面形成特色优势[2] - 2024年7月下旬公司进行新一轮组织升级 专门成立一级组织"汽车业务线"通过压强式突破推动MiniCPM模型广泛上车[2]