Scaling Law(规模定律)
搜索文档
地平线苏箐:未来三年 自动驾驶行业将告别范式迭代狂飙
中国经营报· 2025-12-11 12:28
在苏箐看来,这一阶段的核心命题,是将现有技术的潜力发挥到极致,比如地平线将持续提升芯片算力 与模型容量,以统一范式推进L2到L4的融合,让城市L2从20万级车型下探至10万级市场,让准L4系统 以平民化价格走进大众。同时,强化工程与组织能力,应对海量长尾场景的打磨,这才是穿越周期的关 键。 "自动驾驶的终极目标,是造出能替代人类司机的机器。这场长跑,在范式革命之后,考验的是行业沉 下心来做'精活'的耐力。在未来几年内,能够把L4级别的车,以平民化的价格送到用户手上。这才是我 们所有人辛苦了这20年做这一行的意义所在。" (文章来源:中国经营报) "未来三年,自动驾驶行业将告别范式迭代的狂飙,进入极致优化的'苦日子'。" 12月9日,在"2025地平线技术生态大会"上,作为深耕自动驾驶20年的老兵,一向"反共识"的地平线副 总裁&首席架构师苏箐分享了对自动驾驶未来趋势的判断。 值得一提的是,对于当下,苏箐则给出了冷静的判断:"行业需要清醒。当前深度学习已显露天花板迹 象,AGI基础理论暂无突破信号,下一轮内核重构至少还需5—20年的技术沉淀。未来三年,自动驾驶 行业将告别范式迭代的狂飙,进入极致优化的'苦日子' ...
「紫荆智康」获近亿元天使轮融资,加速AI医院系统开发及落地 | 36氪首发
36氪· 2025-11-11 08:04
公司融资与背景 - 公司完成近亿元天使轮融资,由星连资本领投,英诺天使和尚势资本跟投,资金将主要用于紫荆AI医院系统的研发、迭代与升级 [1] - 公司成立于2024年9月,由清华大学智能产业研究院孵化,清华大学计算机系教授刘洋发起,并获得清智资本种子轮投资 [1] 核心技术:AI医院系统 - 核心逻辑为模拟真实医院设施和流程,构建超拟人、广分布、多样化的AI患者以满足初始训练数据需求,进而开发具备自我进化功能的AI医生,最终打通用户全周期健康管理 [1] - 采用“基于拟像的可进化智能体”技术路径,利用“大模型+医学知识库+少量病例库样例”通过多步逆采样自动合成病例,并将合成病例转化为AI虚拟患者 [2] - 已构建超50万个AI患者,覆盖不同国家、年龄段与疾病类型,作为训练AI医生的重要补充路径 [2] - 团队设计了特定的记忆与反思算法机制,使AI医生能在问诊闭环中积累“经验”,其能力进化曲线初步符合规模定律 [3] - 已研制42位AI医生,在国际权威MedQA数据集上准确率超过96%,超过人类医生平均水平 [3] 产品功能与进展 - 产品设置患者端APP、医生端工作站和医院系统三个端口,实现“院前-院中-院后”全周期闭环管理 [3] - 诊前患者可线上挂号并通过AI机器人完成智能预问诊、生成结构化病历;诊中AI医生为真人医生提供检查、诊断建议;诊后系统管理患者健康档案并提供咨询与解读服务 [3] - 紫荆AI医院系统于2025年6月30日发布,并于同年8月在清华大学医院部分科室开展内部测试 [4] - 计划于2025年底开展系统公开测试,测试范围将从北京扩展至全国更多城市,涵盖不同等级医院及更多科室 [4] 行业背景与政策 - AI赋能医疗领域长期面临数据资产合规性、产品商业化落地等痛点 [1] - 2025年10月国家相关部门印发促进“人工智能+医疗卫生”应用发展的实施意见,公司发展方向与文件精神高度契合 [4] 投资方观点 - 投资方认可公司在技术上具备原创性突破,其“虚拟医院+可进化智能体”技术路径突破了医疗数据瓶颈 [5][6] - 投资方看好公司通过智能体技术重塑医疗效率与公平性,以及其背靠清华资源与享受国家政策红利的优势 [5][6]
模型训练最重要的依然是 Scaling —— 对话阿里通义千问 Qwen 多语言负责人杨宝嵩 | Open AGI Forum
AI科技大本营· 2025-06-25 14:49
通义千问多语言战略 - 通义千问(Qwen)从项目启动就将国际化作为核心战略,优先考虑多语言数据优化以服务全球用户[2][9] - 模型支持全球119种语言,在Hugging Face平台下载量位居前列,衍生模型数超过10万个[2][6] - 英语社区用户量最大,中文用户仅排第三或第四,体现其国际化影响力[8][9] 多语言技术突破 - 建立覆盖上千细粒度分类的文化标注体系,解决不同语言文化禁忌与安全合规问题[3][13] - 采用"英语内部推理+目标语言输出"的折中方案应对多语言混杂难题,提升小语种稳定性[16] - 通过数据合成与人工审核结合提升低资源语言数据质量,文化对齐投入占研发重要比重[14][16] 模型能力演进方向 - 提出"知识密度"概念,4B参数小模型性能已超越早期70B大模型,反映数据质量优化成效[19][20] - 持续探索Scaling Law延续路径,重点布局合成数据两大方向:创造新知识与提升数据纯度[21][22] - 针对"数据回流"现象采取混合比例控制,保留人类数据多样性避免模型风格趋同[25] 产品生态布局 - 采取大小模型并行策略,4B级小模型适配终端设备部署需求,已应用于车载、穿戴设备场景[26][28] - 与硬件厂商合作开发Mobile-Agent系统,实现视觉操作手机等基础功能,复杂场景仍需技术突破[30][31] - 规划将语音翻译、文字识别等能力深度集成至操作系统,但涉及安全的核心功能保持审慎[32][34] 行业趋势展望 - 多语言技术面临三大挑战:文化多样性对齐、小语种生成流畅度、多模态融合[39][41][43] - 合成数据与跨模态迁移被视为解决小语种数据匮乏的关键路径,需社区共建高质量数据集[42][45] - AI技术替代催生新职业形态,如AI编程师、Prompt工程师等协同型岗位将成就业增长点[37][38]
智谱发布智能体产品“AutoGLM沉思” 公司CEO张鹏:智能体也存在规模定律
每日经济新闻· 2025-03-31 14:07
产品发布与核心能力 - 公司于3月31日中关村论坛正式发布具备深度研究和实际操作能力的智能体“AutoGLM沉思”,推动人工智能Agent进入“边想边干”阶段 [1] - 智能体展现出自主规划能力,例如在未经专门训练的情况下,能规划通过访问巨潮资讯网来收集指定研报的解决方案 [1] 技术演进与模型参数 - “AutoGLM沉思”的技术演进路径为:GLM-4基座模型→GLM-Z1推理模型→GLM-Z1-Rumination沉思模型→AutoGLM模型 [1] - 公司基于最新技术积累,重新训练了参数规模达320亿的基座模型GLM-4-Air-0414,该模型在工具调用、联网搜索等智能体任务上能力大大加强 [2] - GLM-4-Air-0414模型在预训练阶段加入了更多代码类和推理类数据,并在对齐阶段针对智能体能力进行了优化 [2] 行业洞察与生态战略 - 公司CEO提出Agent存在类似Scaling Law的特点,通过扩展训练时的推理计算,Agent性能会更强 [1] - 公司计划于4月14日正式开源核心链路的模型和技术,以此推动行业生态发展 [1]