小模型

搜索文档
上交研究登Nature大子刊!可微分物理首次突破端到端无人机高速避障
机器之心· 2025-07-08 08:04
研究团队与背景 - 作者团队由上海交通大学和苏黎世大学的研究人员组成,包括第一作者张宇昂(研究方向为可微分物理机器人、多目标追踪和AIGC)、共同一作胡瑜(研究方向为无人机视觉导航)和宋运龙博士(研究方向为强化学习、最优控制)[1] - 通讯作者为上海交通大学的林巍峣教授和邹丹平教授[1] - 研究成果已在《Nature Machine Intelligence》在线发表[3] 技术突破 - 提出了一种融合无人机物理建模与深度学习的端到端方法,首次将可微分物理训练的策略成功部署到现实机器人中[2] - 实现了无人机集群自主导航,在鲁棒性、机动性上大幅领先现有方案[2] - 训练一次,多机共享权重,零通信协同飞行[7] - 在单机场景中,网络模型在未知复杂环境中的导航成功率高达90%,相比现有最优方法展现出更强的鲁棒性[9] - 在真实树林环境中,无人机飞行速度高达20米/秒,是基于模仿学习的现有方案速度的两倍[10] - 所有测试环境均实现zero-shot零样本迁移,无需GPS或者VIO提供定位信息即可运行,并能适应动态障碍物[10] 技术细节 - 使用12×16超低分辨率深度图作为输入[12] - 仅使用3层CNN的超小神经网络实现端到端自主飞行,可部署于150元廉价嵌入式计算平台[12] - 抛弃复杂无人机动力学,用极简质点动力学模型,通过可微物理引擎训练端到端网络[12] - 端到端可微仿真训练:策略网络直接控制无人机运动,通过物理模拟器实现反向传播[21] - 轻量设计:整套端到端网络参数仅2MB,可部署在150元的计算平台(不到GPU方案的5%成本)[21] - 高效训练:在RTX 4090显卡上仅需2小时即可收敛[21] 多机协同表现 - 在多机协同场景中,将网络模型部署到6架无人机上执行同向穿越复杂障碍和互换位置任务[14] - 策略在同向穿越门洞、动态障碍物和复杂静态障碍物的场景中展示了极高的鲁棒性[14] - 在多机穿越门洞互换位置的实验中,展现出了无需通信或集中规划的自组织行为[14] 方法对比 - 当前具身智能的主流训练范式主要分为两类:强化学习(RL)与模仿学习(IL),但这两类方法在效率与可扩展性方面均存在明显瓶颈[30] - 强化学习多采用model-free策略,完全不考虑环境或控制对象的物理结构,导致数据利用率极低,影响训练的收敛速度与稳定性[31] - 模仿学习依赖大量高质量的专家演示作为监督信号,获取这类数据通常代价昂贵,且难以覆盖所有可能场景[31] - 本研究提出的基于可微分物理模型的训练框架,有效融合了物理先验与端到端学习的优势[30] 训练效率与性能 - 在相同硬件平台上,本方法在约2小时内即可实现收敛,训练时间远低于PPO与Agile所需的训练周期[39] - 仅使用约10%的训练数据量,本方法在策略性能上就超越了使用全量数据的PPO + GRU方案[39] - 在训练过程中,本方法展现出更低的方差与更快的性能提升,收敛曲线显著优于两类主流方法[39] - 在真实或近似真实的避障任务中,本方法的最终避障成功率显著高于PPO与Agile,表现出更强的鲁棒性与泛化能力[39] 后续研究 - 研究团队后续改进与拓展了可微物理引擎框架与训练方法,实现了国际首个基于单目FPV摄像头的端到端视觉避障系统[52] - 在真实室外环境中实现最高6m/s飞行速度,无需建图即可自主导航[52] - 该研究已在《IEEE Robotics and Automation Letters》发表[53]
AI在工业铺开应用,英伟达的“AI工厂”并非唯一解
第一财经· 2025-06-19 21:47
英伟达AI工厂战略 - 英伟达CEO黄仁勋提出AI工厂概念,计划在中国台湾和德国建设配备1万颗Blackwell GPU的超级计算机和工业AI云,并在欧洲建设20余个AI工厂[1] - AI工厂与传统数据中心不同,专为AI创造价值而设计,部署英伟达GPU并搭配Omniverse仿真平台[2] - 英伟达通过Omniverse平台切入工业AI领域,与西门子、Ansys等软件厂商合作,应用于汽车仿真、数字工厂规划等场景[3] - 公司战略是通过Omniverse平台吸引软件和制造厂商,带动硬件销售和算力消耗[3][4] 工业AI应用现状 - 工业领域AI渗透率当前仅7%,预计2028年将提升至25%[8] - 小模型已广泛应用于设备故障运维、工艺优化、AI质检等场景,在工业AI支出中占比预计保持60-70%[9][10] - 大模型应用主要集中在流程助手、知识库应用和经营决策分析等场景[9] - 合成生物领域有公司通过自研小模型实现研发效率指数级提升,每年AI技术投入占研发投入10-20%[10] 工业AI技术路线 - 英伟达路线侧重仿真和数字孪生,提供虚拟平台而非直接AI应用[5] - 其他厂商聚焦大模型和小模型应用,解决工厂现场实际问题[5][6] - 大模型有望用于串接小模型和跨系统整合,多模态结合是发展方向[11] - 工业场景碎片化特点导致技术路线多样化,不存在单一解决方案[5][6] 工业AI算力需求 - 国内企业倾向自建私有云数据中心,主要考虑数据安全因素[13] - DeepSeek一体机受工业企业青睐,今年国内销售额预计达千亿量级[14] - 小模型算力需求多元,从CPU到GPU不等,大型企业训练大模型需要高端显卡[15] - 工业对算力需求大规模增长还需2-3年,当前算力并非主要瓶颈[15] 行业发展趋势 - 制造业企业数字化预算减少,AI预算单独列出趋势明显[8] - 数字孪生平台在工厂建设前预训练可缩短投产时间,但目前国内缺乏对标产品[5] - 工业AI发展面临数据缺乏、场景碎片化和部分企业数字化未完成等挑战[15] - 边缘算力需求将随小参数模型应用增加而提升[15]
端侧AI的未来:苹果能否凭借“小模型”逆袭?
36氪· 2025-06-10 14:26
WWDC 2024观察:苹果AI战略与开发者生态 苹果AI战略现状 - 公司今年WWDC在AI领域的表现被评价为"慢热"且"underwhelming",与行业对AI创新的高速追逐形成反差 [1] - 预计重点展示端侧AI技术,采用"小模型"策略——在设备本地运行的轻量化AI模型,而非依赖云端大模型 [1] - 第三方开发者对苹果AI功能反应平淡,Origin首席产品官表示缺乏强烈兴奋感 [1] 端侧AI的争议 - 技术优势:本地处理带来更快响应速度、更低云服务成本、更强数据隐私保护 [2] - 开发者质疑点: - 性能不足:育儿应用Bobo创始人认为小模型难以满足精细化需求,图形应用Word Swag测试显示性能缺陷 [2] - 微调限制:开发者可能无法用专有数据深度定制模型 [2] - 有限应用场景:卡路里追踪应用Cal AI考虑用于简单文字问答,约会应用RIZZ持观望态度 [3] App Store生态危机 - Epic诉讼案裁决允许开发者引导用户进行外部支付,冲击苹果30%佣金商业模式 [4] - 美国可能效仿欧洲出台法规强制开放第三方应用商店,威胁App Store垄断地位 [4] - 公司引用数据称2024年App Store为开发者创造1.3万亿美元收入(开发者获90%),但未能缓解不满情绪 [4] 创新力质疑 - Vision Pro头显因高价和小众定位仍属利基产品,未达"未来计算平台"预期 [6] - 去年发布的Apple Intelligence功能(如AI增强Siri)落地进度迟缓,被视为对竞品的被动应对 [6] - 行业质疑公司是否面临创新"失速",或在进行未公开的战略转型 [5] 潜在优势与挑战 - 硬件基础:iPhone作为最大分发平台+自研芯片实力,支撑端侧AI战略 [8] - 关键突破点:需升级开发者工具、打造打动消费者的AI体验、重建开发者信任关系 [8] - 行业关注点:小模型战略能否助公司在AI竞赛中重返领导地位仍存疑 [8]
AI推理加速演进:云计算的变迁抉择
21世纪经济报道· 2025-05-21 19:09
AI发展趋势 - 开源大模型高效迭代推动AI发展从训练转向推理 小模型应用落地需求增加 对云计算市场产生深远影响 [1] - IDC预测未来AI推理市场规模将达训练需求的十倍以上 垂直场景小模型部署潜力更大 [1] - 行业投资重心转向推理 企业需关注推理效率(吞吐量、时延、成本) Akamai服务提升3倍吞吐并降低60%时延 [2][3] 云计算架构变革 - 边缘计算成为重要增长点 分布式架构需满足低延时(10毫秒)、灵活部署 Akamai覆盖130国4200边缘节点 [3] - 混合云/多云策略被绝大多数企业接受 客户探讨如何执行符合业务特性的多云战略 [1] - 边缘推理优势显著:靠近用户提升体验 满足数据主权要求 降低数据传输成本 [3] 模型应用特征 - 实际生产中89%用户采用小模型解决具体问题 商业化程度高于大模型 智能客服等场景已验证效果 [2] - 时延敏感领域更适合边缘部署小模型 "快思考"与"慢思考"模型需差异化云环境部署 [3][4] - 中国企业出海加速嵌入AI推理能力 如商旅行业用AI生成非定制行程建议 [5] 行业挑战与优化 - 企业CTO反映前期过度投入训练 推理准备不足 需构建运营级服务能力(算力/数据管理/边缘运维) [2] - "慢思考"模型推高云计算成本 迫使企业优化服务效率 需平衡资源使用与成本 [3] - 推理需额外考虑可扩展性、合规性等要素 与训练数据中心要求存在差异 [2]
10万美元成本训练的小模型,在特定任务超越GPT-4o,延迟低99倍
36氪· 2025-05-14 17:45
公司概况 - Fastino是一家专注于开发"任务特定语言模型"(TLMs)的早期初创公司,由连续创业者Ash Lewis和George Hurn-Maloney共同创立[4] - 公司技术团队来自谷歌DeepMind、斯坦福大学、卡内基梅隆大学及苹果等知名机构[6] - 已累计获得近2500万美元融资,包括1750万美元种子轮和700万美元前种子轮[3] 技术方案 - 采用低端游戏GPU训练TLM模型,平均成本不到10万美元[3] - TLM模型在特定任务上性能媲美大型语言模型,推理速度比GPT-4o快99倍(100ms vs 4000ms)[8] - 基准测试显示TLM模型的F1分数比GPT-4o高出17%[9] - 模型架构基于Transformer但引入任务专精优化,消除参数冗余和架构低效[8] 产品特点 - 首批模型覆盖文本摘要、函数调用、文本转JSON等企业核心需求[10] - 提供PII屏蔽、文本分类、脏话过滤、信息提取等具体功能[17] - 支持部署在虚拟私有云、本地数据中心或边缘设备[13] - 已在金融、医疗、电子商务等行业应用,获得财富500强企业采用[13] 商业模式 - 采用订阅制收费而非用量定价,个人开发者每月1万次免费请求[11] - Pro用户每月10万次请求收费45美元,团队用户300万次请求收费1275美元[11] - 极低的模型运行成本支撑其定价策略[13] 行业趋势 - 大语言模型训练成本高达数千万美元,部署和推理成本同样高昂[7] - 小模型在成本、推理时延和特定任务性能上具有显著优势[14] - 类似企业包括Cohere、Mistral、阿里云Qwen3和Writer的Palmyra系列[14] - 对于高并发、低延迟要求的应用场景,小模型更具经济性[14]
大模型也有“不可能三角”,中国想保持优势还需解决几个难题
观察者网· 2025-05-04 08:36
人工智能发展历程 - 人工智能概念可追溯至1950年图灵提出的"图灵测试",奠定了理论基础 [2] - 大众广泛接触人工智能以2022年11月ChatGPT发布为分水岭,至今仅两年多发展历程 [2] - 大模型时代标志着人工智能进入新阶段,通用人工智能是高阶阶段的标志 [4] 人工智能在工业领域的应用现状 - 人工智能在工业领域应用正由单点突破向系统集成发展,目标是与更多工业系统深度融合 [5] - 当前工业领域呈现大小模型并存局面,小模型处理结构化数据与精确预测,大模型处理复杂非结构化数据 [5] - 人工智能在汽车制造业等智能制造基础扎实的领域表现最佳,成熟度较高 [6] - 大模型在工业领域主流应用集中于智能客服、业务管理等边缘性建议,高阶自动化应用尚在探索 [8] 人工智能赋能制造业的目标 - 提升效率,如排产调度优化 [9] - 改进质检,通过视觉神经网络等技术提高检测效率 [9] - 降低成本,这是工业赋能的核心命题 [9] - 创新驱动,生成式大模型在产品设计、工艺优化等方面提供新思路 [9] - 决策优化,为企业管理层提供更科学、及时的决策支持 [9] 人工智能在工业领域落地的挑战 - 工业场景细分程度高,通用解决方案难以实现,智能体无法充分控制风险 [9] - 工业数据分散于不同系统,格式与标准缺乏统一性,整合难度大 [10] - 定制化人工智能解决方案成本高,投入产出比低,难以形成商业闭环 [10] - 数据治理是主要障碍,涉及数据获取、整合、处理、安全应用及权属界定 [11] - 大模型算法与工业逻辑存在冲突,工业追求决策过程可解释性、可控性和可追溯性 [13] - 生成式大模型无法满足工业级"四个九"或"五个九"的可靠性要求 [13] 人工智能与工业企业的双向对接问题 - 人工智能技术人员缺乏工业领域实践经验,工业专业人员对AI技术理解有限 [15] - 项目制、定制化合作方式制约大模型在工业领域的泛化应用 [15] - AI技术在工业领域价值变现面临不确定性,缺乏成熟商业模式 [17] 人工智能赋能新型工业化的推进策略 - 初级阶段优先在封闭场景采用小模型,开放场景试用大模型 [19] - 进阶阶段构建大小模型协同赋能体系,探索人工智能能力边界 [20] - 高阶阶段目标实现高度智能的"通用智能制造",通过MOE架构串联大小模型 [21][22] - 工业模型培养需分阶段推进,初阶段优化提示工程,进阶阶段赋予检索增强能力,高阶阶段预训练原生工业大模型 [24] 算力与数据配套发展 - 初阶阶段政府打造区域算力中心,规划城市级算力网络 [24] - 进阶阶段建设高性能算力集群,加速部署市级算力网络 [25] - 高阶阶段扩容升级算力集群,构建核心算力枢纽 [25] - 需汇集各行业结构化与非结构化数据,形成闭环数据飞轮 [26] - 优先在数据基础好、数字化水平高的行业开展试点示范 [26] 企业协同与产业链优势 - 龙头企业应发挥引领示范作用,聚焦行业共性需求 [26] - 中小微企业聚焦场景迭代,参与大模型数据迭代 [27] - 中国拥有完整产业链体系和丰富工业场景,持续迭代数据是未来竞争关键 [27]