Workflow
VLM模型
icon
搜索文档
MinerU完成10余家国产AI芯片算力适配
新浪财经· 2026-02-12 12:40
行业生态合作与适配进展 - 上海人工智能实验室的OpenDataLab团队和DeepLink团队与国产芯片厂家合作,已完成对昇腾、平头哥、沐曦、海光、燧原、摩尔线程、天数智芯、寒武纪、昆仑芯、太初元碁、壁仞等10余家主流国产算力的适配 [1] - 此举旨在通过软硬件协同的全栈优化策略,提升MinerU项目的生态兼容性与适应力 [1] 公司产品与技术能力 - MinerU为上海人工智能实验室研发的一款AI文档解析工具,依托自研的VLM模型 [1] - MinerU对PDF及复杂网页的元素捕捉准确率可达99% [1]
何小鹏:大模型道路,大家都在摸着石头过河|36氪专访
36氪· 2025-06-12 19:29
小鹏G7与图灵AI芯片 - 小鹏G7搭载3颗自研图灵AI芯片,有效算力超2200Tops,超越行业主流方案(508Tops)3-28倍[1][3] - 公司定位G7为"首款具备L3级算力的AI汽车",预售价23.58万元起,打破此前蔚来ET9(2000Tops/78.8万元)的算力记录[1] - 图灵芯片团队需提前考虑未来8年技术路线变化以支撑5年安全期,面临内存带宽等挑战[6] 技术架构与模型部署 - G7 Ultra版本采用2颗图灵芯片运行VLA-OL模型(辅助驾驶)+1颗运行VLM模型(智能座舱),通过PCIe实现芯片间协同[3][10] - VLA模型新增"运动型大脑",配合强化学习训练使智驾能力上限比行业Max方案提升10+倍[4] - 本地化部署VLM(视觉-语言)与VLA(视觉-语言-动作)双模型,VLA模型帧率可达20-30帧/秒,显著提升安全时延[3][12] 行业对比与竞争格局 - 特斯拉FSD坚持端到端方案,规划下一代AI5芯片算力3000-7200Tops;国内理想等厂商已开始探索VLA方案[5][14] - 20-25万元纯电SUV市场将面临小米YU7、理想i6等竞品,G7通过SKU极简化+华为AR HUD+超长续航702km差异化竞争[6][16] - 行业L2高阶算力集中在500-700Tops(英伟达OrinX/ThorU),公司认为2000Tops是L3自动驾驶基础起点[11] 产品战略与迭代计划 - 芯片编译优化目标为1年半后实现"一颗顶四颗"效能,通过OTA每月新增功能,2024年内计划重大功能上线[7][8][9] - 产品线定位:G6(小康家庭)、G7(中产/年轻家庭)、G9(高端空悬车型),形成价格与技术梯度[16] - 当前未全系标配图灵芯片,G7 Max仍采用英伟达Orin X方案,未来将根据配置需求混合使用两种芯片[13]
130多天后再谈AI!李想透露实现VLA的三个阶段,回应“智驾”是否该叫停
每日经济新闻· 2025-05-08 10:01
文章核心观点 - 理想汽车董事长李想提出,人工智能成为“生产工具”是其真正爆发的标志,而公司研发的VLA司机大模型正是旨在成为交通领域的专业生产工具,实现从辅助工具到生产工具的跨越 [1][2] - VLA模型被视为实现全自动驾驶的关键技术路径,是当前能力最强的架构,但其上车应用对芯片硬件和公司基本功提出了极高要求 [4][6] 人工智能工具层级与演进 - AI工具可划分为信息工具、辅助工具和生产工具三个层级,人工智能变成生产工具才是其真正爆发的时刻 [1] - 判断Agent是否真正智能的关键在于它是否成为生产工具,就像人类雇用司机一样 [2] - 对于理想汽车,VLA司机大模型以“司机Agent”的产品形态呈现,用户可通过自然语言与其沟通 [2] VLA模型的技术定义与优势 - VLA即视觉语言动作模型,输入文本和视觉数据,输出可执行动作,天然带有AI与物理世界交互的基因 [3] - VLA模型是端到端与VLM的合体,能根据感知直接生成车辆的运动规划和决策,更接近“图像输入、控制输出”的端到端智驾理想状态 [3] - 相比传统规则方案只能推理1秒路况,端到端1.0能推理7秒,VLA模型则能对几十秒路况进行推理,在复杂场景下理解应对更好 [3] 理想汽车智能驾驶的技术演进阶段 - 第一阶段(自2021年起):自研依赖规则算法和高精地图的辅助驾驶,类似“昆虫动物智能” [4] - 第二阶段(自2023年起研究,2024年推送):端到端+VLM辅助驾驶,接近“哺乳动物智能” [4] - 第三阶段(VLA阶段):开启“人类智能”阶段,通过3D和2D视觉组合完整看到物理世界,具备语言、思维链推理能力,能看、能理解并执行行动 [4] - 公司强调端到端是VLA的基础,并未放弃端到端技术,VLA的A部分即对应端到端的具身智能执行环节 [4] VLA模型的行业意义与挑战 - VLA模型受到自动驾驶领域热捧,除理想汽车外,元戎启行等企业也在布局 [4] - VLA可能成为从L2辅助驾驶到L4自动驾驶飞跃的关键跳板,也是智能驾驶走向更广阔具身智能行业的连接点 [4][6] - 当前L2、L2+组合驾驶辅助仍属辅助工具阶段,VLA能让AI真正成为司机和交通领域的专业生产工具 [6] - VLA模型上车难度大,将端到端与VLM二合一后,车端模型参数更大,需高效实时推理和复杂世界认知能力,对车端芯片硬件要求极高 [6] 公司的能力与行业竞争壁垒 - 公司拥有编译团队、芯片能力、板子设计能力和操作系统能力,能够将两个Orin-X带宽做到足够大,以运行同等规模的VLA模型 [6] - 技术路径快速迭代升级,对尚未在端到端解决方案领域建立优势的企业形成了更高的准入壁垒,后来者居上的可能性显著降低 [6] - 许多企业做端到端很吃力,是因为在规则算法阶段就没做好,而端到端没做到极致则无法知道如何训练VLA,基本功在人工智能时代不可跳跃 [7] - 公司认为应学习苹果、特斯拉等美国顶级公司扎实的基本功,尤其是在当前竞争环境下,更是企业扎扎实实练基本功的时候 [7]