人工智能技术发展 - 中国人工智能企业在基座模型、推理模型和多模态领域已接近或达到美国水平 包括DeepSeek和千问等企业在训练和推理效率上进行了深度工程优化 [1] - 行业将AI工具分为三类:信息工具(参考作用)、辅助工具(提升效率)和生产工具(替代人力) 当前AI主要作为前两类工具使用 生产工具被视为AI爆发的关键节点 [5][6][7] - DeepSeek的MoE架构(671B参数模型)展示了高效技术路径 其成功遵循研究→研发→能力表达→业务价值转化的极简最佳实践 [9][10] 公司技术战略 - 公司基于DeepSeek开源模型加速VLA(视觉语言行动模型)研发进度 原计划9月完成的语言模型提前9个月实现 同步推进端到端多模态和芯片级FP8优化 [11][12][13] - 开源整车操作系统理想星环OS 作为对DeepSeek开源生态的回报 该操作系统经过4年自研且达到行业领先水平 [15][16] - 基座模型研发投入增加3倍训练卡 开发300B参数模型用于车载对话 32B模型用于辅助驾驶VLA 两者均采用MoE架构 [19][20] VLA技术架构 - VLA(司机大模型)分三阶段进化:规则算法(昆虫智能)→端到端+VLM(哺乳动物智能)→VLA(人类司机智能) 当前处于黎明前的黑暗期 [23][25][26] - 技术实现路径包含预训练(3D/2D视觉+语言联合数据)、后训练(模仿学习)和强化训练(RLHF+纯RL) 最终形成4B参数的车端模型 [29][30][33][34] - 核心优势在于处理复杂场景(如道路施工)和自然交互 相比传统架构可解决ETC多通道识别等长尾问题 通过世界模型生成数据加速迭代 [56][57] 行业竞争格局 - 特斯拉FSD中国版采用12.5之前版本 未体现其真实技术能力(13.0+端到端版本) 但认可其感知距离和控制系统稳定性等基本功 [62][63] - 公司技术原创性体现在操作系统、训练体系、芯片底层优化等全栈能力 辅助驾驶团队核心人员市场竞品争夺激烈 [68] - 学习苹果和特斯拉的扎实基本功 认为AI时代能力复制周期缩短至周级别 企业需构建不可逾越的技术壁垒 [64][65] 技术商业化 - VLA商业化路径类比雇佣司机 定价约为人类司机费用的1/3-1/5 可能整合保险、充电等增值服务 [51] - Agent智能体需具备专业能力(驾驶水平)、职业性(安全合规)和信任构建(交互记忆)三维度标准 [49][50] - 技术演进遵循渐进式创新 否定"直接吃第十个包子"的捷径思维 强调从规则算法到端到端的必经积累 [53][54]
理想AI Talk第二季完整文字版视频版
理想TOP2·2025-05-07 22:49