Workflow
端云结合
icon
搜索文档
“天才少女”罗福莉走向台前
华尔街见闻· 2025-12-17 20:35
核心观点 - 小米集团通过引入顶尖AI科学家罗福莉并发布其主导的MiMo大模型,旨在从传统硬件制造商转型为一家以AI驱动的智能服务公司,其核心战略是利用自身庞大的硬件生态作为物理世界入口,发展“具身智能”以构建商业护城河并寻求更高估值 [2][10][11] 公司战略与投入 - 小米集团总裁卢伟冰宣布未来五年研发投入规划达2000亿元,显示公司对AI转型的坚定决心 [2] - 公司重金引入前DeepSeek核心成员、95后科学家罗福莉担任MiMo大模型负责人,这是一次关键的技术补课与战略防御行动 [2] - 公司的目标是利用其全球最大的消费级IoT平台(连接10.4亿台设备)作为训练下一代“具身智能”的直接入口,将硬件作为载体,AI作为溢价核心 [10] 技术路线与产品 - 罗福莉为小米规划了一条“另类”技术路线:不追求“全知全能”的云端大模型,而是专注于打造“知行合一”、能与物理世界交互的“物理大脑”或智能体 [4][6] - 新发布的开源模型MiMo-V2-Flash采用MoE架构,总参数达309B,但实际运行时仅激活15B,以实现轻量化并部署于手机和汽车芯片 [5] - 该模型通过锁定128个Token的滑动窗口等工程策略,牺牲部分文采以换取极致的代码执行和工具调用效率,其展示的推理速度是对手DeepSeek-V3.2的3倍,成本仅为Gemini 2.5 Pro的二十分之一 [5] - 罗福莉认为算力和数据并非真正的护城河,小米的路线比拼的是科学研究文化和对问题的定义能力 [5] 行业背景与竞争格局 - 当前AI行业正从“规模时代”转向“研究时代”,单纯堆砌算力的边际收益递减,模型需要应用落地 [7][8] - 行业竞争维度已从“谁的模型更聪明”转变为“谁拥有物理世界的入口”,软件巨头如字节跳动、阿里、OpenAI等正积极尝试推出硬件以触碰真实世界 [9] - 高盛指出,字节跳动“豆包手机”等激进尝试,反而验证了小米等硬件巨头在AI入口生态战中的结构性优势 [11] - 行业普遍面临挑战:云端ChatBot的高昂推理成本使商业模式难以为继,同时如何在算力受限的端侧设备实现高智商推理也是一大物理挑战 [8][11] 公司面临的挑战与机遇 - 机遇在于小米本身是“物理世界的地主”,其庞大的硬件生态是其在AI时代翻盘的关键基础 [10] - 主要挑战在于必须证明其原生MiMo模型比外来的“豆包”或“ChatGPT”更好用、更听话,否则其10.4亿台设备可能沦为别人的流量入口 [11] - 公司需要让数万名习惯了传统硬件开发的工程师适应大模型时代的开发范式,这是一道现实难题 [11] - 对于小米而言,若不能在AI时代掌握核心模型,其“人车家生态”中的所有硬件可能沦为其他巨头的躯壳,这是无法接受的战略结局 [11]
对话Rokid副总裁:未来智能眼镜一定会取代手机,大厂加入能进一步教育市场
观察者网· 2025-08-11 14:18
公司发展 - 公司以AI和AR为核心技术开发产品 在市场上主打AR眼镜 [2] - 2025年2月18日创始人佩戴AR眼镜进行无稿演讲事件显著提升公司知名度 带来大量合作和投资机会 [2] - 事件后公司研发和生产压力增大 需投入更多时间打磨产品品质 [3] 技术能力 - 公司开发自有AR操作系统 重点优化系统效率 延迟 功耗和交互效果 [3] - AI功能包括智能提词器(自动识别语句翻页) 多语言实时翻译 导航(与高德合作)和"看一眼支付"(与支付宝合作)功能 [3][4] - 支付功能采用声纹识别技术通过声音判断用户身份以提升安全性 [4] - 摄像头为大模型增加视觉能力 使其能理解用户问题并观察眼前世界 [4] - 公司不研发基础大模型 但支持对接通义 豆包 智谱和DeepSeek等多类大模型 [5] - 自主研发意图识别模型 根据用户查询内容分类调用视觉或语言大模型 [6] - 在视觉算法和语音算法方面拥有丰富经验 自主研发提词器等算法 [6] 产品策略 - 采用端云结合模式 在线算法用于网络良好场景(效果更优) 本地算法用于弱网或无网络环境 [6] - 翻译功能同样支持在线模型(语种更多效果更好)和本地小模型 [6] - 与高德 支付宝等合作伙伴在智能体服务方面采用云端协同策略 [6] 行业定位 - 公司认为AI眼镜处于L2(推理和聊天)向L3(任务代理)过渡阶段 L3智能体功能已开始出现 [8][9] - 硬件集成AI能力的过程略滞后于AI技术发展 约晚几个月 [8] - 2025年是智能体元年 展会出现智能体大爆发 但垂直领域仍存在创业机会 [9]