第一个能在手机上跑的小龙虾来了,它的名字,叫miclaw。

行业趋势与竞争格局 - Agent场景被证明是用户刚需和关键前端入口,所有厂商均不会放弃此赛道[1] - 硬件厂商(如小米)已正式下场参与Agent竞争,标志着行业进入混战阶段[5] - 手机端Agent与电脑端Agent存在本质区别,前者定位为“生活管家”,后者更偏向“生产力工具”[45] 公司产品发布与定位 - 小米正式官宣其Agent产品“Xiaomi miclaw”,并开启小范围封闭测试[1][4] - 该产品被定位为实验性产品,主要面向发烧友和极客用户[8] - 产品基于小米MiMo大模型构建,强调拥有系统底层能力、个人上下文理解、生态互联和自进化四个层次能力[4] - miclaw被描述为第一个能在手机上运行、能调用手机系统级能力且有安全保障的Agent产品[5] 产品核心功能与体验 - 产品无需部署,打开即用,用户可通过自然语言对话进行交互[8] - 具备长期记忆功能,可通过工具调用(如write_file)写入和更新记忆[10] - 核心优势在于能够通过编程Agent逻辑直接调用手机系统级能力,避免了视觉Agent方案速度慢、成功率不稳定的问题[14][15] - 首批上线了27个系统级工具,涵盖20个系统应用、1个智能家居和6个网络工具[38] - 系统工具功能全面,包括管理短信、通话、联系人、日历、闹钟、文件、笔记、网络连接、媒体播放、录音、录屏、相机、位置天气、应用管理等[40][41] 产品特色应用场景 - 智能家居控制:深度集成小米米家生态,用户可授权miclaw控制家中智能设备(如窗帘、扫地机器人、鱼缸、饮水机等),实现语音操控和自动化场景(如“写稿模式”联动调整环境)[49][51][58][62] - React Native小程序:支持用户通过自然语言指令创建和保存小程序,弥补手机端技能生态的不足,例如创建每日运势占卜小程序[71][75] - 生活助理场景:工具可自由组合,实现例如名片OCR录入联系人、截图OCR联网搜索记笔记、结合日历天气生成晨间简报等自动化流程[42][43] 产品当前限制与挑战 - 目前仅支持小米17系列机型,且处于小规模邀请制封闭测试状态[4][5] - 部分高级功能(如配置MCP和子代理)需要用户具备额外知识以代码形式自行配置[8] - 存在第三方应用操作权限的“老大难”问题,无法直接操控非系统应用(如完成电商下单)[66][79] - 部分米家智能家居的详细数据(如体脂秤、饮水机出水数据)尚未开放给Agent调用[67] - 某些操作(如开启手机勿扰模式)无法全自动化,仍需用户手动确认[63] 技术基础与性能表现 - 产品基于小米MiMo大模型,该模型在推理速度上表现突出,为Agent的快速响应提供了基础[19] - 在实际任务执行中(如批量处理垃圾短信)表现出“速度非常快,大概十几秒就搞定了”的特点[20]