语音识别
搜索文档
小哥硬核手搓AI桌宠!接入GPT-4o,听得懂人话还能互动,方案可复现
量子位· 2025-07-16 15:02
AI宠物技术实现 - 核心硬件采用3D打印底座和圆锥形头顶,悬挂一条触手结构,触手源自SpiRobs机器人,能抓取尺寸相差超两个数量级、重量达自身体重260倍的物体[8][10] - 视觉系统通过立体摄像头追踪触手末端,使用YOLO模型进行3D三角测量校准[12][31] - 触手控制采用2D映射简化操作,通过电脑触控板拖动光标即可调整触手动作[22][23] 控制系统架构 - 低级控制层结合开环预设动作(如点头)和闭环RL策略(如手指跟踪),立体视觉约束RL观察空间[25][26] - 高级控制层采用GPT-4o实时API处理语音与视觉事件,无需微调即可下达底层指令[26][27] - 为增强生命感,在待机状态加入轻微摇摆行为,并通过Prompt工程解决LLM调用问题[28][29] 强化学习与仿真优化 - 在MuJoCo中重建软体触手模型,设置目标跟踪环境,使用PPO策略梯度结合MLP和帧堆叠训练[33] - 添加动力学随机化(质量、阻尼、摩擦)以贴近真实环境,通过控制惩罚和指数移动平均解决抖动问题[36][37] - 最终实现仿真到真实环境的迁移,验证控制策略有效性[38] 开发者背景与灵感来源 - 开发者Matthieu Le Cauchois为ML工程师,研究方向包括强化学习、NLP,曾创立AI公司Typeless并被Doctolib收购[39][41][42] - 项目灵感源自皮克斯台灯机器人,强调通过动作和时机传递情绪意图,动物形态设计增强宠物陪伴感[48][49][53] - 工程文件开源,包含3D打印CAD数据和控制脚本,支持低成本复现[20][54]
开辟人形机器人赛道要警惕“虚火”
中国汽车报网· 2025-07-04 09:21
人形机器人行业热度 - 人形机器人成为2025上海车展焦点 几乎每个展台都有展示 但部分企业租用仅为噱头 [2][3] - 全国1年内新增23万家机器人相关企业 同比增长22.7% [4] - 中国工业机器人5月产量同比飙升35.5%至69056台 服务机器人增长13.8%至120万台 [4] - 中国拥有74.17万家机器人相关公司 包括优必选科技 宇树科技 智元机器人等领跑者 [4] 市场规模预测 - 中国机器人市场预计以23%年增幅增长 从2024年470亿美元增至2028年1080亿美元 [5] - 人形机器人市场预计年增63% 从今年3亿美元增至2030年34亿美元 [5] - 2030年中国预计拥有25.2万台人形机器人 2050年达3.02亿台占全球30% [5] 技术应用与瓶颈 - 人工智能 机器视觉 语音识别技术进步推动人形机器人执行复杂任务和自然互动 [5] - 应用领域涵盖医疗 教育 零售 制造 娱乐 服务等 [5] - 目前面临耗电快 腿部协调性差两大短板 [9] - 需突破数据 算力 软硬件协同等多道关卡 芯片和能源是关键问题 [9] 产业链布局 - 汽车产业链企业争相布局 从仿生关节到精密减速器等核心部件 [6] - 万里扬研发谐波减速器3年 目标国产化替代 [10] - 方正电机已申请33件人形机器人关节专利 获批2件 [11] 行业挑战与思考 - 当前人形机器人技术水平距离商业化落地仍有距离 [8] - 行业存在过热现象 类似当年新能源汽车造车热 [7] - 需警惕无序发展 建议在政策指导下集合政产学研优势 [11] - 工信部目标2025年关键技术突破 2027年形成安全可靠产业链 [10][12]