Workflow
ViLLA架构
icon
搜索文档
稚晖君和机器人,离不开自行车
36氪· 2025-03-12 18:15
核心观点 - 智元机器人最新产品灵犀X2展示了卓越的运动能力和交互技术,具备28个自由度设计、自主平衡控制及高精度动态平衡能力 [3][7][8][9] - 该机器人搭载多模态交互大模型"硅光动语",支持毫秒级反应速度,结合视觉理解和情感计算引擎,实现拟人化交互 [13][14][15][16] - 产品采用模块化关节设计(PowerFlow)和标准化接口,降低维护成本,核心关节模组迭代后提升灵巧手自由度并引入触觉感知技术 [11] - 公司定位灵犀X2为"吉祥三保"(保安/保姆/保洁)多功能机器人,瞄准康养、服务和家庭陪伴三大应用场景 [20] - 产品视频在B站发布后迅速获得超56万浏览量,创始人稚晖君的技术光环持续带来市场关注度 [21] 技术架构 - 采用纯串联构型设计,避免并联结构的机械干涉问题,降低系统复杂度 [8] - 自研"小脑控制器Xyber-Edge"和"智能电源管理系统Xyber-BMS",实现运控算法突破 [9] - 基于扩散模型的生成式动作引擎整合强化学习与模仿学习算法,快速掌握复杂运动技能 [11] - 模块化关节(PowerFlow)和标准化接口设计提升可维护性,零部件可像无人机那样组装 [11] 交互能力 - 多模态大模型"硅光动语"支持自然语言理解与毫秒级响应,结合动作模态实现精准互动 [14] - 具备视觉认知能力,可阅读药品说明书、辨别物体包装并提供常识建议 [15] - 采用柔性材料增强安全性,通过动态呼吸灯和特有肢体动作打破机器刻板印象 [15] - 预研自然语言指令驱动的技能编排技术,未来可适配不同机器人本体 [16] 应用场景 - 康养领域:作为陪伴机器人提供生活照料和情感支持 [20] - 服务领域:作为接待机器人提供信息咨询和引导服务 [20] - 家庭场景:作为儿童玩伴和教育伙伴,支持成长学习 [20] - 轻量化设计和二次开发接口支持用户自定义应用场景拓展 [20] 市场反响 - 产品视频在B站发布数小时内即获得超56万浏览量 [21] - 创始人稚晖君此前因自动驾驶自行车视频走红,技术IP持续产生影响力 [2][21] - 行业关注点集中在运动能力真实性,部分业内人士期待更多技术细节披露 [21]
智元启元大模型GO-1发布,具身智能再上新台阶
江海证券· 2025-03-12 14:42
报告行业投资评级 - 行业评级为增持(维持) [4] 报告的核心观点 - 2025年3月10日智元发布首款通用具身基座模型智元启元大模型GO - 1并提出ViLLA架构,推动具身智能迈向新台阶 [4] - GO - 1基于ViLLA架构构建,该架构由VLM和MoE组成,三者协同支持人类视频学习等,降低具身智能门槛并部署于多款机器人 [4][5][6] - 智元提出ViLLA创新架构以利用数据提升策略泛化能力,通过预测Latent Action Tokens弥合差距,在真实世界表现超越现有开源SOTA模型 [6] - GO - 1推出标志具身智能向通用化、开放化、智能化快速迈进,具有人类视频学习等四大特点,实现从单一任务到多种任务等转变 [7] - 具身智能发展火热催化不断,提示重点关注奥比中光、索辰科技、中科创达、天娱数科等 [8] 行业表现 - 近十二个月传媒行业相对收益1个月为2.14%、3个月为 - 0.77%、12个月为5.72%;绝对收益1个月为3.07%、3个月为 - 1.72%、12个月为16.55% [2] 相关研究报告 - 2025.03.07发布AI应用发展迅猛提示投资机会点评报告 [3] - 2025.02.13发布豆包大模型团队提出全新超稀疏架构推理成本大幅下降点评报告 [3] - 2025.02.10发布AI agent产业进展不断提示相关投资机会点评报告 [3] - 2025.02.07发布春节档票房新高《哪吒之魔童闹海》票房创影史记录点评报告 [3] - 2025.01.03发布12月游戏版号下发继续维持推荐点评报告 [3]