人机交互

搜索文档
3巨头押注下一个十亿级入口:当小米、字节、华为盯上 AI 眼镜,争的不是硬件是交互主权
犀牛财经· 2025-06-30 14:51
小米AI眼镜产品发布 - 小米发布首款AI眼镜,起售价1999元,半小时内小米商城售罄,京东首日销量突破7000台 [2] - 产品定位为"随身的AI入口",重量仅40克,续航8.6小时,超越Meta Ray-Ban的4小时续航 [3] - 搭载高通骁龙AR1芯片与索尼IMX681传感器,1200万像素摄像头,针对亚洲人脸型优化 [3] - 采用"软件定义硬件"理念,内置"超级小爱"AI助手,支持多模态交互和跨设备操作 [3] - 70%组件实现国产化,光学模组成本较2024年下降30% [4] 市场策略与供应链 - 内部预期销量"三十万台往上",相比Ray-Ban Meta全球200万台销量保守 [5] - 针对中国52.7%青少年近视率,与400家眼镜门店合作提供配镜服务 [6] - 歌尔股份为独家整机代工厂,欧菲光供应摄像头模组,瑞声科技提供扬声器 [3] 技术挑战与竞争格局 - 高通AR1芯片在3D建模等重度任务可能存在性能不足 [7] - 近视用户佩戴后重量增加约30克,与"无感佩戴"设计形成冲突 [7] - 全球智能眼镜2025年一季度出货量148.7万台,同比增长82.3%,中国市场贡献49.4万台 [8] - IDC预测2025年全球AI眼镜出货量550万台,中国市场275万台 [9] 行业发展趋势 - 2023年成为行业转折点,Meta与雷朋合作产品销量突破300万台 [8] - 阵列光波导+Micro-LED技术商用落地,模组重量压缩至8克 [9] - 科技巨头将AI眼镜定位为下一代人机交互入口 [10] - AI眼镜光学组件单机价值量达TWS耳机6倍,歌尔股份等企业率先受益 [11] 行业竞争与投资 - 百度、华为加速布局,三星、字节跳动、亚马逊计划发布新品 [12] - 2024年多家AI眼镜厂商获得单笔数千万元融资 [11] - 雷鸟创新AI眼镜已覆盖全球25国,北美及日韩市占率超40% [12]
蔚来申请一种人机交互方法相关专利,对同一种手势事件进行功能复用
金融界· 2025-06-20 20:24
公司专利技术 - 公司申请一项名为"人机交互方法、系统、触控模组、控制器、车辆及介质"的专利,公开号CN120179141A,申请日期为2023年12月 [1] - 专利涉及车辆控制技术领域,旨在提高交互体验感,通过触控模组识别手势事件并与应用场景匹配,实现功能复用和便捷更新 [1] - 专利技术可在有限空间内显著提高控制功能数量,优化人机交互体验 [1] 公司基本信息 - 公司成立于2020年,位于合肥市,主要从事研究和试验发展 [2] - 公司注册资本1800000万人民币 [2] - 公司对外投资4家企业,参与招投标项目19次 [2] 公司知识产权 - 公司拥有商标信息2332条,专利信息3037条 [2] - 公司拥有行政许可27个 [2] 新闻来源 - 新闻源自金融界,作者为情报员 [3]
Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到?
量子位· 2025-06-13 13:07
机器人技术进展 - Figure 02机器人展示60分钟未剪辑的物流分拣视频,显示其在实际工作场景中的表现[1] - 机器人能够灵活处理多种形态包裹,包括硬纸盒、聚乙烯袋、信封等可折叠或弯曲物品[10] - 通过即时调整抓取策略,机器人可对不同形态包裹采取不同处理方式,如双手翻转纸盒或单手轻捏信封边缘[13] 技术性能提升 - 通过扩展高质量演示数据集和改进Helix神经网络架构,机器人工作稳定性和性能显著提升[7] - 包裹平均处理速度达到4.05秒,吞吐量提高58%,条形码识别成功率从88.2%升至94.4%[17] - 引入视觉记忆、状态历史和力反馈模块,使机器人具备时间背景感和环境适应能力[20][22][28] 系统功能特点 - 机器人具备自主学习能力,能够从演示中学习自适应行为如拍打塑料包装抚平条形码[15] - 采用端到端学习模型,可实现人机自然交互,无需单独程序即可识别人类交接物品的意图[31] - 新策略使条形码识别成功率提升至94%,处理时间降至4.05秒,精度保持在92%以上[30] 行业应用前景 - 技术改进使机器人系统更加灵巧可靠,接近人类水平的工作速度和准确性[19] - 机器人参与物流工作引发行业对效率和成本优势的关注[37] - 仿人型机器人在物流领域的应用引发关于外形设计与效率关系的讨论[39]
拿下数亿订单,大型央国企是其客户,深圳人形交互机器人公司融资数千万|早起看早期
36氪· 2025-06-12 07:48
公司融资与背景 - 数字华夏完成数千万元天使+轮融资 由同创伟业独家投资 资金将用于技术研发 产品迭代和生产交付提速 [4] - 公司成立于2024年3月12日 聚焦AGI机器人规模商用 核心产品包括仿人机器人夏澜 通用人形机器人夏起和IP系列机器人星行侠 [4] - 创始人沈健有20年IT头部企业管理经验 曾带领公司实现从0到100亿营收 核心团队来自国内外顶尖高校 具备商业化经验及客户资源 [6] 行业前景与战略 - 中国人形机器人市场规模预计2025年达30亿美元 复合年增长率19.7% 交互服务机器人占比最大 [8] - 交互服务领域机器人技术成熟度更高 商业化潜力显著 需求日益旺盛 仿人机器人多场景适配能力强 [8] - 公司采用1+3+3战略布局 搭建巨号®具身智能交互平台 集成多模态感知 情感洞察和类人垂域智能功能 [8] 产品与技术 - 夏澜®仿人机器人搭载29个主动自由度 实现面部颈部精准表情表达 具备多模态交互能力 支持复杂环境自主移动 [9] - 星行侠®是首款双形态人形机器人 支持轮式/双足自由切换 覆盖1万平米以上区域 续航超10小时 可跨楼层任务 [11] - 夏起®通用人形机器人面向工业制造 商超服务等场景 提供接待引导 智慧康养等功能 [9] 商业化进展 - 已构建客户IP定制 联合运营和自有IP三大商业模式 与瑞贝卡合作在门店部署夏澜®作为展示模特 [12] - 2024年已获数亿元订单 客户包括头部ICT厂商 地方电网 大型国央企及高校 预计年内交付上千台 [12] - 产品开始小规模交付 通用和仿人机器人系列已进入交付阶段 [3][12] 投资方观点 - 同创伟业认为具身机器人是万亿级赛道 数字华夏选择交互服务场景具有差异化优势 [13] - 看重公司研发能力和场景落地能力 创始人产业背景深厚 客户拓展策略成熟 [13]
深度|AI语音独角兽11Labs创始人:“人性”中的不完美,恰恰是人愿意互动的关键
Z Potentials· 2025-06-09 11:34
公司概况 - ElevenLabs是一家2022年由前谷歌工程师Piotr Dabkowski与前Palantir策略师Mati Staniszewski创立的AI语音合成公司,专注深度学习技术开发自然语音 [2] - 2025年1月完成1.8亿美元C轮融资,估值达33亿美元 [2] - 年经常性收入(ARR)已突破1亿美元,语音转文本模型Scribe v1支持99种语言且准确性领先 [3][2] 技术突破 - 核心技术突破在于让AI语音加入"人性化特征"如笑声、呼吸音等不完美细节,使合成声音更真实有情感 [9][19] - 首次重大突破发生在2022年11月,实现AI模拟人类笑声并获用户积极反馈 [10][13] - 语音转文本模型采用Transformer架构和Diffusion Models技术,最初聚焦影视配音但扩展至更广泛交互场景 [8][9] 产品应用场景 - 已应用于医疗领域帮助渐冻症患者重建声音,包括协助美国国会议员在失声后继续工作 [26] - 与游戏公司合作复刻角色语音(如Darth Vader),保持角色特质同时支持低延迟交互 [20] - 物流行业客户通过加入语气词使语音Agent通话完成率提升2个百分点 [19] 行业趋势 - 语音交互将向多模态发展,未来1-2年实现"语音版图灵测试"(无法区分AI与人类) [15][16] - 交互式媒体(如游戏NPC对话)和智能客服是下一个爆发场景,将重构传统客户支持流程 [21][22] - 语言壁垒将被打破,AI可实现跨语言语音转换并保留原说话者情感语调 [40][41] 商业模式 - 采用基础研究+产品开发双轨模式,既研发底层模型也构建终端应用 [30][31] - 典型客户落地周期为3个月完成概念验证,1年内正式上线 [24] - 企业应用分两类:效率优化(如客服自动化)和增长驱动(如交互式品牌体验) [23][25] 安全机制 - 采用内容溯源系统,所有生成语音可追踪至创建者身份 [34] - 开发公开分类器检测AI生成语音,未来计划通过设备端加密验证真人发声 [35][36] - 提出三层认证体系:真人验证、授权Agent水印、未认证内容默认标记为AI生成 [37] 企业文化 - 受Disney启发注重叙事能力,通过技术使用户融入产品故事线 [42][43] - 管理层定期参与客户支持,保持与终端用户的直接联系 [44] - 核心优势在于专注语音领域并整合研究与应用,形成技术壁垒 [30][44]
【深圳特区报】数字华夏创始人兼CEO沈健:用“有温度”的机器人开启人机交互新时代|创新创业深圳人
搜狐财经· 2025-06-03 07:40
人形机器人行业与数字华夏公司发展 行业趋势与公司定位 - 人形机器人被视为"硅基生命",未来有望像碳基人类一样无所不能,但目前技术相当于三四岁孩子的水平[8] - 行业正在解决"有无问题",商业化不必等待技术完美,可先专注单一品类再扩展[11] - 深圳的产业基础、创新基因和创业氛围成为吸引机器人企业的重要因素[9] 公司创始人与战略转型 - 创始人沈健拥有18年计算机行业经验,曾带领企业实现从1亿元到百亿元营收的跨越[9] - 2023年底决定转型人形机器人领域,认为机器人本质是"大号计算机",可复用算力、算法和数据积累[9] - 2024年3月成立数字华夏,定位通用人工智能机器人规模化商用,战略方向为"人形交互机器人"[10] 产品技术与创新 - 女性全脸人形机器人"夏澜"拥有29个电机,能模拟人类41块面部肌肉,表情通过算法实时生成而非预设[10] - 产品具备视觉识别、声源定位和情绪感知能力,可产生共情反馈,实现"有温度"的交互[10] - 产品线包括"夏澜"(全脸)、"夏起"(半脸头盔式)和"星行侠"(轮足可分离式),覆盖导购、陪护、政务等场景[10] 商业化进展与目标 - 成立5个月即发布产品,首年获超4亿元意向订单[11] - 2024年销售额突破数千万元,2025年目标为数亿元[11] - 短期聚焦细分领域专家角色(如银行引导员、养老陪护员),长期目标为家庭全能保姆[11] 市场反馈与行业影响 - "夏澜"在2024年世界机器人大会亮相后引发广泛关注[10] - 交互能力测试显示机器人可对答如流、即兴编笑话,获"出乎意料地好"评价[1] - 公司提出"人因设计"理念,从外形到交互逻辑均追求"有温度",引领交互机器人新模式[10][12]
影石创新IPO,AI眼镜上新,通信设备成为新华出海指数本周最大亮点
中国金融信息网· 2025-05-30 20:55
影石创新IPO及市场表现 - 影石创新开启科创板IPO申购 拟募资4 64亿元 发行价格47 27元/股 发行市盈率20 04倍 [1] - 2022-2024年营业收入实现三连跳 分别为20 41亿元 36 36亿元 55 74亿元 三年复合增长率65% [2] - 同期净利润分别为4 07亿元 8 30亿元 9 95亿元 境外销售收入占比超75% 主要依赖美国(22 92%) 欧洲(24 23%)和日韩(7 66%)市场 [2] - 2023年消费级全景相机市占率达67 2% 全球连续六年第一 运动相机领域2024年上半年销量超越GoPro成为全球第一 [2] AI智能眼镜行业动态 - 2025年被业内视为AI眼镜爆发元年 全球销量预计突破550万台 同比激增135% [3] - 蜂巢科技推出界环AI音频眼镜新品 集成多模态AI模型 支持语音交互 价格区间249-1299元 [3] - 致敬未知与宝岛眼镜母公司发布联名产品NSVEx BleeqUp AI运动拍摄眼镜 整合护目 拍摄 音频 智能剪辑等功能 [3] 消费电子行业趋势 - 智能影像设备和AI眼镜正从尝鲜玩具向实用工具演进 覆盖工作 生活 娱乐等多维度场景 [4] - 中国消费电子品牌凭借供应链整合 规模化生产及AI技术突破 在全球市场竞争力持续提升 [4] - 新华制造出海50和新华TMT出海50指数本周逆势上涨 通信设备 航空装备 游戏行业贡献显著 [4][5] 指数表现数据 - 新华制造出海50指数本周涨0 29% 通信设备 航空装备为主要贡献行业 近1年收益8 08% [5] - 新华TMT出海50指数本周涨0 17% 通信设备 游戏行业表现突出 近1年收益11 64% [5]
融资43亿!脑机接口独角兽估值飙至650亿!
思宇MedTech· 2025-05-30 17:12
Neuralink融资与估值 - Neuralink完成新一轮6亿美元融资,投前估值达90亿美元,显著超出市场传闻的5亿美元募资目标 [2] - 公司自2023年起融资步伐加快,2023年8月获2.8亿美元,数月后又完成4300万美元追加融资,累计估值一年间几近翻倍 [5] 技术核心与产品构成 - Neuralink技术核心由N1植入体与R1手术机器人构成,形成闭环神经接口平台 [7] - N1植入体尺寸为23mm × 8mm,采用生物相容性材料,配备无线充电模块,可长期植入人体 [8] - N1集成1024个电极触点,分布于64根超细柔性线程,显著提升神经信号获取密度 [10] - R1手术机器人配备五个摄像头模组及OCT系统,可实现毫米级精准植入 [13][15] 应用场景与临床进展 - Blindsight视觉植入系统获FDA"突破性医疗器械"认定,目标为视网膜或视神经损伤导致失明的患者 [16] - 系统通过电极刺激视觉皮层,初代版本可产生光点感知,长期目标包括感知红外线、紫外线等波段 [18] - 探索无声交流算法和脑控智能家居系统,拓展人机协同与认知增强方向 [19] - 2024年1月完成全球首例人体植入手术,患者术后可通过意念操控电脑光标 [20] - 截至2025年2月,美国PRIME研究项目中已有三名患者完成植入,合计使用时长超4900小时 [22] 行业动态与政策支持 - 摩根士丹利预计脑机接口领域将在五年内实现医疗用途商业化 [23] - 美国BCI市场潜力高达4000亿美元,其中四分之一集中在神经运动障碍领域 [23] - 中国医保局为脑机接口新技术价格单独立项,设立植入费、取出费等价格项目 [23] - 湖北省率先落实脑机接口价格项目,植入费、取出费、适配费分别为6552元/次、3139元/次、966元/次 [25] 未来展望 - Neuralink逐步建成闭环神经系统平台,覆盖视觉、运动、认知等多维通路 [26] - BCI赛道未来将是科研、工程、临床、市场、政策多轴协作的系统工程 [27]
对话智元魏强:解码会跳舞能讲脱口秀的“硅基少年”灵犀X2
南方都市报· 2025-05-25 15:20
产品升级 - 灵犀X2关节扭矩较前代提升50%,可应对15度斜坡路面,标配25-31个自由度,旗舰版搭载10自由度的灵巧手OmniHand [1] - 关键突破是搭载自研"硅光动语"多模态大模型,实现视觉、语音、触觉等数据的融合处理 [1][3] - 研发制造成本下降:复用全栈技术平台降低研发费用,供应链规模化使关节模组等成本下降,量产数千台摊薄硬件成本 [4] 安全性能 - 配备柔性中空外壳缓冲碰撞、硬件急停按钮强制断电,在文旅场景中可自动保持平衡 [4] - 借鉴自动驾驶安全设计理念,通过传感器、激光雷达与人群保持距离,异常阻力下立即停止动作 [6][7] - 创新使用柔性材料外壳,保护周围人和物品,避免内部器件因撞击受损 [8] 交互能力 - 配备摄像头、麦克风阵列和情感计算引擎,主动感知人类情感与意图,发起自然互动 [9][11] - 硅光动语大模型支持角色性格定制,通过持续学习适应用户偏好,形成独特性格 [11] - 能判断人类状态,避免打扰忙碌者,自动绕开障碍物,实现自主导航避障 [11] 文娱场景应用 - 在中国移动展厅担任讲解员,通过自由问答和主动迎宾提升用户体验 [11] - 通过二次开发适配脱口秀、舞蹈表演,与主题公园合作开展巡演活动 [12] - 群控算法支持多机协同跳舞,动捕设备允许自主编排动作,探索机器人相声或乐器演奏 [12][14] - 支持接入合作伙伴知识库,在博物馆、科技馆等场景提供个性化讲解 [16] 教育场景应用 - 开放灵巧手控制接口和底层电机模组权限,支持开发者研究交互能力和作业能力 [17][19] - 提供一站式开发平台,开发者可专注特定算法模块,简化研究流程 [17] - 未来计划融入学校机器人课程,助力理论与实践结合 [19] 发展战略 - 坚持"由简到繁"路径,先在文娱、教育、康养等固定场景打磨产品,再向开放场景扩展 [20] - 长期目标是进入家庭,成为保安、保姆、保洁"三保"陪伴者 [20] - 认为2025年是人形机器人商业化关键年,行业关注度提升,产品向量产方向发展 [22]
余承东,清华大学演讲!
证券时报· 2025-05-23 12:39
鸿蒙操作系统发展 - 华为常务董事余承东在清华大学演讲中强调鸿蒙操作系统需依靠核心技术走向成熟,并呼吁更多开发者加入鸿蒙生态 [1] - 华为近期发布全球首款鸿蒙折叠电脑MateBook Fold非凡大师版,起售价23999元,搭载专项增强的鸿蒙系统和顶级屏幕 [1] - 同时发布全球首款鸿蒙笔记本电脑MateBook Pro,起售价7999元,标志着国产操作系统在PC领域取得突破 [1] 鸿蒙市场表现 - 鸿蒙系统在中国手机操作系统市场份额达19%(2024年Q4),连续四季超越iOS成为第二大系统 [2] - 行业专家指出16%市场占有率为生态成功分水岭,鸿蒙已超过该阈值 [2] 公司动态 - 华为2025校园公开课以"创新引领未来·共建鸿蒙世界"为主题,由余承东主讲 [1] - 余承东拥有清华大学硕士学历,1993年加入华为,现任常务董事兼终端BG董事长 [2]