Workflow
人机交互
icon
搜索文档
如果想认真做AI,就要把硬件做出来
虎嗅· 2025-05-23 09:34
合作背景 - OpenAI与苹果前设计总监Jony Ive领导的硬件公司io合作,目标出货1亿台设备 [1] - 团队包括苹果前设计高管Evans Hankey和Tang Tan,形成"最强硬件+AI"组合 [1] - 合作背景是苹果在AI领域进展缓慢,用户期待Ive团队实现创新突破 [1] 产品愿景 - 目标是开发对屏幕依赖低的新型交互设备,减轻手机成瘾性 [2] - 核心功能是提供通信和生产力服务,同时减少屏幕通知干扰 [3] - 追求全新自然的人机交互方式,利用大模型性能提升实现网状主动式Agent体验 [4] - 产品形态非手机非眼镜,可放置桌面,计划2026年推出 [8] 技术布局 - OpenAI已投资多家人形机器人和AI硬件企业,包括1X、FigureAI等 [6] - 2024年2月提交AI消费电子设备商标申请,重组机器人团队 [6] - 新产品需突破"性能-体积-功耗"三角限制,实现移动场景覆盖 [9][10] 市场定位 - 目标年销量1亿台,超过初代iPhone表现 [8][10] - 不定位为利基产品,未来规划"设备家族"系列 [8] - 对比Meta智能眼镜年销量仅200万副,行业整体未达规模效应 [10] 交互设计 - 可能整合环境感知(摄像头/传感器)、记忆功能和个性化推理 [15] - 避免AI Pin类产品的冗余交互动作,追求自然隐形的交互方式 [13] - 区别于Vision Pro等固定场景设备,强调移动场景覆盖 [10] 行业动态 - 谷歌与Meta在智能眼镜领域展开竞争,均布局AI助手集成 [11] - 中国厂商雷鸟、Rokid等推出AR眼镜,但市场规模有限 [10] - 垂直领域AI硬件如录音笔转型产品面临智能手机挤压 [14] 产品挑战 - 需解决Humane AI Pin等前代产品交互设计失败的问题 [6][13] - 要突破智能眼镜200万副/年的行业销量天花板 [10] - 需平衡创新交互与实用功能,避免高开低走 [13][14]
独家|光帆科技三个月融资1.3亿,宁德时代联创、韶音、歌尔入局
暗涌Waves· 2025-05-20 15:01
公司融资与估值 - 光帆科技在三个月内完成两轮累计1.3亿元人民币融资 投后估值超5亿元 [1] - 投资方包括柏睿资本 韶音 歌尔旗下同歌创投 兆易创新朱一明旗下清辉投资及零以创投等产业资本 以及鼎晖投资 阿尔法公社 清华系英诺天使及水木清华校友基金等财务基金 [1] 行业趋势与公司定位 - AI时代下人机交互将从GUI过渡到AI多模态交互 公司致力于构建面向下一代人机交互的AI可穿戴硬件及通用AI Agent [1] - 核心判断是未来五年内可穿戴AI硬件将从"专用功能"转向"通用智能" 现有软件体系无法支持多模态交互和动态资源调度 [1] - 全球AI硬件市场处于探索期 传统硬件缺乏AI功能 现有AI硬件普遍存在软件体验差 功能少且低频的问题 [2] 产业资源与团队背景 - 投资方韶音在骨传导及开放式耳机市场占50%以上份额 歌尔是可穿戴ODM龙头 兆易创新是存储/存算一体芯片龙头 能为公司提供硬件支持和入口 [2] - 柏睿资本由宁德时代联创李平创办 可提供关键器件 产业资源 上下游生态及资本市场支持 [2] - 创始人董红光是小米89号员工 曾主导MIUI 快应用生态 小米自研手机及汽车OS等业务 具备从0到1自研通用OS的完整操盘经验 [2] - 创始团队来自小米 华为 字节 阿里 腾讯等企业 具有深厚的人工智能软硬件及应用开发能力 [3] 行业竞争格局 - 2024年有13位前大厂高管创业 其中11位选择AI硬件或AIGC方向 创始人背景从BAT扩展到小米 理想及AI六小龙等新一代大厂 [3] - AI硬件创业分为三类:昂贵的具身智能公司 收购成熟硬件团队的大厂 以及依赖敏捷创新的初创公司 [3] - 公司凭借融资速度 资源厚度和团队背景已成为"明星项目" 但需关注产品落地速度和生态号召力 [3]
谷歌CEO皮查伊回应“谷歌已死”论:AI决定未来,中国竞争力不容忽视
36氪· 2025-05-19 18:44
AI战略与搜索转型 - 谷歌正从传统搜索转向"跟随用户"的智能助手模式,产品将更具预测性和个性化,甚至在用户提问前提供信息 [3] - AI概览功能已覆盖150多个国家和地区,用户超15亿,AI模式下的查询平均长度是传统搜索的2-3倍 [7][9] - 公司自2015年起定位为"AI优先",通过收购DeepMind和启动Google Brain项目奠定基础,Transformer架构模型显著提升搜索质量 [6][7] 基础设施与技术优势 - 自研TPU芯片已迭代至第七代,构建全栈式基础设施体系,支撑大规模低延迟AI服务,2025年计划750亿美元资本支出中过半用于Google Cloud [13][14] - Gemini 2.5系列模型凭借基础设施优化实现高性价比服务,Flash模型在性能与成本效率上处于行业帕累托前沿 [13][14] - 采用双轨芯片策略:同时使用英伟达GPU和自研TPU,内部主要用TPU训练部署Gemini模型 [15] 商业模式与竞争格局 - AI概览广告收益已达传统搜索水平,证明AI搜索具备可持续商业模式,计算成本过去18个月显著降低 [9] - Gemini App月活3.5亿,但嵌入搜索的AI概览才是全球使用最广的生成式AI应用,ChatGPT月活6亿的对比存在偏差 [7][8] - 中国AI公司DeepSeek的崛起显示中国技术前沿实力,其模型效率优化方向与谷歌策略部分吻合 [21] 未来计算平台布局 - AR眼镜可能成为下一代主流计算平台,语音与多模态交互将使人机交互更自然,公司持续投入Pixel系列和Waymo等硬件项目 [18][19] - 量子计算处于类似2015年AI的技术曲线阶段,预计3-5年内实现超越经典计算的现实应用 [25] - 机器人技术临近"魔法时刻",Gemini机器人项目整合视觉/语言/动作模型,计划推出开放平台操作系统 [26][28] 业务生态与长期战略 - YouTube与Google Cloud合并营收达1100亿美元,公司已成为全球最大媒体和企业软件提供商之一 [10][11] - Alphabet结构以基础技术扩展为核心,Waymo、Isomorphic等业务共享Gemini和AI技术主线 [31] - X实验室持续孵化突破性项目,如Waymo和Google Brain早期版本均源于此 [31] 能源挑战与全球竞争 - 电力成为AI发展核心瓶颈,太阳能+储能电池和核能是重点方向,当前云计算业务已受能源限制影响 [22][24] - 中国2040年发电量或达美国4倍,能源基础设施速度将决定AI算力扩张天花板 [22][23] - 公司长期投资量子计算和机器人等前沿领域,遵循"长期积累+非线性爆发"路径 [25][26]
吴晓波对话冯森:下一个人机交互的“超级入口”在哪里
吴晓波频道· 2025-05-19 00:40
公司愿景与发展历程 - 公司愿景是实现"万屏互联",让信息在不同屏幕间无缝流转,连接人类生活中的万事万物 [2] - 2013年创立乐播科技,专注投屏和多屏互动技术12年,将康宁玻璃"万物皆屏"的想象变为现实 [4] - 目前链接5亿台电视、16亿台手机,国内95%电视机内嵌其投屏技术 [5] 技术突破与生态构建 - 消除屏到屏、端到端的壁垒,实现任意手机投屏到任意大屏 [6] - 2014年起免费为电视大屏设备、移动端App、手机系统嵌入投屏技术,构建"万屏互联"底层生态 [7] - 自主研发"Le-Link"协议,统一不同品牌、系统、型号设备的连接标准 [21] 人工智能时代的战略布局 - 投屏技术将成为未来人机交互的"超级入口",与AI智能体结合实现多模态内容展示 [13][14] - 计划通过API将投屏功能嵌入原生大模型,让智能硬件具备无缝投屏能力 [15] - AI智能体是增量市场,其体量不亚于手机,将带来投屏行业的新蓝海 [17][38] 产品迭代与场景应用 - 推出"超级投屏空间"技术,利用云游戏架构实现微信扫码零门槛投屏 [32][33] - 解决企业会议室投屏痛点,如百度2000多个会议室单天投屏时长近6小时 [29][30] - 开发跨生态投屏App"Vimnicast",规划出海解决全球设备兼容性问题 [39] 行业影响与未来展望 - 推动投屏从硬件连接向云端交互升级,消除物理壁垒实现"最短路径"体验 [34] - 智能体硬件产品将拓展教育等新场景,如儿童通过语音交互在电视上课 [41] - 若实现全球设备无缝连接,将是中国互联网对应用市场的重大贡献 [42]
吴晓波×冯森:当投屏遇上AI,“人机交互”下一个超级入口 | 今日直播
吴晓波频道· 2025-05-16 00:03
文章核心观点 - AI技术快速发展正在重构人与屏幕的交互方式 从触摸 遥控到语音 自然语言实时对话 [2] - 投屏技术作为连接人与数字世界的隐形桥梁 其市场价值被严重低估 [2] - 屏幕可能成为AI生产力工具的超级入口 尤其在电视 办公 教育等场景 [2][3] - 乐播科技作为行业隐形冠军 占据中国90%以上投屏市场份额 构建了20亿屏幕的连接生态 [3] 投屏技术新迭代 - 投屏技术正从基础功能向跨平台 跨系统 跨网络的超级投屏空间升级 [3] - 会议场景和教学场景成为技术落地的重点方向 [3] 屏幕作为AI终端 - 普通屏幕通过AI技术转型为生产力工具终端 覆盖电视 手机等硬件 [2][3] - 乐播投屏已覆盖5亿台电视和16亿台手机 形成规模化应用场景 [3] 乐播科技生态构建 - 公司用10年时间建立20亿屏幕连接生态 市场份额超90% [3] - 通过企业会员等商业模式拓展B端市场 本次直播提供3个月免费体验福利 [3] 行业发展趋势 - AI与屏幕交互的融合将催生新的超级入口 市场潜力巨大 [2] - 投屏技术从单一功能向多场景 多设备协同的生态化方向发展 [3]
傅利叶再提康养,机器人养老还要跨过几道坎?
第一财经· 2025-05-15 19:22
公司战略与定位 - 公司提出"立足康养"的下一个十年战略,并计划在上海打造国内首个具身智能康养示范基地 [1] - 与国家地方共建人形机器人创新中心签署战略合作,推进具身智能技术在康复医疗等场景的应用 [1] - 公司业务涵盖外骨骼机器人、人形机器人,已进入三甲医院、社区医院、养老院及海外市场 [1] 产品与技术发展 - 2016年推出首个具有触觉的上肢康复机器人Fourier M2,2017年推出中国首个商用化下肢外骨骼康复机器人Fourier X1 [3] - Fourier X1采用力反馈技术,通过传感器识别使用者走路意图并动态调整步态轨迹 [3] - 通过强化学习算法解决"笨重"与"延迟"问题,提升人机交互精准度和及时性 [4] - 2024年发布首款开源人形机器人Fourier N1,结合开源模型与自研数据微调"大脑"能力 [9] 市场需求与交互能力 - 康养场景中交互功能是核心,尤其在神经康复领域(如阿尔茨海默病、帕金森等)需反复训练 [2] - 老年群体对交互便捷性要求高,复杂操作(如动态验证码登录)影响二次采购意愿 [3] - 公司认为感知能力需与特定场景耦合,硬件设备需满足细分化需求 [3] 行业落地与效率提升 - 康养机器人ROI计算不同于工业场景,需衡量治疗效果和情绪价值等非量化指标 [5] - 标准化训练流程和多机协同可提升效率,1名医疗师可管理5-10台机器人 [5] - 产品从原型机到量产需3-4年(1-2年验证有效性,1-2年注册拿证) [6] 政策与行业趋势 - 我国牵头制定的养老机器人国际标准IEC 63310发布,为设计、测试等提供基准 [6] - 专家认为政策将简化认证流程,加速康养机器人落地 [6] - 2019-2023年中国机器人领域投融资年复合增长率达38.8%,2023年金额达97.39亿元 [10] 竞争与市场前景 - 养老场景因支付能力强、容错率高,被视为比工业场景更易落地的方向 [9] - 全球60岁以上人口预计2050年达21亿,养老市场潜力巨大 [9] - 公司已进驻3000多家医疗机构,积累场景和数据优势 [9] - 行业竞争加剧,需在细分场景(如长期陪伴、疾病治疗)展现差异化功能 [10]
机器人开始抢“主持人”饭碗!上海张江,傅利叶宣布下个十年规划,要做“以人为本的具身智能”
量子位· 2025-05-10 12:41
西风 发自 凹非寺 量子位 | 公众号 QbitAI 打工人打工魂,这年头机器人都开始当主持"人"了。 扭头一看,台下还有个小的机器人在举气球: 坐标上海张江,人形机器人玩家 傅利叶 迎来十周年,在十周年庆典暨首届具身智能生态峰会上, CEO顾捷 宣布了下个十年的规划: 要做以人 为本的具身 智能 。 具体含义包含三个方面: 傅利叶于2015年在张江孵化器起步,康复机器人起家,第一款产品就是 外骨骼机器人 。 已进驻全球3000多家终端医院 在落地成果方面,顾捷透露了一系列合作。 从外骨骼机器人起步,傅利叶在2020年提出了"智能康复港"模式,自主研发覆盖全身、全周期的30多款康复机器人产品,并组建了专业医生 和运营团队。 他们将传统的康复治疗,升级成了用机器人进行评估和训练。 有"温度"的交互: 多模态、个性化,可共情的Agent能力;交互友好的软件+硬件设计。 更"生动"的理解,更"主动"的执行: 视觉、听觉、触觉等多模态感知能力;全身运动控制能力和端到端任务规划能力。 专业可靠,长期相伴: 硬件生产制造、医疗级质量合规验证。 如今已打造了 GR-1 、 GR-2 两款全尺寸人形机器人,前不久又加入开源赛 ...
首程控股赵天暘:机器人基金投资账面价值增值超3倍
新浪科技· 2025-05-05 12:19
文章核心观点 - 首程控股积极布局机器人赛道,明确长期陪伴优质企业成长策略,未来计划重点投资机器人企业,目标是成为科技与场景深度融合的生态平台 [2][3] 公司现状与策略 - 首程控股在年度股东会后召开媒体交流会,携多款前沿机器人产品首次亮相香江 [2] - 公司基金当前账面价值较原本增值超3倍,部分项目回报率高达10倍,但短期内不急于退出,选择长期陪伴优质企业成长 [2] - 公司专门成立北京首程机器人科技产业有限公司,为被投企业提供销售代理、融资租赁、供应链管理等服务,加速技术落地与商业化进程 [2] 行业发展预期 - 机器人行业爆发需要时间,人形机器人进入家庭场景可能还需5 - 10年,但关键技术突破后市场规模将远超汽车行业 [2] - 未来3 - 5年内,机器人将率先在抢险救灾、工业自动化等领域实现规模化应用,家庭场景普及需更长时间 [2] 公司未来规划 - 未来2 - 3年内,公司计划每年通过旗下基金平台投资10家以上精选机器人企业,重点布局垂直领域创新、供应链核心技术、人机交互升级智能体机器人三大方向 [3] - 公司目标是成为科技与场景深度融合的生态平台,结合基础设施不动产方面业务,其自持或基金持有的基础设施涵盖大量实际应用场景,与机器人应用是双向赋能过程 [3]
机器人领域新突破!顶刊《IJRR》近期重磅论文概述
机器人大讲堂· 2025-05-03 16:04
机器人学术研究前沿 - 新型低型软体旋转气动执行器采用纤维增强弹性体结构和精确分析模型,解决了传统设计体型庞大和建模不准确的问题,实验误差控制在20%以内[1][2][4] - THÖR-MAGNI数据集包含5类场景和40名参与者的多模态数据,支持长期行为预测和复杂避障交互研究,数据量达3.5小时[6][7][11][14][15][17] - FMB基准测试平台提供66种3D打印物体和22,500条人类演示轨迹,验证了多模态数据对任务成功率的提升效果[18][19][20][22][24][26] 机器人操作与控制技术 - 双臂机器人操作可变形线性物体的框架结合全局规划和局部控制,在仿真和真实实验中实现100%成功率,执行时间<60秒[27][28][30][31][34][37] - 大规模异构多机器人系统实时规划方法采用规划决策树结构,任务分配复杂度仅为O(n),在200个任务状态下规划时间仅16.4秒[38][39][40][42][43][45][47] - 强化学习双足机器人控制框架实现多技能统一控制,在Cassie机器人上完成400米冲刺和0.47米高跳等复杂动作[58][60][61][62][64] 人机交互与学习 - 学习与通信闭环框架通过多模态接口提升人机协作效能,AR+触觉方式使任务正确预测率达100%[48][50][51][53][54][55][57] - 机器人操作研究面临物理复杂性和泛化能力不足的挑战,需要兼顾复杂任务和广泛适应性的解决方案[19][28][39]
【ArtInHCI2025】第三届人工智能和人机交互国际学术会议,2025年10月21-23日|广西南宁
机器人圈· 2025-04-28 17:31
· 大会简介 当今世界,人工智能(AI)和人机交互(HCI)的重要性日益昭著,二者结合亦是大势所趋。继2023年首届成功举办后 第三届人工智能和人机交互国际学术会议(ArtInHCI2025)将于2025年10月21-23日在中国广西南宁举办。会议旨在为全 球的专家、学者和企业提供一个交流平台,分享最新的研究成果、技术创新以及面临的挑战。 本届会议的主题包括但不限于:人工神经网络、机器学习与深度学习、语音识别合成和自然语言处理、计算机视觉与图像 处理、人机交互的未来发展、智能机器人应用与技术等。会议还设置了主题报告、特邀报告、口头报告、海报展示等丰富 环节,以便与会者更深入地交流和合作 。 会议主席团 | 会议主席 | Chair | | | --- | --- | --- | | | | 叶娅兰教授 | | | | 电子科技大学 | | | | 研究领域:计算机视觉、图像处理、深度学习、迁移学习、生物医学信号处 | | | | 理、人机混合智能、多模式人机交互 | | | | 周挥宇教授 | | | | 英国莱斯特大学计算与数学科学学院 | | | | 研究领域:机器学习及人工智能、数据挖掘、计算机图形图像 ...