Workflow
人机交互
icon
搜索文档
培育大模型产业生态需要制度革新丨法经兵言
第一财经· 2025-06-16 19:51
大模型产业生态发展模式 - 上海形成"政策引领+生态协同+场景驱动"三位一体发展模式 具有示范效应 [1] - 大模型产业生态需通过基础模型研发推动人工智能商业化落地应用 [2] 大模型定义与特征 - 人工智能大模型基于深度神经网络构建 参数规模达数十亿至数万亿 [2] - OpenAI完成行业标准定义 DeepSeek实现架构创新和工程优化 大幅降低训练与推理成本 [2] - 大模型产业生态由数据/算法/算力要素 多元主体和多层级产业链组成复杂体系 [2] 生态形成必要性 - 大模型技术复杂 需协同整合高质量数据与算力资源 [3] - 通用大模型需结合场景精准适配 生态化可降低研发成本提升创新效率 [3] 生态形成必然性 - 数据/算法/算力三要素强耦合性决定生态化发展方式 [3] - 开源趋势吸引开发者接入 多场景碎片化需求驱动产业链协同 [3] 发展趋势 - 多模态融合实现文本/图像/语音/视频处理与跨模态推理 [4] - 开源生态降低应用门槛 加速跨行业资源共享与场景创新 [5] - 人机交互增强环境交互性与自主性 应用于交通/医疗/工业等领域 [5] 制度革新需求 - 需构建符合大模型发展规律的制度体系 实现技术刚性与制度弹性平衡 [7] - 基础设施层需推动数据分类分级与算力合理布局 [7] - 技术模型层需建立统一标准 加强开源社区管理与知识产权保护 [8] - 服务应用层需建立责任分类模式 压实平台内容合规责任 [9] 治理原则 - 需平衡创新发展与安全运行 为应用创新留空间同时划定红线 [10] - 平台需明确数据获取底线 调整避风港原则与合理使用原则适用 [10]
Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到?
量子位· 2025-06-13 13:07
机器人技术进展 - Figure 02机器人展示60分钟未剪辑的物流分拣视频,显示其在实际工作场景中的表现[1] - 机器人能够灵活处理多种形态包裹,包括硬纸盒、聚乙烯袋、信封等可折叠或弯曲物品[10] - 通过即时调整抓取策略,机器人可对不同形态包裹采取不同处理方式,如双手翻转纸盒或单手轻捏信封边缘[13] 技术性能提升 - 通过扩展高质量演示数据集和改进Helix神经网络架构,机器人工作稳定性和性能显著提升[7] - 包裹平均处理速度达到4.05秒,吞吐量提高58%,条形码识别成功率从88.2%升至94.4%[17] - 引入视觉记忆、状态历史和力反馈模块,使机器人具备时间背景感和环境适应能力[20][22][28] 系统功能特点 - 机器人具备自主学习能力,能够从演示中学习自适应行为如拍打塑料包装抚平条形码[15] - 采用端到端学习模型,可实现人机自然交互,无需单独程序即可识别人类交接物品的意图[31] - 新策略使条形码识别成功率提升至94%,处理时间降至4.05秒,精度保持在92%以上[30] 行业应用前景 - 技术改进使机器人系统更加灵巧可靠,接近人类水平的工作速度和准确性[19] - 机器人参与物流工作引发行业对效率和成本优势的关注[37] - 仿人型机器人在物流领域的应用引发关于外形设计与效率关系的讨论[39]
拿下数亿订单,大型央国企是其客户,深圳人形交互机器人公司融资数千万|早起看早期
36氪· 2025-06-12 07:48
公司融资与背景 - 数字华夏完成数千万元天使+轮融资 由同创伟业独家投资 资金将用于技术研发 产品迭代和生产交付提速 [4] - 公司成立于2024年3月12日 聚焦AGI机器人规模商用 核心产品包括仿人机器人夏澜 通用人形机器人夏起和IP系列机器人星行侠 [4] - 创始人沈健有20年IT头部企业管理经验 曾带领公司实现从0到100亿营收 核心团队来自国内外顶尖高校 具备商业化经验及客户资源 [6] 行业前景与战略 - 中国人形机器人市场规模预计2025年达30亿美元 复合年增长率19.7% 交互服务机器人占比最大 [8] - 交互服务领域机器人技术成熟度更高 商业化潜力显著 需求日益旺盛 仿人机器人多场景适配能力强 [8] - 公司采用1+3+3战略布局 搭建巨号®具身智能交互平台 集成多模态感知 情感洞察和类人垂域智能功能 [8] 产品与技术 - 夏澜®仿人机器人搭载29个主动自由度 实现面部颈部精准表情表达 具备多模态交互能力 支持复杂环境自主移动 [9] - 星行侠®是首款双形态人形机器人 支持轮式/双足自由切换 覆盖1万平米以上区域 续航超10小时 可跨楼层任务 [11] - 夏起®通用人形机器人面向工业制造 商超服务等场景 提供接待引导 智慧康养等功能 [9] 商业化进展 - 已构建客户IP定制 联合运营和自有IP三大商业模式 与瑞贝卡合作在门店部署夏澜®作为展示模特 [12] - 2024年已获数亿元订单 客户包括头部ICT厂商 地方电网 大型国央企及高校 预计年内交付上千台 [12] - 产品开始小规模交付 通用和仿人机器人系列已进入交付阶段 [3][12] 投资方观点 - 同创伟业认为具身机器人是万亿级赛道 数字华夏选择交互服务场景具有差异化优势 [13] - 看重公司研发能力和场景落地能力 创始人产业背景深厚 客户拓展策略成熟 [13]
深度|AI语音独角兽11Labs创始人:“人性”中的不完美,恰恰是人愿意互动的关键
Z Potentials· 2025-06-09 11:34
公司概况 - ElevenLabs是一家2022年由前谷歌工程师Piotr Dabkowski与前Palantir策略师Mati Staniszewski创立的AI语音合成公司,专注深度学习技术开发自然语音 [2] - 2025年1月完成1.8亿美元C轮融资,估值达33亿美元 [2] - 年经常性收入(ARR)已突破1亿美元,语音转文本模型Scribe v1支持99种语言且准确性领先 [3][2] 技术突破 - 核心技术突破在于让AI语音加入"人性化特征"如笑声、呼吸音等不完美细节,使合成声音更真实有情感 [9][19] - 首次重大突破发生在2022年11月,实现AI模拟人类笑声并获用户积极反馈 [10][13] - 语音转文本模型采用Transformer架构和Diffusion Models技术,最初聚焦影视配音但扩展至更广泛交互场景 [8][9] 产品应用场景 - 已应用于医疗领域帮助渐冻症患者重建声音,包括协助美国国会议员在失声后继续工作 [26] - 与游戏公司合作复刻角色语音(如Darth Vader),保持角色特质同时支持低延迟交互 [20] - 物流行业客户通过加入语气词使语音Agent通话完成率提升2个百分点 [19] 行业趋势 - 语音交互将向多模态发展,未来1-2年实现"语音版图灵测试"(无法区分AI与人类) [15][16] - 交互式媒体(如游戏NPC对话)和智能客服是下一个爆发场景,将重构传统客户支持流程 [21][22] - 语言壁垒将被打破,AI可实现跨语言语音转换并保留原说话者情感语调 [40][41] 商业模式 - 采用基础研究+产品开发双轨模式,既研发底层模型也构建终端应用 [30][31] - 典型客户落地周期为3个月完成概念验证,1年内正式上线 [24] - 企业应用分两类:效率优化(如客服自动化)和增长驱动(如交互式品牌体验) [23][25] 安全机制 - 采用内容溯源系统,所有生成语音可追踪至创建者身份 [34] - 开发公开分类器检测AI生成语音,未来计划通过设备端加密验证真人发声 [35][36] - 提出三层认证体系:真人验证、授权Agent水印、未认证内容默认标记为AI生成 [37] 企业文化 - 受Disney启发注重叙事能力,通过技术使用户融入产品故事线 [42][43] - 管理层定期参与客户支持,保持与终端用户的直接联系 [44] - 核心优势在于专注语音领域并整合研究与应用,形成技术壁垒 [30][44]
【深圳特区报】数字华夏创始人兼CEO沈健:用“有温度”的机器人开启人机交互新时代|创新创业深圳人
搜狐财经· 2025-06-03 07:40
人形机器人行业与数字华夏公司发展 行业趋势与公司定位 - 人形机器人被视为"硅基生命",未来有望像碳基人类一样无所不能,但目前技术相当于三四岁孩子的水平[8] - 行业正在解决"有无问题",商业化不必等待技术完美,可先专注单一品类再扩展[11] - 深圳的产业基础、创新基因和创业氛围成为吸引机器人企业的重要因素[9] 公司创始人与战略转型 - 创始人沈健拥有18年计算机行业经验,曾带领企业实现从1亿元到百亿元营收的跨越[9] - 2023年底决定转型人形机器人领域,认为机器人本质是"大号计算机",可复用算力、算法和数据积累[9] - 2024年3月成立数字华夏,定位通用人工智能机器人规模化商用,战略方向为"人形交互机器人"[10] 产品技术与创新 - 女性全脸人形机器人"夏澜"拥有29个电机,能模拟人类41块面部肌肉,表情通过算法实时生成而非预设[10] - 产品具备视觉识别、声源定位和情绪感知能力,可产生共情反馈,实现"有温度"的交互[10] - 产品线包括"夏澜"(全脸)、"夏起"(半脸头盔式)和"星行侠"(轮足可分离式),覆盖导购、陪护、政务等场景[10] 商业化进展与目标 - 成立5个月即发布产品,首年获超4亿元意向订单[11] - 2024年销售额突破数千万元,2025年目标为数亿元[11] - 短期聚焦细分领域专家角色(如银行引导员、养老陪护员),长期目标为家庭全能保姆[11] 市场反馈与行业影响 - "夏澜"在2024年世界机器人大会亮相后引发广泛关注[10] - 交互能力测试显示机器人可对答如流、即兴编笑话,获"出乎意料地好"评价[1] - 公司提出"人因设计"理念,从外形到交互逻辑均追求"有温度",引领交互机器人新模式[10][12]
影石创新IPO,AI眼镜上新,通信设备成为新华出海指数本周最大亮点
中国金融信息网· 2025-05-30 20:55
影石创新IPO及市场表现 - 影石创新开启科创板IPO申购 拟募资4 64亿元 发行价格47 27元/股 发行市盈率20 04倍 [1] - 2022-2024年营业收入实现三连跳 分别为20 41亿元 36 36亿元 55 74亿元 三年复合增长率65% [2] - 同期净利润分别为4 07亿元 8 30亿元 9 95亿元 境外销售收入占比超75% 主要依赖美国(22 92%) 欧洲(24 23%)和日韩(7 66%)市场 [2] - 2023年消费级全景相机市占率达67 2% 全球连续六年第一 运动相机领域2024年上半年销量超越GoPro成为全球第一 [2] AI智能眼镜行业动态 - 2025年被业内视为AI眼镜爆发元年 全球销量预计突破550万台 同比激增135% [3] - 蜂巢科技推出界环AI音频眼镜新品 集成多模态AI模型 支持语音交互 价格区间249-1299元 [3] - 致敬未知与宝岛眼镜母公司发布联名产品NSVEx BleeqUp AI运动拍摄眼镜 整合护目 拍摄 音频 智能剪辑等功能 [3] 消费电子行业趋势 - 智能影像设备和AI眼镜正从尝鲜玩具向实用工具演进 覆盖工作 生活 娱乐等多维度场景 [4] - 中国消费电子品牌凭借供应链整合 规模化生产及AI技术突破 在全球市场竞争力持续提升 [4] - 新华制造出海50和新华TMT出海50指数本周逆势上涨 通信设备 航空装备 游戏行业贡献显著 [4][5] 指数表现数据 - 新华制造出海50指数本周涨0 29% 通信设备 航空装备为主要贡献行业 近1年收益8 08% [5] - 新华TMT出海50指数本周涨0 17% 通信设备 游戏行业表现突出 近1年收益11 64% [5]
融资43亿!脑机接口独角兽估值飙至650亿!
思宇MedTech· 2025-05-30 17:12
Neuralink融资与估值 - Neuralink完成新一轮6亿美元融资,投前估值达90亿美元,显著超出市场传闻的5亿美元募资目标 [2] - 公司自2023年起融资步伐加快,2023年8月获2.8亿美元,数月后又完成4300万美元追加融资,累计估值一年间几近翻倍 [5] 技术核心与产品构成 - Neuralink技术核心由N1植入体与R1手术机器人构成,形成闭环神经接口平台 [7] - N1植入体尺寸为23mm × 8mm,采用生物相容性材料,配备无线充电模块,可长期植入人体 [8] - N1集成1024个电极触点,分布于64根超细柔性线程,显著提升神经信号获取密度 [10] - R1手术机器人配备五个摄像头模组及OCT系统,可实现毫米级精准植入 [13][15] 应用场景与临床进展 - Blindsight视觉植入系统获FDA"突破性医疗器械"认定,目标为视网膜或视神经损伤导致失明的患者 [16] - 系统通过电极刺激视觉皮层,初代版本可产生光点感知,长期目标包括感知红外线、紫外线等波段 [18] - 探索无声交流算法和脑控智能家居系统,拓展人机协同与认知增强方向 [19] - 2024年1月完成全球首例人体植入手术,患者术后可通过意念操控电脑光标 [20] - 截至2025年2月,美国PRIME研究项目中已有三名患者完成植入,合计使用时长超4900小时 [22] 行业动态与政策支持 - 摩根士丹利预计脑机接口领域将在五年内实现医疗用途商业化 [23] - 美国BCI市场潜力高达4000亿美元,其中四分之一集中在神经运动障碍领域 [23] - 中国医保局为脑机接口新技术价格单独立项,设立植入费、取出费等价格项目 [23] - 湖北省率先落实脑机接口价格项目,植入费、取出费、适配费分别为6552元/次、3139元/次、966元/次 [25] 未来展望 - Neuralink逐步建成闭环神经系统平台,覆盖视觉、运动、认知等多维通路 [26] - BCI赛道未来将是科研、工程、临床、市场、政策多轴协作的系统工程 [27]
对话智元魏强:解码会跳舞能讲脱口秀的“硅基少年”灵犀X2
南方都市报· 2025-05-25 15:20
产品升级 - 灵犀X2关节扭矩较前代提升50%,可应对15度斜坡路面,标配25-31个自由度,旗舰版搭载10自由度的灵巧手OmniHand [1] - 关键突破是搭载自研"硅光动语"多模态大模型,实现视觉、语音、触觉等数据的融合处理 [1][3] - 研发制造成本下降:复用全栈技术平台降低研发费用,供应链规模化使关节模组等成本下降,量产数千台摊薄硬件成本 [4] 安全性能 - 配备柔性中空外壳缓冲碰撞、硬件急停按钮强制断电,在文旅场景中可自动保持平衡 [4] - 借鉴自动驾驶安全设计理念,通过传感器、激光雷达与人群保持距离,异常阻力下立即停止动作 [6][7] - 创新使用柔性材料外壳,保护周围人和物品,避免内部器件因撞击受损 [8] 交互能力 - 配备摄像头、麦克风阵列和情感计算引擎,主动感知人类情感与意图,发起自然互动 [9][11] - 硅光动语大模型支持角色性格定制,通过持续学习适应用户偏好,形成独特性格 [11] - 能判断人类状态,避免打扰忙碌者,自动绕开障碍物,实现自主导航避障 [11] 文娱场景应用 - 在中国移动展厅担任讲解员,通过自由问答和主动迎宾提升用户体验 [11] - 通过二次开发适配脱口秀、舞蹈表演,与主题公园合作开展巡演活动 [12] - 群控算法支持多机协同跳舞,动捕设备允许自主编排动作,探索机器人相声或乐器演奏 [12][14] - 支持接入合作伙伴知识库,在博物馆、科技馆等场景提供个性化讲解 [16] 教育场景应用 - 开放灵巧手控制接口和底层电机模组权限,支持开发者研究交互能力和作业能力 [17][19] - 提供一站式开发平台,开发者可专注特定算法模块,简化研究流程 [17] - 未来计划融入学校机器人课程,助力理论与实践结合 [19] 发展战略 - 坚持"由简到繁"路径,先在文娱、教育、康养等固定场景打磨产品,再向开放场景扩展 [20] - 长期目标是进入家庭,成为保安、保姆、保洁"三保"陪伴者 [20] - 认为2025年是人形机器人商业化关键年,行业关注度提升,产品向量产方向发展 [22]
余承东,清华大学演讲!
证券时报· 2025-05-23 12:39
鸿蒙操作系统发展 - 华为常务董事余承东在清华大学演讲中强调鸿蒙操作系统需依靠核心技术走向成熟,并呼吁更多开发者加入鸿蒙生态 [1] - 华为近期发布全球首款鸿蒙折叠电脑MateBook Fold非凡大师版,起售价23999元,搭载专项增强的鸿蒙系统和顶级屏幕 [1] - 同时发布全球首款鸿蒙笔记本电脑MateBook Pro,起售价7999元,标志着国产操作系统在PC领域取得突破 [1] 鸿蒙市场表现 - 鸿蒙系统在中国手机操作系统市场份额达19%(2024年Q4),连续四季超越iOS成为第二大系统 [2] - 行业专家指出16%市场占有率为生态成功分水岭,鸿蒙已超过该阈值 [2] 公司动态 - 华为2025校园公开课以"创新引领未来·共建鸿蒙世界"为主题,由余承东主讲 [1] - 余承东拥有清华大学硕士学历,1993年加入华为,现任常务董事兼终端BG董事长 [2]
如果想认真做AI,就要把硬件做出来
虎嗅· 2025-05-23 09:34
合作背景 - OpenAI与苹果前设计总监Jony Ive领导的硬件公司io合作,目标出货1亿台设备 [1] - 团队包括苹果前设计高管Evans Hankey和Tang Tan,形成"最强硬件+AI"组合 [1] - 合作背景是苹果在AI领域进展缓慢,用户期待Ive团队实现创新突破 [1] 产品愿景 - 目标是开发对屏幕依赖低的新型交互设备,减轻手机成瘾性 [2] - 核心功能是提供通信和生产力服务,同时减少屏幕通知干扰 [3] - 追求全新自然的人机交互方式,利用大模型性能提升实现网状主动式Agent体验 [4] - 产品形态非手机非眼镜,可放置桌面,计划2026年推出 [8] 技术布局 - OpenAI已投资多家人形机器人和AI硬件企业,包括1X、FigureAI等 [6] - 2024年2月提交AI消费电子设备商标申请,重组机器人团队 [6] - 新产品需突破"性能-体积-功耗"三角限制,实现移动场景覆盖 [9][10] 市场定位 - 目标年销量1亿台,超过初代iPhone表现 [8][10] - 不定位为利基产品,未来规划"设备家族"系列 [8] - 对比Meta智能眼镜年销量仅200万副,行业整体未达规模效应 [10] 交互设计 - 可能整合环境感知(摄像头/传感器)、记忆功能和个性化推理 [15] - 避免AI Pin类产品的冗余交互动作,追求自然隐形的交互方式 [13] - 区别于Vision Pro等固定场景设备,强调移动场景覆盖 [10] 行业动态 - 谷歌与Meta在智能眼镜领域展开竞争,均布局AI助手集成 [11] - 中国厂商雷鸟、Rokid等推出AR眼镜,但市场规模有限 [10] - 垂直领域AI硬件如录音笔转型产品面临智能手机挤压 [14] 产品挑战 - 需解决Humane AI Pin等前代产品交互设计失败的问题 [6][13] - 要突破智能眼镜200万副/年的行业销量天花板 [10] - 需平衡创新交互与实用功能,避免高开低走 [13][14]