多模态大模型
搜索文档
中信证券:看好MRO头部企业利润迎来进一步释放
新浪财经· 2025-11-21 08:21
行业前景与规模 - 中国MRO工业品采购数字化率持续提升,行业规模仍有大幅提升空间 [1] - 海外成熟市场代表性厂商在度过成长期后,年营收增速能多年维持10%-20%区间 [1] - 行业竞争格局相对分散,中国MRO行业有望长期共存至少两家年营收百亿级别的公司 [1] 技术驱动与公司发展 - 全球多模态大模型持续进化背景下,中国市场的数字化和智能化进程将同步进行 [1] - 数字化和智能化进程将驱动代表性公司进一步降本增效,实现长足利润释放 [1]
从投稿来看,具身方向的论文已经出现了堆积.......
具身智能之心· 2025-11-18 18:00
研究领域与方向选择 - 具身智能研究活跃方向包括视觉语言导航、视觉语言行动、强化学习以及真实到仿真再到真实的循环方法 [1] - 人形机器人研究热点集中在强化学习与真实仿真循环方法 若实验室具备相关机器人本体可优先考虑这些方向 [1] - 机械臂本体适合开展视觉语言行动、视觉语言行动结合强化学习以及扩散策略的研究 其中视觉语言行动方向普遍对计算资源要求较高 [1] - 四足机器人平台非常适合强化学习研究 但该领域创新点已相对有限 因已有较多研究工作完成 [2] - 移动操作是结合视觉语言导航与视觉语言行动的潜在优秀研究方向 [3] 研究挑战与资源考量 - 新入行研究者面临方向选择困惑 例如在强化学习与视觉语言行动之间 或传统SLAM与视觉语言导航之间难以抉择 [1] - 研究方向选择需考虑计算资源需求差异 某些方向需要较大算力而有些则不需要 充足算力是快速产出实验结果的必备条件 [1] - 研究者需根据预算选择适合的机器人本体 预算不足时可考虑采用仿真方案替代 [1] - 优秀研究想法的产生对新研究者而言充满挑战 往往需要经历多次试错 [3] 专业服务与支持 - 提供从CCF-A到CCF-C级别会议 以及SCI一区到四区期刊的论文辅导服务 覆盖毕业论文和博士申请支持 [3] - 辅导团队由来自国内外名校博士及头部企业研究员组成 具备ICML、ICLR、CoRL、ICRA、NeurIPS、CVPR等顶级会议投稿与审稿经验 [3] - 服务提供全流程闭环辅导 涵盖选题创新点挖掘、实验设计、代码调试、论文写作到投稿策略 [4] - 辅导结合工业界与学术界双重视角 不仅关注论文发表 更注重研究成果的落地应用价值 [5]
AI+消费机器人「灵宇宙」顾嘉唯:两波红利造就新机会,好的AI产品一定要「主动」
IPO早知道· 2025-11-18 11:22
融资与公司战略 - 公司于近期完成2亿元PreA轮系列融资,投资方包括上海国际集团旗下国方创新、国泰海通、广发信德、滴滴出行、拉卡拉旗下考拉基金、润建股份等,老股东超额追投 [7] - 融资资金将主要用于产品技术研发、海内外市场拓展、LingOS操作系统与多模态AI交互技术投入,以及构建“硬件+软件+服务”一体化商业模型 [7] - 公司选定“做真正的家庭机器人和随身AI终端”的路径,旨在享受多模态大模型能力溢出和具身智能技术红利溢出两波红利 [7][11] - 公司借鉴特斯拉FSD模式,搭建数据闭环路径,构建清晰的胜率与赔率逻辑以吸引资本 [12] 产品与技术优势 - 产品矩阵包括面向0-8岁儿童的绘本阅读机器人Luka卢卡和便携式AI学伴硬件“灵宇宙小方机”,分别主打“读万卷书”和“行万里路” [9] - 核心技术壁垒为LingOS操作系统和数据飞轮,支持多模态感知、主动交互和跨设备协同,并通过终端收集儿童交互数据构建稀缺的“具身智能”训练库 [9] - 护城河体现在AI终端的容器属性,可实现持续升级,核心优势为大模型时代带来的个性化“关系算法”和从Luka积累的几十亿数据能力 [15][16] - 交互设计强调AI主动解决问题,而非用户主动指令,通过视觉主动交互等能力提升体验,使语音交互“润物无声” [17][18] 市场表现与用户洞察 - “灵宇宙小方机”上市即登顶618期间AI玩具及玩具总榜双榜第一,双十一期间在京东天猫等多平台名列前茅,京东AI玩具“品牌累计榜单”和“SKU累计榜单”双榜第一,销售额同比618增长超230% [10] - 目标用户为有极强购买力的高净值人群,对AI能力、产品作为社交货币的颜值有要求,且几乎不受低价冲击 [14] - 产品定位为“家长买的时候是学习机,孩子用的时候是游戏机”,核心满足家长“解放自己和学以所得”及孩子“陪伴、寓教于乐”的需求 [13] 市场拓展与未来规划 - 产品已覆盖全球18个国家60多个城市,海外市场潜力巨大,尤其海外华人家庭对产品需求强烈 [23][25] - 出海策略依托大模型消除语言边界,通过软件升级适配不同国家,无需重新开发硬件单品,渠道上结合代理商模式与线上电商经验复制 [24][26][27] - 未来产品规划具备“破圈”潜力,从0-15岁儿童扩展到15-30岁年轻群体、30-50岁家庭带娃及60-100岁养老等年龄段,品牌内核“灵”指向数字永生和探索未知 [20][21] - 公司探索人机交互终局为“不可见”的穿戴设备,认为AR眼镜赛道存在被大厂挤压的风险,更看好独立计算终端的发展路径 [22]
宇树科技王兴兴:AI技术将赋予机器人真正“理解世界”的能力
证券日报网· 2025-11-16 20:49
行业发展趋势 - 下一个十年机器人发展将进入"生长与绽放"阶段,从"能运动"走向"能做事",从"行业工具"迈向"生活伙伴"[1] - AI技术特别是多模态大模型与机器人的深度融合将赋予机器人真正"理解世界"的能力,使其更加敏锐和能干[1] - 场景应用将推动机器人真正"融入生活",具体体现在工业协作、养老护理和家庭服务三大领域[1] 具体应用场景 - 工业机器人将在生产线上与工人并肩协作,通过简单指令自主完成物料搬运和精密组装,将人从重复劳动中解放[1] - 社区养老服务站将出现小型护理机器人,可为独居老人提供血压测量、用药提醒和陪伴聊天服务,弥补养老护理人员缺口[1] - 家用机器人将进入普通家庭客厅,承担打扫、看护和辅助学习等任务,成为家庭的"全能帮手"[1] 产业链与生态建设 - 机器人在更复杂开放环境中可靠运行对产业链协同能力提出更高要求[2] - 行业需要携手共建生态"朋友圈",与开源社区紧密合作以加速技术成果共享并降低全行业创新成本[2] - 需与全球伙伴共同建立健全机器人伦理与安全标准,确保技术向善发展,推动人类文明迈上新台阶[2]
王兴兴:下一个十年,是机器人迈向“生活伙伴”的十年
新浪科技· 2025-11-16 10:01
行业展望 - 下一个十年将是机器人从“能运动”走向“能做事”,从“行业工具”迈向“生活伙伴”的十年 [1] - 未来十年人工智能技术将赋予机器人真正“理解世界”的能力 [1] - 伴随多模态大模型与机器人的深度融合,机器人将更加敏锐和能干 [1] 公司技术进展 - 公司研发的人形机器人已经能够完成绝大部分工作动作 [1] - 公司技术涵盖离线预学习和实时模仿复刻 [1]
京东与港科大成立联合实验室,将聚焦智能供应链与具身智能技术
新浪财经· 2025-11-14 12:59
合作成立联合实验室 - 京东集团与香港科技大学于11月14日在香港正式宣布成立联合实验室 [1] - 联合实验室由港科大郑家纯机器人研究院、京东探索研究院及京东物流共同负责 [1] 研究重点与技术方向 - 实验室将聚焦于智能供应链与具身智能技术的研究攻关 [1] - 研究将重点围绕物流、健康、零售、工业等方向展开 [1] - 技术应用将结合多模态大模型及边缘计算优化算法 [1] 具体应用场景 - 医疗健康领域的研究方向包括肿瘤预测与辅助诊疗 [1] - 零售领域的研究方向包括智能电商场景构建 [1] - 目标是形成可复制的行业智能化解决方案 [1]
京东与港科大成立联合实验室
新浪财经· 2025-11-14 12:48
合作主体与目标 - 京东集团与香港科技大学于11月14日在香港正式成立联合实验室 [1] - 联合实验室由港科大郑家纯机器人研究院、京东探索研究院及京东物流共同负责 [1] 研究领域与方向 - 联合实验室将聚焦智能供应链与具身智能技术的研究攻关 [1] - 研究将重点围绕物流、健康、零售、工业等方向展开 [1] 具体应用与创新 - 实验室将开展跨行业融合创新,重点方向包括医疗健康领域的肿瘤预测与辅助诊疗 [1] - 另一重点方向为零售领域的智能电商场景构建 [1] - 研究将结合多模态大模型、边缘计算优化算法等技术,旨在形成可复制的行业智能化解决方案 [1]
开源又赢闭源,商汤8B模型空间智能碾压GPT-5,AI看懂世界又进了一步
36氪· 2025-11-11 16:45
产品发布与性能表现 - 商汤正式发布并开源SenseNova-SI系列空间智能大模型,涵盖2B与8B两个参数版本 [1] - SenseNova-SI-8B模型在四大核心基准测试(VSI-Bench、MMSI-Bench、MindCube-Tiny、ViewSpatial)中获得60.99的平均成绩,大幅领先同级别开源及专注空间理解的模型,如Qwen3-VL-8B(40.16)和SpatialMLLM(35.05)[1] - 在8B参数规模下,该模型平均成绩已领先闭源模型GPT-5(49.68)与Gemini-2.5-Pro(48.81)[2] 技术突破与训练方法 - 性能提升得益于系统性的训练机制设计,公司研究团队构建了“空间能力分类体系”并扩充空间理解数据规模 [2] - 首次在空间智能领域验证了“尺度效应”,即随着数据量与质量的增长,模型的空间认知能力同步增强 [5] - 该训练方法具备通用性,能支持多种基座模型进行空间能力的增强迁移 [5] 具体能力对比与优势 - 在六道典型空间智能题目测试中,SenseNova-SI-8B全部答对,而GPT-5在俯视图判断、相对方位判断等题目上均出现误判 [6][8][10][12][15][16] - 测试题目覆盖空间智能多个关键维度,包括视角转换、物体方位与移动方向推理等,显示该模型在空间理解与推理上表现更稳定 [18] 战略整合与行业应用 - SenseNova-SI作为空间能力组件,将接入公司今年7月发布的“悟能”具身智能平台,补强模型在三维结构认知方面的基础能力 [19] - 公司同步开源了空间智能测评平台EASI,旨在统一测评口径、展示模型进展和推动开源生态合作 [19] - 空间智能是支撑具身智能与世界模型发展的核心能力,将为自动驾驶、机器人等落地应用提供更坚实的基础 [24]
十五运开幕式上人形机器人如何协作奏乐?揭秘→
人民日报· 2025-11-11 10:13
技术突破 - 人形机器人实现群体智能、多模态大模型及“类人眼”双目立体视觉感知等关键技术突破 [1] - 机器人演奏达到毫米级敲击定位精度,误差控制在2毫米以内 [1] - 三个机器人动作同步误差在10毫秒以内,并能以媲美人类乐师的稳定力度进行精准自主敲击 [1] 应用展示 - 三个代表粤港澳三地的人形机器人在第十五届全国运动会开幕式上协作演奏“青铜句鑃” [1] - 演奏乐器为出土于广州的“青铜句鑃”,最大者高64厘米重40公斤,最小者高36.8厘米重10.75公斤 [1] - 此次演示体现了人形机器人处理复杂、高精度协作任务的能力 [1]
人形机器人如何协作奏乐?(秒懂全运)
人民日报· 2025-11-11 06:15
人形机器人技术展示 - 在第十五届全国运动会开幕式上,3个人形机器人成功协作演奏古代乐器“青铜句鑃”[1] - 机器人演奏实现了毫米级的敲击定位精度,误差在2毫米内,动作同步误差在10毫秒以内[1] - 机器人能以媲美人类乐师的稳定力度进行精准自主敲击[1] 技术突破细节 - 工程师团队在群体智能、多模态大模型、“类人眼”双目立体视觉感知等人形机器人技术上取得突破[1] - 这些技术突破使得机器人能够完成对敲击位置与力度要求极高的复杂演奏任务[1] 任务挑战与设备参数 - 演奏“青铜句鑃”需精准控制敲击位置与力度,对人类乐师都颇具挑战[1] - 使用的“青铜句鑃”乐器大小不一,最大的高64厘米、重40公斤,最小的高36.8厘米、重10.75公斤[1]