Workflow
多模态数据
icon
搜索文档
畅想2026:第一部分
36氪· 2026-01-17 08:03
文章核心观点 文章预测了到2026年科技行业将出现的多个关键发展趋势,核心观点是人工智能(AI)将从工具演变为基础设施和协作伙伴,深刻重塑企业运营、数据管理、内容创作、网络安全、医疗健康及教育等多个领域,商业的终极护城河将从流量转向协作与个性化[1] 基础设施 - 梳理非结构化、多模态数据成为时代性机遇,企业需要持续清洗、结构化、验证和管理数据以支持下游AI任务,应用场景包括合同分析、理赔处理、客户支持等[2] - AI将通过自动化重复工作重塑网络安全招聘,到2026年,AI原生工具将帮助安全团队自动化处理大部分冗余工作,从而填补从2013年的不足100万到2021年300万的网络安全职位空缺[3] - 智能体原生基础设施将成为准入门槛,企业后端需从服务“人类速度”流量重构为应对具有递归性、突发性的“智能体速度”负载,下一代系统需将“惊群效应”视为默认状态[4][5] - AI原生数据栈持续演进,数据与AI基础设施正变得密不可分,AI将继续变革数据栈的多个部分[7] 增长 - 到2026年,“记录系统”(如ITSM、CRM)将失去核心地位,AI缩短意图与执行距离,将其从被动数据库转变为自主工作流引擎,界面将演变为动态的智能体层[8][9] - 垂直AI从信息检索和推理演进为“多人协作”模式,通过在利益相关者(如买方、卖方、顾问)的AI之间进行协调、路由和同步变更来提升价值与切换成本[10][11] - 创作和软件设计将转向“为智能体设计”,优化方向从视觉层级和人类可读性转向“机器可读性”,以方便智能体进行检索和解读[12] - AI应用将告别“屏幕使用时长”KPI,转向基于结果定价,价值衡量取决于更复杂的投资回报率(ROI),如医生满意度、开发者生产力等[13][14] 生物与健康 - 到2026年,“健康的月活跃用户”(Healthy MAUs)将成为医疗科技领域新的核心客户群体,这群人没有生病但希望定期监测健康,代表消费群体中潜力最大的一部分[15] - 随着AI降低护理成本、新型医疗保险产品出现以及消费者习惯订阅服务,“健康的月活跃用户”群体将因其持续参与、数据驱动和预防导向特性而极具潜力[16] 内容创作与媒介 - 到2026年,AI创作工具将走向多模态,用户可向模型提供任何形式的参考内容(如图片、声音、视频)并与之协作创作或编辑场景,内容创作是AI的杀手级应用场景之一[6] - 视频将转变为可步入、可开发的空间,视频模型能理解时间、保持内在一致性,使得动作产生意义,机器人训练、游戏演进、智能体学习等成为可能[7] - AI驱动的世界模型将通过生成交互式虚拟世界和数字经济彻底改变叙事方式,模糊玩家与创作者界限,催生“生成式多元宇宙”和新的经济前沿[17] 个性化与教育 - 2026年将成为“自我之年”,产品和服务将实现高度个性化,例如AI导师适应学生进度、AI根据生物特征设计健康计划、AI重组个性化媒体信息流[18][19] - 将出现首所AI原生大学,该机构完全围绕智能系统构建,课程、咨询、评估等均能实时学习和自我优化,培养精通与AI系统协作的人才[20][21][22]
Agent时代,为什么多模态数据湖是必选项?
机器之心· 2026-01-15 08:53
文章核心观点 - AI工业时代已至,企业竞争的关键从应用层转向底层数据基建,构建能够支撑多模态数据规模化落地的数据基座是构筑核心竞争力的战略资产 [1][2][3][4] - 多模态数据湖是企业参与Agent时代竞争的必选项,其价值在于将沉睡的非结构化数据转化为可被AI模型直接消费和学习的战略资源,驱动业务与模型的增长飞轮 [9][14][19][21][57] - 企业数据基建需从“存储中心”升级为“价值中心”,并具备业务优先、开放解耦的特质,以应对技术快速迭代并转化为长期竞争力 [38][39][42][44][45] AI时代数据基建的战略重要性 - AI下半场的竞争焦点在于用AI思维重构业务,其基础是数据能被模型直接“消费”并进行跨模态关联推理 [4][5] - 超过80%的企业数据将是非结构化的,唤醒这些“数字负债”是在Agent时代构建竞争力的工程前提 [16][19] - 强大的数据基建能构建数据、模型与业务深度耦合的闭环,实现“业务滋养模型、模型反哺业务”的持续进化 [20][21] - 统一的多模态数据基座能为企业提供“基建不动,技术常新”的工程确定性,支持业务低成本快速拓展 [22][24][25] 多模态数据湖的价值与应用 - 多模态数据湖通过向量化等技术,让非结构化数据(如视频、音频、图像)从被动存储变为可随时调用、持续学习的战略资源 [18] - 在智能驾驶、游戏、传媒、电商、制造业等行业,多模态数据的处理与使用能力正直接影响商业竞争的形态与上限 [6][10][17] - 实践案例表明多模态数据湖能显著提升业务效率:某智驾企业实现12亿级别数据“以图搜图”响应在150–200毫秒内,性能提升20倍以上;某游戏企业音视频数据加工效率提升50%;某头部传媒企业内容生产与运营效率提升90% [59] 企业数据基建升级路线图 - 升级分为三个阶段:异构算力与分布式引擎阶段(核心是让数据“进得来,跑得快”,原生支持AI服务)[30];模型即引擎与多模态重构阶段(核心是通过向量化实现多模态数据统一语义转换,使数据对模型友好)[31];全域数据治理与平台融合阶段(核心是统一管控数据资产,激活价值并确保安全合规)[33] - 该演进路径旨在帮助企业从“拥有模型”过渡到“驾驭智能”,使多模态数据湖从技术底座演变为全域智能中枢 [27][28][34] AI时代数据基建的选型关键 - 数据基建需从“存储中心”转向“价值中心”,核心价值在于数据能否被快速获取、被模型理解并参与推理 [38][39] - 应坚持业务优先的实用主义,衡量标准在于能否以最低成本、最快速度完成从数据到业务决策的闭环 [40][41][42] - 必须具备开放解耦的能力,通过模块化、可替换的基础设施对冲技术路线快速更迭带来的不确定性,将技术不确定性转化为长期竞争力 [43][44][45] - “乐高式”可组合底座是一种先进的理念,它通过提供原子化引擎和开放工具集,赋能企业自主、灵活地按需编排解决方案,成为主导者而非被动使用者 [48][49][50]
诺亦腾机器人完成Pre-A+轮融资,启明创投领投
雷峰网· 2025-12-22 09:33
公司融资与资金用途 - 公司近期完成Pre-A+轮融资,累计募集资金已达数亿元人民币 [2] - 本轮融资由启明创投领投,五源资本、君联资本等机构参与,经纬创投、英诺天使基金追加投资,并实现超额认购 [2] - 融资资金将主要用于具身智能多模态数据采集、处理与交付的技术研发,加速规模化数据生产体系与工程化平台建设,以及完善核心团队配置以提升产品化交付与服务能力 [2] 公司定位与商业模式 - 公司是一家面向具身智能与人形机器人产业的数据公司,以“数据”为核心交付界面 [2] - 公司为机器人企业、具身智能模型团队等提供高质量、可规模化的训练数据与相关基础设施能力 [2] - 公司选择从数据基础设施这一底层环节切入,专注构建面向产业的技术与平台能力 [3] 核心技术团队 - 创始人/CEO戴若犁博士是动作捕捉与人机交互领域资深技术专家,拥有超过15年的前沿创新经验 [3] - 首席科学家韩磊博士曾任腾讯Robotics X Lab具身智能中心负责人,是机器人与强化学习领域的领军学者 [3] 数据采集方法与战略 - 公司探索以人为中心的数据路径,跳出与本体绑定的遥操作范畴 [3] - 公司将真实数据采集分为工厂采集和野采两种方式 [3] - 工厂采集保证数据的多维度、多模态和高精度,并追求跨本体能力,公司已在国内外建成专业“数据工厂” [4] - 野采在真实日常场景中采集人类自然行为数据,以补充工厂数据的场景局限,追求视觉泛化性 [4] 市场合作与行业地位 - 公司已与六、七十家头部机器人公司产生深度合作 [1] - 合作覆盖多个维度,包括数采设备提供、模仿学习训练数据支持、中小体量数据集授权以及大体量数据集的定制化 [4] - 公司的数据路径体系已在服务全球数十家人形机器人企业及具身智能模型客户的交付实践中得到验证 [4]
海天瑞声20251031
2025-11-03 10:36
公司概况 * 公司为海天瑞声 专注于AI数据服务[1] 财务表现与预期 * 2025年第三季度收入为7,764万元 同比增长36%[3] * 第三季度收入增速放缓至30% 主要因部分国央企项目确收延迟[7] * 全年收入增速预计与前三季度持平 保持在57%左右 全年业绩表现依然强劲[2][7] * 预计未来两到三年公司年均复合增长率能达到40%至50%[16] 战略布局与核心业务 政府与国央企合作(G类业务) * 公司与中移动等战略性股东合作 对接成都 长沙 保定等国家级数据标注基地[2][3] * 预计2025年第四季度完成成都和长沙数据集交付 总量达数百万条[2][3] * 与广西政府合作建设面向东盟国家的权威语料库 预计2026年交付东盟五国数据 收入达2000万元[2][4] * 东盟语料库类业务占三季度境内单季收入的15% 全年占比将提升至境内总收入的40%左右(约8,000万元)[4] * 公司与约十几家央企合作 包括中国移动 中国联通 中国电信等 参与国家级AI焕新社区项目[3][8] * 在地方政府数据要素产业化方向已成立7个子公司并成功交付项目[8] 传统客户与市场需求 * 传统客户为国内外科技大厂 需求集中在多语种 高端专业化及提升交互自然度的数据[2][5] * 公司已在这些领域进行布局 以满足客户对多语种语音识别 手写体 文本数据等的需求[2][5] 新兴业务拓展 * 海外内容审核业务:运营菲律宾基地(规模约1,500人) Q3贡献收入约2000万元[2][6] 该基地今年贡献收入超过7,000万元[14] * 具身智能领域:成立具身智能事业部 与机器人本体公司 科技企业及地方政府合作 提供高质量训练数据集服务[2][6] 已有国内民营科技巨头释放大量需求 预计明年中报收入达千万级别[10] * 多模态数据技术:为快手可灵等提供高端数据服务 Q3仅快手就贡献收入近1,500万元[3][11][12] 多模态数据处理需求正不断增加[13] 重要合作伙伴与项目 * 与华为合作始于升腾系 通过军团制销售算力[3][9] * 首个落地项目为陕西文旅集团"博观大模型" 验证华为提供算力 海天负责数据和算法应用的模式[3][9] * 该模式已在北京门头沟区复制(涉及2000个数字人形象) 计划推广到更多垂直领域和省份[9] 其他重要信息 * 公司认识到海外自主可控交付能力的重要性 计划扩展至印尼市场 并与当地院校合作招募专家级标注员以承接北美高端定制化业务[14][15] * Deepseek在文本处理上的创新突破提升了OCR数据需求 未来含有文字的多模态数据处理需求将会增多[13]
破解机器人产业瓶颈,北京这个训练中心年产百万数据
北京日报客户端· 2025-08-16 09:20
人形机器人数据训练中心概况 - 北京首个人形机器人数据训练中心位于首钢园,占地3000平方米,每年可产出超百万条高质量多模态数据[1] - 中心划分为"九年一贯制"训练区和"机器人大学"场景区,覆盖家庭康养、特种作业、新零售等十大实景应用场景[1] - 中心部署108台形态多样的机器人,包括具身双臂升降机器人、轮式人形机器人、单臂无人机等,实时采集动作数据[1] 数据对机器人行业的重要性 - 高质量、多样化、贴近真实世界的多模态数据是训练机器人AI模型的必备"养料",决定其通用能力[2] - 单个简单动作(如叠毛巾)需成千上万次重复训练才能形成标准化知识储备[2] - 行业核心痛点包括跨场景数据通用性不足、仿真与真实场景差距大、缺乏标准化数据格式与闭环迭代生态[2] 训练中心的战略定位与生态建设 - 中心定位为集研发、测试、培训、合作为一体的前沿基地,构建"数据-训练-验证-落地"全栈式服务能力[2][3] - 汇聚元客视界、艾欧智能等十余家产业链企业技术,形成覆盖感知、决策、执行的生态矩阵[3] - 联合鹏城实验室、上海人工智能实验室等机构搭建全闭环智能训练场,已服务海内外顶尖大模型及机器人企业[3] 商业化应用前景 - 规模化应用产生的真实数据(非仿真数据)是推动行业发展的关键,需先解决操作能力与成本问题[2] - 中心聚焦家庭服务(收纳、清洁)、农业(采摘)、工业(汽车装配)等场景的实操数据采集[1][2]