Workflow
FysicsEval
icon
搜索文档
近亿融资落地!飞捷科思发布首个全模态物理AI基础模型-OmniFysics,让机器真正理解世界
创业邦· 2026-02-11 08:07
公司融资与定位 - 飞捷科思智能科技(上海)有限公司近日完成近亿元Pre-A1轮融资,由经纬创投与东方富海联合领投,沐曦股份、驰星创投等机构参与投资 [2] - 公司定位为Physical AI(物理AI)核心基础设施供应商,专注于自主研发面向具身智能的新一代可微分、多物理统一求解物理仿真引擎 [2] - 该仿真引擎适配主流及国产GPU,支持大规模并行仿真,旨在通过生成高质量合成数据,解决机器人训练数据匮乏的行业痛点 [2] 行业痛点与解决方案 - 现有顶尖多模态大语言模型在物理感知层面面临巨大的“认知鸿沟”,导致模型在生成任务中产生违反因果律的“物理幻觉”,在推理任务中依赖浅层语义标签而非内在物理属性与参数,限制了其在真实物理世界中的可用性、可靠性与泛化能力 [2] - 其根本原因在于关键的物理属性在视觉上具有天然的模糊性,且在现有网络规模数据中缺乏显式的表征与对齐,导致模型难以通过跨模态线索消除歧义 [2] - 为突破物理认知瓶颈,公司推出了OmniFysics——一款面向真实世界的全模态物理AI基础模型,旨在统一图像、音频、视频和文本的跨模态理解,并集成高保真语音与图像生成能力 [3] - OmniFysics通过注入显式物理知识,重塑AI模型对物理规律的感知与预测,弥合隐式神经表示与显式物理知识之间的鸿沟,为构建能真正理解并与物理世界互动的具身智能体奠定基础 [4] 核心技术:双中枢数据生态系统 - 为解决高质量物理对齐数据稀缺问题,团队构建了双中枢数据生态系统 [4] - **FysicsAny中枢**:针对静态属性,通过“感知-检索-验证”的五阶段专家协作机制,结合物理定律约束与分层知识检索,构建了包含943K(即943,000)验证物理标签和4.7M(即4,700,000)对指令-图像的首个大规模物理属性数据资产 [4][7] - FysicsAny中枢构建了包含300个标准物理原型的数据资产,涵盖刚体、软体与流体状态,通过检索专家将视觉对象映射到精确的物理参数空间(如密度、杨氏模量、粘度等) [7] - **FysicsOmniCap中枢**:针对动态过程,利用视听一致性过滤与“大脑-工具”协作机制,提炼出872K(即872,000)富含物理因果链的高保真指令资产,强化了模型对跨模态物理线索的捕捉能力 [4][9] - 该中枢采用强专家模型作为中枢大脑,调度视觉、音频与物理感知三大专家模型协同工作,能够合成深度物理因果链 [9] 核心模型:OmniFysics架构与训练 - OmniFysics提出了一种全新的全模态统一架构,以3B(即30亿)参数的大语言模型为基座,实现了对图像、音频、视频与文本的统一处理与生成 [12] - 模型采用了时间多模态旋转位置编码,能够精确处理交错的视听流输入 [14] - 在输出端,OmniFysics集成了两大生成模块:Spoken Voxer支持从多模态上下文直接预测离散音频token,合成高保真语音;同时也具备了物理感知的图像生成能力 [14][15] - 模型融合了智能动态路由技术,能够实时分析用户指令的句法结构与语义意图,自适应调度计算资源,在保持高效推理的同时,精准执行符合物理规律的复杂任务 [16] - 模型实施了渐进式四阶段训练策略,利用3700万条精心配比的指令微调数据进行全模态联合对齐,并关键性融入了FysicsAny与FysicsOmniCap生成的物理增强数据资产 [17] - 在生成能力突破阶段,模型进一步引入了超过1亿的高质量样本进行专项训练,涵盖用于构建高保真语音映射的音频数据,以及用于图像生成流匹配训练的海量图文对 [17] 性能评估与基准 - 公司推出了FysicsEval——国际首个全维度物理感知与逻辑推理评测基准,旨在全方位量化物理AI的认知边界 [20] - 该基准是一个面向多模态物理智能的全维度、多粒度评估系统,首次将物理感知与预测、物理逻辑推理、物理世界理解三大核心能力纳入同一评估体系 [21] - 基准包含3,854个源自真实世界的样本,覆盖刚体、软体、流体三大物理形态,以及密度、摩擦系数、杨氏模量等11类关键物理参数 [22] - 在FysicsEval评测中,OmniFysics (3B)的综合得分全面超过同量级开源模型,更在多项关键指标上超越了Gemini-2.5-flash和Claude-4.5-Haiku等大规模参数的闭源模型,整体上取得了最好的物理逻辑推理能力 [27] - 在PhysBench、QuantiPhy等权威第三方物理榜单上,OmniFysics同样保持了领先优势 [27] - 在MMBench、MMStar等六大通用视觉理解基准评测中,OmniFysics取得了72.8%的平均分,在所有同尺寸的Omni模型中位列第一 [30] - 在OmniBench、Video-MME等全模态与视频理解榜单中,OmniFysics以49.97的平均分位居3B量级模型之首,在5个评估基准中有4个优于Qwen2.5-Omni 3B [32] - 在MMAU和MMAR音频理解基准上,OmniFysics取得了61.2的平均分,这一成绩优于Qwen2.5-Omni 3B,更在部分指标上超越了音频专家模型 [35] - 在图像生成方面,OmniFysics展现了独特的“物理转译”能力,能根据“密度”、“杨氏模量”等抽象参数,生成具有正确材质光泽与形变逻辑的图像 [37] 公司背景与行业影响 - 公司由复旦大学智能机器人与先进制造创新学院副院长、原英伟达PhysX物理引擎主要奠基人与研发团队负责人张立华教授创办 [41] - 公司是国内唯一拥有完全自主研发的可微分通用物理仿真引擎产品的企业 [41] - 公司以新一代物理仿真引擎Fysics为核心,致力于打造全球领先的物理智能关键技术与产品,推动具身智能与人形机器人技术研发及应用场景的快速落地 [41] - 公司在高精度物理仿真引擎、高质量具身智能仿真平台、机器人敏捷运动与鲁棒智能控制等领域处于行业领先水平,并向行业提供覆盖“仿真—训练—部署—迭代”的全栈解决方案 [41]
飞捷科思发布全球首套真正物理AI基础模型OmniFysics
环球网资讯· 2026-02-09 19:09
文章核心观点 - 飞捷科思智能科技发布全球首个懂“物理定律”的全模态物理AI基础模型OmniFysics,以仅3B的参数量实现物理感知与推理的创造性突破,旨在解决传统AI的“物理幻觉”痛点,为具身智能、人形机器人等领域奠定核心技术基础 [1] OmniFysics模型的技术突破 - 模型通过向底层架构注入高质量物理知识,使仅3B参数的紧凑模型在物理预测、属性识别、逻辑推理等核心指标上超越同量级开源模型,并击败部分8B参数的主流模型,在音频、视频等多物理场景理解任务中评分全球第一 [2] - 独创“双中枢”数据生态:静态中枢FysicsAny构建了首创的万物物理标签体系,为物体精准标注密度、弹性、摩擦力等核心物理属性;动态中枢FysicsOmniCap通过视频与音频协同训练,让AI能精准捕捉物理因果关系,如通过撞击声判断材质硬度,通过运动轨迹预测受力变化,实现动态感知与推理 [2] - 模型结合公司自研的可微分通用物理仿真引擎,构建“虚拟标注-现实感知-模型优化”的完整闭环,提升了物理推理的精准度与实用性 [2] 模型性能与评测体系 - 模型在视觉多模态理解基准、音频理解基准、全模态与视频基准、全维度物理基准等多个方面均有性能表现 [5][6][9] - 公司同步推出全球首个全维度具身物理感知与逻辑推理评测基准FysicsEval,与此前发布的FysicsWorld物理AI全模态评测平台共同构成全球首个全维度智能物理评测体系,填补了现有物理AI评测脱离真实物理世界的行业空白 [12] - 该评测体系为全球AI研发团队提供精准、高效的模型诊断工具,推动行业从追求参数规模向追求物理精准转型 [12] 公司背景与行业影响 - 公司是能够自研面向具身智能的新一代可微分、多物理、多材质统一求解物理仿真引擎的厂商,同时全面适配国产GPU,支持大规模并行仿真 [12] - 随着人工智能技术向实用化升级,具身智能、人形机器人、工业仿真等领域迎来快速发展期,传统AI的“物理盲区”日益凸显,现有全模态AI模型依赖海量数据模仿规律,易出现“AI幻觉” [1] - 现有物理AI评测体系多局限于做题背公式的单一模式,无法有效检验模型在真实场景中的能力,难以满足产业落地需求,OmniFysics的推出开创性地满足了全球AI业界向真正物理AI迈进的核心诉求 [1][12] - 公司创始人表示,OmniFysics的发布标志着AI从单纯的“语义理解”迈向“物理真实”,将成为构建未来能真正理解并与现实物理世界互动的具身智能体的坚实底座 [12]
告别物理幻觉:首个全模态物理AI基础模型OmniFysics问世
凤凰网· 2026-02-09 13:18
公司动态与产品发布 - 飞捷科思智能科技联合复旦大学认知智能技术实验室正式发布了全球首个面向真实物理世界的全模态物理AI基础模型——OmniFysics[1] - 该模型旨在解决当前生成式AI普遍存在的“物理盲”问题,即处理涉及重力、材质、密度等物理规律时常出现违背常识的“幻觉”[1] - 模型在仅有30亿参数量的轻量化架构下,引入了物理感知与因果推理机制[1] 核心技术架构与创新 - OmniFysics采用了四阶段渐进式训练法,先独立训练单模态感知,再进行全模态深度融合,以平衡单一任务的专业性与跨模态的协同能力[2] - 模型通过“静态中枢”与“动态中枢”两大独创数据生态,能够识别物体的物理属性并理解视听结合下的物理因果[1] - 这种机制使得AI能够深入物理参数的反演,精准预测如密度、杨氏模量等仿真参数[1] 产品能力与评估 - 模型能够识别物体的物理属性,如陶瓷的硬度、水的流动性[1] - 模型能够理解物理因果,如撞击声与材质的关联[1] - 团队同步推出了FysicsEval评测基准,这是一套涵盖物理属性预测、物理逻辑推理及跨模态一致性判断的综合评估体系[2] - 该基准旨在考核AI是否具备识破“水往高处流”等违反物理常识现象的能力[2]