Workflow
FysicsAny中枢
icon
搜索文档
近亿融资落地!飞捷科思发布首个全模态物理AI基础模型-OmniFysics,让机器真正理解世界
创业邦· 2026-02-11 08:07
公司融资与定位 - 飞捷科思智能科技(上海)有限公司近日完成近亿元Pre-A1轮融资,由经纬创投与东方富海联合领投,沐曦股份、驰星创投等机构参与投资 [2] - 公司定位为Physical AI(物理AI)核心基础设施供应商,专注于自主研发面向具身智能的新一代可微分、多物理统一求解物理仿真引擎 [2] - 该仿真引擎适配主流及国产GPU,支持大规模并行仿真,旨在通过生成高质量合成数据,解决机器人训练数据匮乏的行业痛点 [2] 行业痛点与解决方案 - 现有顶尖多模态大语言模型在物理感知层面面临巨大的“认知鸿沟”,导致模型在生成任务中产生违反因果律的“物理幻觉”,在推理任务中依赖浅层语义标签而非内在物理属性与参数,限制了其在真实物理世界中的可用性、可靠性与泛化能力 [2] - 其根本原因在于关键的物理属性在视觉上具有天然的模糊性,且在现有网络规模数据中缺乏显式的表征与对齐,导致模型难以通过跨模态线索消除歧义 [2] - 为突破物理认知瓶颈,公司推出了OmniFysics——一款面向真实世界的全模态物理AI基础模型,旨在统一图像、音频、视频和文本的跨模态理解,并集成高保真语音与图像生成能力 [3] - OmniFysics通过注入显式物理知识,重塑AI模型对物理规律的感知与预测,弥合隐式神经表示与显式物理知识之间的鸿沟,为构建能真正理解并与物理世界互动的具身智能体奠定基础 [4] 核心技术:双中枢数据生态系统 - 为解决高质量物理对齐数据稀缺问题,团队构建了双中枢数据生态系统 [4] - **FysicsAny中枢**:针对静态属性,通过“感知-检索-验证”的五阶段专家协作机制,结合物理定律约束与分层知识检索,构建了包含943K(即943,000)验证物理标签和4.7M(即4,700,000)对指令-图像的首个大规模物理属性数据资产 [4][7] - FysicsAny中枢构建了包含300个标准物理原型的数据资产,涵盖刚体、软体与流体状态,通过检索专家将视觉对象映射到精确的物理参数空间(如密度、杨氏模量、粘度等) [7] - **FysicsOmniCap中枢**:针对动态过程,利用视听一致性过滤与“大脑-工具”协作机制,提炼出872K(即872,000)富含物理因果链的高保真指令资产,强化了模型对跨模态物理线索的捕捉能力 [4][9] - 该中枢采用强专家模型作为中枢大脑,调度视觉、音频与物理感知三大专家模型协同工作,能够合成深度物理因果链 [9] 核心模型:OmniFysics架构与训练 - OmniFysics提出了一种全新的全模态统一架构,以3B(即30亿)参数的大语言模型为基座,实现了对图像、音频、视频与文本的统一处理与生成 [12] - 模型采用了时间多模态旋转位置编码,能够精确处理交错的视听流输入 [14] - 在输出端,OmniFysics集成了两大生成模块:Spoken Voxer支持从多模态上下文直接预测离散音频token,合成高保真语音;同时也具备了物理感知的图像生成能力 [14][15] - 模型融合了智能动态路由技术,能够实时分析用户指令的句法结构与语义意图,自适应调度计算资源,在保持高效推理的同时,精准执行符合物理规律的复杂任务 [16] - 模型实施了渐进式四阶段训练策略,利用3700万条精心配比的指令微调数据进行全模态联合对齐,并关键性融入了FysicsAny与FysicsOmniCap生成的物理增强数据资产 [17] - 在生成能力突破阶段,模型进一步引入了超过1亿的高质量样本进行专项训练,涵盖用于构建高保真语音映射的音频数据,以及用于图像生成流匹配训练的海量图文对 [17] 性能评估与基准 - 公司推出了FysicsEval——国际首个全维度物理感知与逻辑推理评测基准,旨在全方位量化物理AI的认知边界 [20] - 该基准是一个面向多模态物理智能的全维度、多粒度评估系统,首次将物理感知与预测、物理逻辑推理、物理世界理解三大核心能力纳入同一评估体系 [21] - 基准包含3,854个源自真实世界的样本,覆盖刚体、软体、流体三大物理形态,以及密度、摩擦系数、杨氏模量等11类关键物理参数 [22] - 在FysicsEval评测中,OmniFysics (3B)的综合得分全面超过同量级开源模型,更在多项关键指标上超越了Gemini-2.5-flash和Claude-4.5-Haiku等大规模参数的闭源模型,整体上取得了最好的物理逻辑推理能力 [27] - 在PhysBench、QuantiPhy等权威第三方物理榜单上,OmniFysics同样保持了领先优势 [27] - 在MMBench、MMStar等六大通用视觉理解基准评测中,OmniFysics取得了72.8%的平均分,在所有同尺寸的Omni模型中位列第一 [30] - 在OmniBench、Video-MME等全模态与视频理解榜单中,OmniFysics以49.97的平均分位居3B量级模型之首,在5个评估基准中有4个优于Qwen2.5-Omni 3B [32] - 在MMAU和MMAR音频理解基准上,OmniFysics取得了61.2的平均分,这一成绩优于Qwen2.5-Omni 3B,更在部分指标上超越了音频专家模型 [35] - 在图像生成方面,OmniFysics展现了独特的“物理转译”能力,能根据“密度”、“杨氏模量”等抽象参数,生成具有正确材质光泽与形变逻辑的图像 [37] 公司背景与行业影响 - 公司由复旦大学智能机器人与先进制造创新学院副院长、原英伟达PhysX物理引擎主要奠基人与研发团队负责人张立华教授创办 [41] - 公司是国内唯一拥有完全自主研发的可微分通用物理仿真引擎产品的企业 [41] - 公司以新一代物理仿真引擎Fysics为核心,致力于打造全球领先的物理智能关键技术与产品,推动具身智能与人形机器人技术研发及应用场景的快速落地 [41] - 公司在高精度物理仿真引擎、高质量具身智能仿真平台、机器人敏捷运动与鲁棒智能控制等领域处于行业领先水平,并向行业提供覆盖“仿真—训练—部署—迭代”的全栈解决方案 [41]