Hyper3D.AI
搜索文档
OpenAI点赞转发的冠军项目,背后藏着一个国人3D生成团队
机器之心· 2026-03-06 11:28
文章核心观点 - 3D生成技术正从演示型工具向生产型组件转变,其核心价值在于稳定性、可控性与可复用性,这使其能够被整合进开发者和企业级的生产工作流[5][6][8][15] - 影眸科技(DeemosTech)的Hyper3D Rodin技术,通过提供高稳定性、可控的3D生成与编辑能力,已成为从独立开发者到英伟达等顶级公司工程化管线中的关键技术组件[3][12][15][23] - 行业焦点正从“能否生成”转向“可编辑、可复用”,下一代3D生产基础设施需要支持完整的“生成-编辑”闭环工作流,以满足从快速原型开发到高精度生产的不同场景需求[20][26][35][42] 一、3D 生成从演示工具到生产工具 - 应用StoryWorld展示了3D生成的新范式:用户通过手机摄像头和语音指令即可在真实空间中生成、定位并操控完整的3D资产,实现类似电影导演的取景与运镜[1][5] - 与传统的AR叠加静态物体不同,StoryWorld中的3D对象是完整的三维资产,支持多角度观察和动态拍摄控制[5] - Hyper3D Rodin因其在实时文/图生3D中表现出的稳定性与可控性,被选为StoryWorld在24小时黑客松开发中的核心技术,开发者称“没有Rodin就无法实现”[3][6] - 这种应用将创作重心从“生成单一结果”转向“场景构建与镜头语言”,标志着3D生成技术从“演示型技术”向“生产型组件”演进[7][8] 二、从黑客松到工程化生产管线 - Hyper3D Rodin被应用于两类高要求场景:一是OpenAI Codex Hackathon的快速原型开发,二是英伟达(NVIDIA)CES主题演讲的Keynote制作管线[3][12] - 在英伟达的工程化生产流程中,团队需要制作12K超清画面、保持多主体细节,并拥有快速迭代的工作流。Hyper3D Rodin承担了3D模型生成任务,并需在多个制作阶段保持角度、光照一致性和细节还原度[15] - 能够被纳入英伟达这类代表行业标准的工程化管线,表明该技术在精度、稳定性和工程适配能力上通过了严格验证[15] - 从黑客松的“极限速度”到企业级的“工程标准”,共同验证了当3D生成作为生产组件时,稳定性、可控性与可复用性是第一优先级[15] 三、从“生成”到“编辑”:3D可控成为生产级流程基础范式 - 影眸科技团队在2025年发布了Rodin Gen-2 Edit,推出了基于自然语言的3D模型局部编辑功能,实现了业内首个将“3D生成”与“3D编辑”整合的完整商用工作流[20] - 编辑功能操作直接:用户框选需要修改的区域并输入文字指令,即可完成局部调整,无需推倒重来[21][34] - 该编辑能力是平台级基础设施,不仅适用于自身生成的模型,任何第三方3D资产(包括历史存量模型)均可导入平台进行编辑,极大增强了资产的复用性[23] - 公司从初代Rodin开始就将可控性作为底层能力设计,引入了3D ControlNet,允许用户自由设定模型的长宽高、内部结构和表面轮廓[30] - 公司还推出了递归分件技术BANG,支持将3D模型“爆炸式拆解”成多个部件并反复重组,进一步增强了可控性和编辑灵活性[31][33] - 这些功能使AI 3D建模工作流形成闭环,无论是新生成模型还是旧资产,都能实现持续迭代和修改,从而真正融入生产流程[35] 四、多模态技术演进路径:从生成到可控 - 生成式AI的演进遵循“先生成 → 再增强可控性 → 最终支持编辑”的清晰逻辑[27] - 在发展早期,3D生成同样难以避免“抽卡”式的随机性,需要通过多次尝试来匹配需求[27] - 随着类似ControlNet等引导技术的发展,用户可以在生成前通过信号引导来更好地控制结果,减少随机性[29] - 在3D领域,由于产品化起步晚、生态分散,多数团队仍停留在“可控生成”阶段,而影眸科技通过持续迭代ControlNet、BANG分件技术和Edit编辑功能,一步步将3D生成从“抽卡游戏”进化为“可控设计”[31] 五、行业焦点的转移:下一代3D生产基础设施 - AI 3D行业的焦点正在从“能不能生成”转向“可编辑、可复用”,技术正逐步沉淀为创作与生产链路中的工作流组件[42] - 对开发者而言,3D资产不再只是最终交付的文件,而是能被反复调用、持续迭代的生产要素[42] - 对3D大模型公司而言,能否在关键环节稳定产出,并在编辑与复用环节补齐能力,将越来越影响其在全球创作链路中的定位[42] - Hyper3D Rodin被从OpenAI黑客松到NVIDIA企业级管线的顶级开发者持续选择,展示了领先的3D生成技术从实验室走向工程化与生产化应用的路径[43] - 当3D生成技术能同时满足快速开发、高精度制作和日常迭代修改的需求时,才真正完成了从技术演示到生产工具的转变[43]
95 后团队做 3D 大模型,拿下头部游戏重磅合作,正在定义 3D 生成的新规则
Founder Park· 2025-11-18 19:06
公司技术与产品进展 - 公司主攻3D生成方向,其Rodin模型支持的Hyper3D.AI在移动端游戏环境中实现3D生成技术大规模即时应用[2] - 公司推出全新升级的新一代模型Rodin Gen-2,以全球最大规模的百万级别数据与百亿级参数实现生成质量的质的飞跃[6] - Rodin Gen-2支持百万级面数高精度生成,并能通过法线烘焙让低面数模型呈现高清纹理效果,同时兼容更高分辨率材质输出[6] - 模型生成更平滑、干净的几何表面,大幅减少后期修复成本,提升生产可用性[6][8] - Rodin Gen-2引入"Bang to Parts"功能,可将生成的3D模型按原有结构分件爆炸开来,支持局部重建和编辑[9][12][13] - 公司独有的3D ControlNet实现边框盒控制、体素控制、点云控制,降低生成抽卡率,提升可控性[20][25] - 模型矩阵提供四种生成模式:Zero(低面数优化)、Focal(高细节表现)、Speedy(快速预览)、Default(平衡细节与平滑度)[24] - Hyper3D.AI平均每9天上线一个新功能,部分重做功能实现用户对3D生成模型的局部编辑[21] - 在手机硬件端,公司将整体生成速度压缩到10秒以内,实现与生图相近的速度[24] 行业趋势与竞争格局 - 3D生成迎来大年,大厂开始布局:Roblox开源CUBE 3D并开放Mesh Generator API,字节发布基于DIT架构的3D大模型Seed3D 1.0,腾讯混元发布3D v2.5版本模型将参数量级从十亿提升到100亿[6] - 3D生成领域出现与文字/图像/视频生成领域一样的规律,实现"Understanding by Generation"[14] - 消费级3D打印机快速增长为3D内容增加C端可感知渠道,公司成为头部3D打印厂商的首批合作企业[27] - 3D形态在长期内仍是"藏在后面的形态",而非被广泛C端直接消费的内容,但作为标准化中间载体在空间一致性控制上具有不可替代优势[28][29] - 3D生成是支撑下一代智能应用落地的核心拼图与底层基座,对数字内容创作、工业设计、AR/VR交互、具身智能等领域至关重要[29] 研发成果与学术认可 - 公司研究论文《CLAY:用于创建高质量3D资产的可控大规模生成模型》和另一项研究同时入选计算机图形学顶级会议SIGGRAPH的最佳论文提名[2] - 在SIGGRAPH 2025上,公司凭借单图生成3D场景生成的研究CAST获得最佳论文(Best Paper),其BANG研究获选"Top 10技术论文速览"[14][15] - CLAY是完全基于原生3D数据训练的大模型,用远低于图像领域的3D原生数据规模和参数实现Scaling Law,首次在3D生成领域出现"涌现"现象[3] - BANG功能基于跨领域哲学思考实现,将大语言模型底层思维迁移至3D领域,使模型能理解物件内部部件之间的关系[13][18] 商业化与市场应用 - 公司完成由蓝驰创投领投的数千万美元融资,跟投方包括字节跳动和红杉中国种子基金等老股东[2] - Hyper3D.AI在某款大型UGC游戏中支持千万人实时在线生成萌宠或其他物品,对游戏产业而言很罕见[26] - 公司重点打通对不同领域的服务,以核心模型算法实现软件的SaaS化,横向拓展游戏、影视建模及更多工业场景[28] - 团队风格以市场需求为第一原则,将行业前沿技术与市场需求耦合,确保生成的3D模型在质量和使用习惯上符合生产方式[19][28]
字节、红杉投资的AI公司接入网易《蛋仔派对》,融资数千万美元|早起看早期
36氪· 2025-11-15 09:12
融资与公司概况 - 公司完成数千万美元A+轮融资,由蓝驰创投领投,字节跳动和红衫中国种子基金等老股东跟投,资金主要用于技术研发和市场拓展[5] - 公司专注于AI原生3D生成大模型研发,核心产品Hyper3D.AI为游戏、影视特效、工业设计和3D打印等行业提供高质量3D资产生成解决方案[5] 核心技术与产品矩阵 - 产品采用模型矩阵设计,包含专为移动端优化的Zero模式、生成速度快的Speedy模式、精度高的Focal模式以及平衡细节与平滑度的Default模式,以解决生成质量与运行效率的动态平衡问题[7] - 最新Rodin Gen-2模型实现突破性进展,参数量从数十亿提升到百亿级别,训练数据量从几十万增长到百万级别,细节还原和复杂结构表现显著提升[10] - 模型支持独有的“分件”功能BANG,通过AI将生成的3D模型拆分成多个部件,提升后续绑定、编辑与二次生产效率,技术原理区别于传统表面分割方法[10] - 公司是行业内首个提出3D ControlNet架构的团队,支持长宽高/绝对尺寸约束、体素形状约束、点云形体约束等多种控制方式[11] 行业痛点与公司突破 - 行业长期存在生成质量与还原度不足、生成的模型难以直接接入现有生产流程两大痛点,高质量且真正可用的3D资产生成工具稀缺[9] - 公司研究论文《CLAY》提名SIGGRAPH最佳论文,团队成为50年来首个入选SIGGRAPH"Real-Time Live"的中国团队,其研究推动行业从“生成”迈向“生产”[9] - 公司发布的《CAST》获得SIGGRAPH 2025最佳论文奖,当年获得该奖项的商业公司仅有谷歌、Meta和影眸三家[10] 市场应用与客户合作 - 核心产品Hyper3D.AI已接入网易超5亿用户的手游《蛋仔派对》,玩家无需复杂建模工具即可在游戏界面内创建自定义场景[5] - 在游戏领域与网易达成深度合作,并与数家国际游戏公司开展合作测试;在3D打印领域是拓竹的早期合作伙伴,其模型是首个落地3D打印领域的3D生成模型[11] - 未来计划拓展工业设计领域,认为其建模需求和市场规模比游戏更大,且符合国家新质生产力战略;长远目标面向“世界模型”与具身智能训练数据生成,已与国内多家机器人公司合作[11]