AI 3D生成
搜索文档
对话VAST曹炎培:2秒才是3D生成本该有的速度
量子位· 2026-03-12 17:37
公司核心技术与产品 - 公司最新发布的Tripo P1.0模型实现了AI 3D生成算法的范式级突破,首次在原生三维空间实现概率生成,重构了底层算法架构[11][13] - Tripo P1.0采用“整体生成”方法,对三角形或多边形的点线面进行统一概率建模,能在2秒内极速生成兼具几何和拓扑结构的3D模型,速度相比传统方法提升百倍[13][21][40] - 公司另一模型Tripo H3.1是高精度模型,在输入对齐、结构精度、贴图质量等核心指标上达到行业SOTA水平,追求雕塑级的三维表现[13][32][36] - 公司通过Tripo Studio平台提供端到端的3D设计工作流,其最新上线的Smart Mesh功能仅凭提示词或参考图即可在2秒内生成专业级3D模型[11][13][69] - 公司评估Tripo P1.0生成的模型整体已达到三到五年经验设计师90%的水平,在部分工业场景仍有提升空间[22][46] 行业地位与竞争优势 - 公司首席科学家表示,公司目前处在全球3D领域全栈领军的位置,在生成质量和底层范式重构方面均具领先优势[31][68] - 公司的技术优势在于定义和发明了新的原生3D表征能力,确立了现代3D生成与引擎工具、图形标准之间的底层连接[31][68] - 公司已服务全球超过9万家企业,客户包括拓竹、网易、索尼等,覆盖3D打印、游戏、XR、机器人及汽车等多个行业[70][72] 市场前景与战略布局 - 公司近期完成了5000万美元的A轮融资,由阿里和恒旭资本领投,老股东继续加注[15] - 公司计划在今年推出自己的UGC 3D互动平台,旨在打造一个比Roblox和Minecraft门槛更低的AI原生平台,类似“3D版TikTok”[25][26][55] - 公司认为,当3D资产生成门槛降至2秒且近乎零成本时,UGC互动内容将迎来爆发,AI时代限制创作的不再是技能而是想象力[25][28][50] - 公司判断AI 3D生成将首先改变游戏形式,使人人都能创作个性化的可交互世界,进而对游戏、影视、元宇宙等产业带来根本性范式转变[53] 技术演进与行业洞察 - 公司将Tripo P1.0的发布定义为AI 3D大模型算法范式进入2.0时代的标志[29] - AI 3D的1.0时代追求视觉或几何拟真,而2.0时代的特征是:生成原生资产、资产具备功能性、同时打破速度质量可用性的“不可能三角”[30][57] - 公司指出当前行业主流方法存在两大问题:在原始数据和最终资产间绕远路;以及受LLM成功影响而“强行”将3D数据序列化,这违背了三维空间的各向同性[18][19] - 公司认为,未来技术挑战在于使生成的3D资产具备原生的动态和可交互性,例如自发理解物体的物理关节结构[58] 世界模型发展规划 - 公司正在研究世界模型,并很快会有具备交互能力的demo公布[27][63] - 公司认为世界模型的发展需要视频数据与3D数据结合,3D数据能更高效地表示物理世界中的持久状态实体[62] - 公司在世界模型领域的优势包括:3D团队的底层思考积累,以及通过“V·STAR计划”吸引的顶尖人才[64][65]
2秒终结AI 3D不可能三角,我们和VAST首席科学家曹炎培聊了聊
机器之心· 2026-03-12 17:30
文章核心观点 - 国内初创公司VAST发布的Tripo P1.0模型,首次在AI 3D生成领域同时实现了速度、质量和管线可用性,打破了该领域长期存在的“不可能三角” [2][9][10] - 该模型通过“原生三维空间概率生成”的底层范式重构,能在约2秒内从单张图片或提示词生成拓扑规整、可直接用于生产管线(如游戏开发、实时渲染)的3D网格资产,效率较传统方案提升百倍以上 [2][4][6][9][32] - 这一突破标志着AI 3D生成从“视觉近似”跨越到了“工业资产可用”阶段,有望大幅降低3D内容创作门槛,并推动其在游戏、空间计算、具身智能等领域的应用普及 [33][40][44] 技术突破与产品性能 - **生成速度**:Tripo P1.0模型实测仅需约2秒即可生成结构化3D网格,而过去经验丰富的3D建模师完成一个游戏级别角色资产需要数天时间 [2][3][6] - **生成质量**:生成的网格拥有干净、智能的拓扑结构,布线规整,几何形体与输入高度一致,面数可在500到20000面之间灵活控制 [4][9] - **管线可用性**:生成后的资产可直接进入实时图形流程,适用于游戏开发、仿真模拟、实时渲染等场景,几乎无需复杂的后处理建模流程 [9] - **纹理生成**:模型能自动生成匹配的高质量纹理贴图,在材质精度、光影渲染及细节刻画上达到专业级水准 [16][17][19] 底层技术范式重构 - **问题根源**:传统AI 3D生成模型沿用了处理一维序列或二维矩阵的逻辑,将三维整体结构强行序列化,导致对称性丧失和误差级联,从而陷入速度慢、拓扑乱、后处理重的困境 [23][24][25][31] - **核心创新**:Tripo P1.0摒弃序列化方法,在原生三维空间中通过“概率生成”对整个形状的生成过程进行建模,顶点、边、面的关系在统一特征空间中共同演化 [26][27][28][29] - **带来的改变**: - **几何层面**:结构对称性、比例关系等作为全局生成的自然结果涌现,无需人工干预 [30] - **质量层面**:直接在约5000万条高质量工业标准3D数据上训练,生成结果具备规范拓扑,基本无需重拓扑等后处理 [30] - **效率层面**:将复杂拓扑关系映射为连续度量关系,计算契合GPU并行特性,使原本需数百秒的任务缩短至约2秒 [30][32] 公司产品战略与市场应用 - **“双旗舰”布局**:公司拥有两条技术路线,Tripo H3.1追求极致的视觉和几何保真度;Tripo P1.0解决时效性问题,在满足工业标准的前提下实现极快生成 [36][37] - **应用场景**: - **P1.0**:生成可直接用于各种引擎和3D编辑器的实时资产,适用于游戏、机器人仿真、XR/AR及具身智能(需要可动性和交互性)等场景 [37][39] - **H3.1**:适用于追求视觉天花板或精细表面细节的场景,如3D打印、3A游戏主角参考建模、工业设计等 [37] - **降低门槛与UGC**:该技术将模糊“3D建模”概念,用户将回归创造意图本身,使3D资产获取像生成图片一样简单,极大促进UGC内容普及和大众化 [40] - **行业影响**:当生成一个标准3D交互资产只需几秒,将彻底打破资产丰富性、建模成本等限制,释放创作者想象力 [41][42] 行业意义与未来展望 - **范式演进**:AI 3D网格生成从“算法1.0”(基于序列化的自回归生成)进入新阶段,以原生三维空间概率生成为核心,首次使速度、质量与管线可用性同时成立 [33] - **基础设施化**:3D模态正在成为整个AI基础设施中非常重要的一环,而不仅仅是建立在语言、图像、视频之上 [44] - **编辑与交互**:未来用户甚至无需使用Blender等复杂编辑工具,通过与模型交互或对话即可编辑或演化出最终想要的模型 [43] - **人才基础**:公司通过V・STAR人才计划吸纳和培养顶尖研究者,是其能持续取得技术突破(如H3.1、P1.0及世界模型进展)的关键 [45]
混元3D生成模型家族迎新
每日经济新闻· 2025-09-26 18:07
公司技术发布 - 腾讯混元于9月26日发布并开源混元3D-Omni和混元3D-Part两款3D生成模型 [1] - 该发布代表公司在可控3D生成领域取得新突破 [1] - 技术旨在提升AI 3D建模的实用性 [1] 行业应用前景 - 新模型将加速3D生成技术在游戏、3D打印及AR/VR领域的实际生产流程落地 [1] - 开源策略可能推动行业生态发展和技术普及 [1]
3D生成到达3.0阶段,不止提升行业渗透率,也正催生3D原生新玩法 | 对话3D生成平台Tripo
量子位· 2025-09-20 16:35
AI 3D生成赛道概述 - AI 3D生成是近两年生成式AI领域最值得关注的赛道之一,市场前景广阔[3] - AI技术显著降低了3D生成在工具链、专业技能和人力成本方面的门槛,为专业人员和爱好者提供了新机会[5] - 游戏、建筑、设计、手办等多个领域已验证对AI 3D的需求,大量行业存在潜在需求,赛道天花板可观[5] - 市场参与者快速涌现,大厂如腾讯推出混元3D生成平台,创业公司如VAST、Meshy、影眸科技等持续迭代自研模型和产品[5] VAST公司及Tripo平台核心数据 - Tripo平台已在全球覆盖超300万专业开发者,AI 3D原生模型数量超过4000万,中小用户超4万[10] - 公司推出了一站式AI 3D工作台Tripo Studio,支持智能部件分割、贴图魔法笔刷、智能低模生成、万物自动绑骨四大核心功能[10] - Tripo 3.0模型参数从2.5版本的十几亿直接拉升到两百亿级别,采用全新技术路线和表达形式[10] - 截至9月19日,公司年度经常性收入(ARR)已达到1200万美元,6月份单月营收约60多万美元[65] AI 3D降本增效与商业化应用 - AI将3D建模成本从手工制作的上万元降至极低水平,平台提供每月5~6次免费生成,订阅费用为20美元/月[15] - 用户可通过文字或图片生成3D模型,并使用智能笔刷进行拖拽修改,实现风格化、重贴图、重拓扑等功能[15] - 生成的模型可通过淘宝店进行3D打印,提供冰箱贴、钥匙扣、手办等定制化产品,家庭3D打印机价格约两三千元[18][21] - 工业打印效果更优,但成本更高,当前生成精度已可满足大众商业化需求[20][21] 用户群体与核心应用场景 - 平台主要服务两类用户:无3D专业能力的UGC创作者和有专业能力需降本增效的PGC用户[25][29] - UGC用户通过社区联名活动参与实际创作,如与跑团店、3D打印厂商举办的设计大赛,激发原生玩法[26][28][38] - 专业用户覆盖游戏动画、影视CG等虚拟场景,以及工业设计、电商、文旅、教育等实体场景[29][30] - API调用客户可将3D生成能力接入自有产品,如游戏《燕云十六声》接入后实现"言出法随"的UGC玩法[31][32] 技术发展与行业影响 - AI 3D正处于从60分向80分推进的阶段,需解决几何精度、贴图细节、可控性、图片还原度等共性问题[42] - 技术发展将逐步颠覆传统3D管线,先整合为3~4个模块,再实现全自动化,可能出现单一模型替代整条管线[44] - 行业影响广泛,包括游戏、设计、工业等领域,并衍生出小单快返、定制化生产等新商业模式[33][35] - 3D原生玩法不断涌现,如角色对战、古董生成等,分享率超50%,可能催生全新游戏品类[36][38][39] 产品开发与运营策略 - 产品开发需"粗中有细",既要敢于定义新功能,也要细致调研市场,技术是产品核心[45][46][48] - 关键指标关注用户生成模型的数量、下载率和活跃度,通过深度用户访谈驱动迭代[50][56] - 技术"起新墙"速度快,产品需更快"糊旧墙",需预判技术趋势并具备长期主义[58] - 用户增长依赖与KOC/KOL共同成长,通过活动、比赛鼓励内容分享,而非复杂增长策略[63] 未来发展方向与挑战 - 确定性趋势是技术广度和深度不断提升,更多领域将被AI化,效果持续优化[66] - 不确定性在于3D与视频、具身智能等领域的结合方向尚不明确,需持续探索[67][68] - 理想平台需满足功能易用性、完整性和效果优良性,需算法与产品紧密配合[61][62] - 只有大模型难以直接服务客户,需结合AI算法和工程化设计形成完整工作站[59][60]
标准化3D生成质量榜单来了!首创层次化评价体系,告别“谁的demo更吸睛”主观评估
量子位· 2025-08-16 11:58
文章核心观点 - AI 3D生成技术在2025年相比2024年质量显著进化 成为继AI视频后最被看好的AIGC应用领域 [1] - 上海人工智能实验室联合多所高校发布Hi3DEval评测体系 通过三层评测协议实现从整体到细节的多粒度分析 解决传统3D生成评测粗糙的问题 [3][5] - 首期榜单涵盖30个主流模型 腾讯混元Hunyuan3D 2.5以16.561分位居Image-to-3D任务榜首 微软TRELLIS(15.1989分)和Stability AI SPAR3D(15.0014分)分列二三位 [6][7] 评测体系创新 - 对象级评估涵盖几何合理性(结构完整性/保真性) 几何精细度(边缘锐利度/部件完整性) 纹理质量(清晰度/细节保真度) 几何-纹理一致性(纹理与几何对齐) Prompt-3D一致性(生成结果与输入匹配度)五个维度 [9][10][11][12][13][14] - 部件级评测聚焦椅子腿/扶手等细分部位 诊断局部几何问题 评估维度包括局部几何合理性(符合物理与设计逻辑)和局部几何精细度(细节清晰度与丰富度) [15][16] - 材质主题评估采用光照反射信息 从细节与复杂性(视觉丰富度) 色彩与饱和度(颜色自然度) 一致性与伪影(跨视角一致性) 材质合理性(反射率/粗糙度等物理特性)四个维度分析 [17] 技术实现突破 - 采用多视角环绕视频+原生网格的混合3D表征 视频表征检测跨视角结构稳定性与纹理漂移 原生3D表征支持部件级几何评估 [26] - 在人类偏好一致性上超越主流指标:Text-to-3D任务中DC指标达0.767(CLIP Score仅0.647) CA指标达0.733(CLIP Score仅0.543) Image-to-3D任务中C2指标达0.771(CLIP Score仅0.678) [27] 行业影响 - 标准化评测设置统一输入提示/渲染视角/光照条件 消除实验环境偏差 保障评分公正性 [21] - 提供可追踪/可复现的对标基准 推动3D生成技术向高质量与高透明度发展 改变过去依赖主观demo评价的行业现状 [7][28]
对话 VAST 宋亚宸:3D 关乎全人类幸福,也关乎我的
晚点LatePost· 2025-06-10 09:48
公司融资与业务发展 - VAST近期完成数千万美元Pre A+轮融资,由北京市人工智能产业投资基金领投,靖亚资本跟投[4] - 公司成立于2023年3月,首个开源项目Wonder 3D在GitHub上线3个月内获得近4000颗星[4] - 已发布全球首个AI 3D工作台Tripo Studio,将3D建模时间从15小时缩短至6分钟[4] - 产品Tripo Studio上线一周用户付费率增长4倍[18] - 商业化模式较轻,目前拥有3.5万家中小客户和700多家大客户[19] 技术路线与产品规划 - 3D生成采用反向泛化路径:从专业用户→业余用户→创意爱好者→普通消费者[8] - 当前处于第二阶段"3D版Cursor",未来将发展为"3D美图秀秀"和"3D抖音"[9] - 3D内容平台预计需要3-10年发展成熟,一旦爆发可能直接实现[9] - 同时开发大模型和工作台,形成完整3D内容生产闭环[23] - 技术已实现SOTA水平,今明两年重点转向产品化、工程化和商业化[12] 市场前景与行业定位 - 全球游戏市场规模两三千亿美金,仅为3D内容的一种形式[24] - 未来UGC 3D内容市场可能达到当前短视频规模[24] - 3D属于"强交互轻内容"象限,信息密度最高且可实时双向互动[25][26] - 3D是XR、AI游戏、空间智能等领域的基础设施和关键卡点[26] - 行业跑道足够长,公司保持技术领先优势[26] 创始人背景与管理理念 - 创始人具有商汤和MiniMax创业经验,强调"先相信后看见"的认知优势[26] - 公司每年举行战略分享会,保持路线图一致性[14] - 坚持"宁可笨不要蠢"的原则,避免资源浪费和团队信任破坏[42] - 创始人80%时间用于融资和招人,20%时间定战略[48] - 公司愿景是"为世界进文明,为人类造幸福",通过3D技术创造多元体验[50][52] 用户生态与案例 - 用户包括意大利宝爸制作儿童绘本3D模型、委内瑞拉教师用于STEAM教育[21] - 与网易《燕云十六声》合作实现游戏内AI地形改造[22] - 开发者利用3D生成功能创造新型对战游戏玩法[22] - 通过Discord、社交媒体等渠道收集用户反馈[20] - AI创作者具有主人翁意识,愿意尝试未成熟工具并提供建议[20]