AI 3D
搜索文档
3D创作缩至几分钟,成本降为零!97年小伙打造的AI 3D大模型今日获融资!混沌校友动态
混沌学园· 2026-03-06 10:09
公司融资与市场表现 - 通用人工智能公司VAST完成5000万美元A轮融资,由阿里、恒旭资本联合领投,元禾璞华、BV百度风投、东方嘉富等跟投,老股东春华创投、北京市人工智能产业投资基金超额加注 [2] - 公司核心产品Tripo Studio于2025年6月上线,在一两个月内月收入便达到百万美元 [5] - 公司开发的AI 3D大模型Tripo基于超过五千万个3D数据集和数百亿参数,服务于全球650万专业开发者 [5] 核心技术与产品 - 公司专注于AI 3D大模型领域,其技术Tripo 3.0于2025年8月发布,拥有200多亿参数,是全球最大的AI 3D大模型,用户可通过文字或图片直接生成3D内容 [11] - 2025年9月发布Ultra模型,其精细程度已达到工业级应用标准,可直接应用于工业设计、3D打印、游戏开发等领域 [11] - 技术实现了“万物皆可绑骨”,使3D模型可动,并通过语义分割等几十种AI算法及七十多篇顶会论文成果,构建了完整的AI工具流,能生成包含动态人物与交互的完整场景 [12] - 用户可在10秒内,通过文字或图片生成属于自己的3D模型、3D世界和3D人物 [11] 行业颠覆与市场机会 - AI 3D技术将原本需要百人专业团队数周、成本数百万的工作,变为一人几分钟、零成本即可完成 [3][14] - 技术正被广泛应用于游戏、动画、影视、短剧、CG等虚拟内容,以及重工业、轻工业、3D打印、可交互展示等工业领域 [14] - 未来最大、最核心的市场在于让每个人都能以零门槛、零成本、实时的方式创作属于自己的虚拟世界、IP和工业设计,使每个人成为“万能的创作者” [14] - 技术将推动生产制造领域的变革,特别是3D打印,将引发定制化需求爆发,用户可自主设计吊坠、项链、键帽、手办等 [15] - 在内容产业,特别是动画领域,技术降低了创作门槛,2025年公司举办的第二届3D赛事吸引了全球数万名顶尖艺术家参与 [15] 发展愿景与生态构建 - 公司认为3D是世界最原始、最真实的信息载体,文字、图片、视频只是人类在近几千年内对3D信息的一种“压缩”表达 [7][9] - 通用人工智能(AGI)的未来不应局限于文字、图片或视频等“压缩格式”,而应以3D为基座 [8][9] - 公司发展路径是从培养专业用户开始,逐步孵化种子创作者,再覆盖到创作爱好者(“点子大王”),最终触达普通消费者 [14] - 当AI 3D(造万物)与AI Coding(定规则)结合,创造一个可交互、可沉浸的虚拟世界将变得异常简单,实现“创作平权” [17] - 已与字节的即梦、快手的可灵、网易、小红书、拓竹、爱乐酷等平台合作,推动用户创作冰箱贴、钥匙扣等实物 [15] - 合作伙伴盛趣游戏在《黑神话:悟空》发布后,仅用数天时间便零成本生成了一个完整的游戏世界 [12] 用户创作与未来图景 - 技术已赋能普通用户创作,例如与残疾人基金会的合作中,从未受过专业教育的残疾人伙伴也能创造出自己的工业设计和游戏内容 [14] - 在如《蛋仔派对》(服务于超过5000万创作者)和《堡垒之夜》等平台上,用户正利用AI 3D能力结合AI Coding,在一两个小时内创造出自己的交互内容和游戏玩法 [17][18] - 目前已有数万个由创作者创造的世界,创作成本无限接近于零,过程如同发社交媒体一样简单 [18] - 未来,人们将不再仅为赚钱而创作,而是为了分享、表达和记录生活,3D可交互内容将成为一种纯粹的信息载体 [19] - 公司展望未来将出现“3D版抖音”,人们可以零门槛、零成本、实时地创造并体验无数个虚拟世界,竞争将转向“卷创意” [21]
3D领域的NanoBanana也来了,万物皆可用嘴操控。
数字生命卡兹克· 2026-01-26 10:31
核心观点 - AI驱动的3D内容创作与编辑正经历范式转变,从传统的专业软件手动建模转向通过自然语言提示进行“局部、可控、可回滚的增量修改”,这极大降低了3D创作门槛并提升了专业工作流程的效率 [7][8][12][42] 产品功能与技术亮点 - **产品定位**:Hyper3D的Rodin Gen-2被认为是第一个也是唯一一个能够通过自然语言提示编辑任意3D模型的AI产品 [8] - **核心功能**: - 支持上传任意第三方3D模型文件(如obj, fbx)并进行AI编辑 [9][15] - 支持通过图片生成3D模型 [13] - 提供“局部编辑”功能,用户可通过框选模型特定区域,并使用“添加、移除、修改”等指令进行精准编辑 [4][29][31] - **操作流程**:用户上传模型后,通过悬浮操作触发修改界面,以“水波纹”视觉反馈确认选择区域,随后输入文本指令即可完成修改 [24][26][28][29] - **生成速度**:从图片生成3D模型仅需几十秒 [20] 行业应用与价值主张 - **解决行业痛点**:传统3D模型修改流程复杂,涉及拓扑、UV、材质、骨骼绑定等多重属性,局部修改需求(如调整鼻梁高度、更换Logo)若推倒重来将导致大量关联工作失效,成本极高 [17][38][40][44][45] - **核心价值**:AI 3D编辑的核心价值在于对现有3D资产进行“局部、可控、可回滚的增量修改”,而非重新生成,这确保了模型底层结构(如骨骼绑定、动画)的完整性,符合专业生产管线要求 [40][42][44] - **应用场景**: - **游戏与影视**:角色模型需反复迭代,导演要求局部修改(如铠甲厚度、肩甲外扩)时,AI编辑可仅调整局部网格与材质,保持骨骼与动画可用 [44] - **电商与产品设计**:精确修改产品模型的特定细节(如杯子Logo、鞋带颜色),要求其他属性(厚度、圆角、比例)严格保持不变 [45] - **创意与原型制作**:支持模型融合(Remix),例如将“戴珍珠耳环的少女”与“墨镜”模型结合,并可通过3D打印快速实现实体化 [54][55] 市场趋势与生态 - **多模态AI发展**:图片领域有Nano Banana,视频领域有可灵o1,3D领域则由Hyper3D等产品跟进,标志着“用语言驱动一切”成为明确的行业趋势 [7][57] - **创作民主化**:AI 3D工具与消费级3D打印(如拓竹H2C)结合,使得从数字创作到实体物件的链条更加便捷,激发了更广泛的创作与个性化制造需求 [50][52][54] - **技术挑战**:跨模态转换(如图片转3D)存在信息漏损问题,当前生成的模型可能存在缺陷(如部件缺失、部件悬空),但可通过后续的AI编辑进行修补 [22][41]
97年文科生干出全球最强AI 3D大模型
混沌学园· 2025-12-08 19:57
公司创始人背景与行业地位 - 公司创始人是SIGGRAPH 50年历史上第一位也是迄今唯一一位登上大会主题演讲舞台的中国人,与英伟达黄仁勋等行业领袖同台[1] - 创始人是MiniMax 001号员工,后转身专注于AI 3D领域[2] - 创始人带领团队在两年内完成三轮融资,每轮融资额为数亿元人民币,公司估值稳居全球AI 3D大模型公司之首[3] - 创始人出生于1997年,不到两年时间带领团队将3D大模型Tripo系列从技术原型推向千万级用户[5] 公司技术与产品进展 - 公司核心产品Tripo系列3D大模型可实现8秒图文生3D,并率先验证了3D Scaling Law,模型参数达到200亿,将3D生成式AI推入“IMAX时代”[5] - 公司专注于打造世界最领先的AI 3D大模型[5] - 公司认为3D是世界的本质,是最真诚、最真实、信息量最大的内容媒介,是通往AGI更本质的路径[21][23] - 与语言大模型不同,3D大模型的核心区别在于技术路径与领域迁移,其构建需要深度融合人工智能、计算机视觉与图形学三个领域的复合型人才[38][39] - 3D大模型发展面临高质量3D数据严重匮乏的挑战,因为互联网上主要流通的是3D信息的“压缩包”(文字、图片、视频)[40] - 公司技术发展速度超出预期,原以为需四五年才能进入3D管线并超过人类水平,但现在短短两三年已基本做到[51] 公司商业化与用户数据 - 截至2025年8月,公司的年度经常性收入达到1200万美元,处于行业领先地位[5] - 公司拥有约500万专业用户,其中80%以上来自海外[5] - 在To B端,公司服务超过4万家中小企业和约700家大企业[5] - 公司的落地场景主要分为四大类:内容创作(游戏、动画、影视等)、工业设计、展示展览(电商、广告、教育等)以及新兴行业(具身智能、数字孪生、元宇宙等)[52] 公司愿景与创业理念 - 公司的终极愿景是打造“3D版TikTok”,即一个以3D UGC为核心的生态平台,让每个人都能实时交互地活在自己最爱的世界[4][32] - 创业的核心理念是“让富有创意的人专注于创意本身”,通过AI技术将动画、游戏等产业从劳动密集型升级为真正的创意产业[11][12] - 公司认为信息传播是一个从压缩(文字、图片、视频)到解压缩(3D)的过程,随着互联网技术成熟,人们将直接消费最真实、信息密度最大的3D内容[18] - 创业驱动力源于一个明确的“钉子”(需求),即创作者无法零门槛、零成本实时创作3D内容,因此需要打造“锤子”(AI 3D大模型工具)来解决[45] - 公司认为3D形式与可交互性天然绑定,能提供以“我”为核心的“主体性”沉浸体验,这与通过文字、图片、视频进行“移情”的旁观者体验有本质区别[24][25][27] 行业认知与市场判断 - 创始人认为当时行业盲目跟风投入AGI或语言大模型是情绪化的产物,并不理性[17] - 从3D到视频、图片再到文字,是一个信息密度逐渐降低、信息逐渐失真的压缩过程[17] - 视频生成等技术存在一致性、记忆时长等“幻觉”问题,本质在于其没有真实的3D世界作为基础,是在“说谎”[22] - 文字、图片、视频内容因创作工具(如打字法、手机摄像头)的普及已成为大众艺术(UGC),而3D或可交互内容目前仍是“精英的艺术”,全球相关专业人员可能不到100万[28] - AI 3D大模型有望成为大众级创作工具,打破3D内容创作的门槛,从而催生海量3D UGC内容和平台[32] - 行业早期面临人才稀缺、数据匮乏、资源不足等挑战,但近两年随着AI、3D成为显学,大量资源和资金投入已形成良性循环[41] 创业历程与团队 - 创始人创业想法源于在商汤科技时期的经历,曾尝试用AI技术制作动画但盈利有限,后观察到游戏与元宇宙结合的市场潜力[15][16] - 公司创业初期,全球范围内尚无真正意义上的AI 3D大模型,仅有海外科技巨头的早期尝试和相关论文[43] - 公司采取“先大模型,后工具”的路径,在创业之初便专注于3D大模型研发,而非先开发前端工具[34][35] - 创始人通过寻找合作伙伴和信任的团队(如CTO梁鼎、首席科学家曹岩培)来弥补自身技术背景的不足,并对团队实现目标的能力抱有强烈信心[42][43] - 创始人认为当前最大的难题并非技术或市场,而是在充满噪音和诱惑的时代保持耐心与定力,坚持长期主义[53] 创始人哲学与思维方式 - 创始人拥有国际关系学和经济学双学位,并热衷于研究神学,其思考方式深受功利主义哲学家边沁和密尔的影响,核心是追求“最大化幸福的总和”[6][55][56] - 创始人将创业方向分为三类:快速扩散资源型、延长生命型、以及提升当下体验型(如迪士尼),其本人更倾向于第三种[57] - 创始人认为,让人能够选择自己最极致的体验至关重要[58] - 创始人自认为是“理念型创业者”,选择做事的标准是方向与意义,而非个人是否擅长[61][62]
「善友探索流」第三期|融资数亿的97年创始人宋亚宸,做3D抖音
混沌学园· 2025-12-03 19:57
公司概况与愿景 - 公司VAST致力于让AI“重新生成三维世界”,而非仅生成视频,其AI 3D工作台Tripo Studio可将传统需专业人士十几个小时完成的3D建模缩短至约6分钟 [4] - 公司的终极愿景是打造一个“3D版UGC平台”,让每个人都能像发抖音一样轻松生成3D内容,最终在三维世界中拓宽人类的幸福边界 [13][22] - 创始人宋亚宸(1997年出生)拥有跨学科背景,热爱内容创作,其个人兴趣与对市场空白的洞察是创业的重要动机 [7][8][17][18][19] 技术产品与突破 - 公司核心产品Tripo能基于文字或图片一键生成带完整材质的三维模型,可直接用于游戏、动画、虚拟空间 [5] - 2024年9月发布的Tripo 3.0模型参数达到两百亿级别,标志着AI 3D从“玩具”进入深层工作流,其生成模型的价值占比从10%跃升至50%甚至更高 [30][31] - 技术实现了从生成粗糙几何体到生成带贴图、材质甚至能自动绑定骨骼的可用模型的跨越,正致力于打造完整的创作流程闭环 [31][32][33] 市场表现与商业化 - 截至2025年7月,公司年度经常性收入(ARR)达到1200万美元,是AI 3D领域收入最高的公司之一 [12] - 2024年8月,公司月收入已达约200万美元,并保持增长 [38] - 公司工具已服务全球近500万专业建模师和超过4万家企业 [37] 融资历程与市场地位 - 公司成立三年已完成三轮融资,每轮融资金额均达“数亿人民币”级别,估值位居全球AI 3D大模型公司之首 [11][38] - 2024年6月完成数千万美元Pre A+轮融资,由北京市人工智能产业投资基金领投,靖亚资本跟投 [9] - 历史投资方包括绿洲资本、达晨财智、春华创投、英诺天使基金、水木清华校友种子基金等多家知名机构 [10] 行业影响与范式变革 - AI 3D被视为一场“能力平权”的革命,将3D创作从少数精英技能转变为像打字、拍照一样的大众能力,其核心价值不是“降本增效”而是创造新的生产力范式 [43][44][60] - 该技术有望重塑多个行业:例如实现“3D菜单”提升消费体验、实现个性化定制使设计边际成本归零、通过虚拟样品迭代为制造业(如义乌外贸)降低“开模”风险 [47][48][49][50][51][52][54][55][56][57][58][59] - 在AI 3D赛道上,中国被认为是全世界最领先的,这得益于该领域早期高投入、小市场、非共识但未来高速增长的特征 [61][62] 市场教育与用户生态 - 早期市场教育依赖于与创作者“玩在一起”,通过创作者比赛等方式培育社区,早期用户使用不完美的工具创作出惊艳作品并自发分享,形成了宝贵的“自来水”传播效应 [34][35][36] - 公司没有庞大的销售团队,其增长动力部分来自于用户社区的自发推广和口碑 [34][36]
凡拓数创伍穗颖:自主研发AI 3D解决方案,助力国潮走向世界
21世纪经济报道· 2025-11-26 16:12
公司发展历程 - 公司于2002年创立 赶上了大湾区基建的黄金时代 用3D技术构建多个城市的数字底座 [2] - 2010年作为广州亚运会数字图像独家供应商 负责近千条宣传片制作 开闭幕式动画预演及全场馆虚拟交互平台数字视觉工作 成功实现从单一可视化技术提供商到综合数字化解决方案服务商的转型 团队规模突破千人 [2] - 2012年获得中国科创首轮融资 历经新三板挂牌与创业板转板筹备 最终于2022年成功登陆深交所 [2] 技术研发与产品战略 - 2016年二次创业成立广州虚拟动力网络技术有限公司 专注AI惯性视觉算法与动作捕捉设备研发 三年后将产品推向市场 [2] - 2020年众筹研发自主Ai3D软件 目前其数字孪生解决方案已广泛应用于智能制造 水利水务 能源电力等领域 [2] - 2025年联合大湾区顶尖科研力量 携手北京大学深圳研究院等机构 共同打造全栈自研的具身智能数据训练与仿真平台 以助力跨越周期 构筑第三增长曲线 [3] 市场定位与文化愿景 - 公司深耕文化行业二十余年 积累了顶尖的美术设计与文化理解能力 [3] - 结合扎实的Ai3D核心技术 开发出多款引领市场的文化产品 [3] - 致力于打造Ai3D文化场景 助力国潮走向世界 [3]
VAST完成数千万美元新融资,他说模型即产品不是真正的产品
暗涌Waves· 2025-06-10 12:57
融资与行业认知 - VAST完成数千万美元Pre-A+轮融资 由北京市人工智能产业投资基金领投 靖亚资本跟投 [1] - 创始人认为行业普遍将AI生成3D视为"模型即产品"的路径是错误的 3D领域目前是PGC生态而非UGC生态 [6][8] - 3D创作者需要的是AI原生工作台而非单纯生成模型 类似程序员使用Cursor而非VS Code [9][10] 产品战略与进化路径 - 发布Tripo Studio一站式3D工作台 提供完整AI工作流 可将模型从80分优化到95分 [10] - 产品进化路径:模型即产品→一站式AI 3D工作台→3D美图秀秀→3D版抖音 [14][16] - 当前重点服务专业消费者(Pro-C) 而非直接面向UGC用户 [12][13] - "3D美图秀秀"将降低创作门槛 让无基础用户零门槛创作可消费内容 [14][15] 行业应用与案例 - 为《燕云十六声》开发"万物太极"玩法 将生成时间从几十秒压缩到几秒 [20] - 3D打印市场潜力巨大 生成技术将潜在用户从几千万扩展到几十亿 [21][22] - 柔性化生产应用场景广泛 包括首饰/鞋服/家居/玩具等多个领域 [22][23] - 可实现小单快返和按需生产(POD)模式 帮助电商平台更好表达用户需求 [23] 竞争格局与差异化 - 面对腾讯/字节等大厂竞争 但已在产品/工程/商业化方面领先 [18] - 大厂采取"先看见再相信"策略 而创业公司是"先相信再看见" [18][27] - 与大厂存在合作关系 而非单纯竞争关系 [19] 用户教育与市场前景 - 00后/05后对3D接受度高 无需额外教育 [24] - 3D内容将先于专用硬件普及 类比网络小说早期发展历程 [26][27] - 预计3-5年内将出现"3D版抖音" 比原先预期的5-10年更乐观 [17] 团队与文化 - 公司办公地点始终围绕清华 吸纳大量清华毕业生 [3] - 创始人保持对3D作为下一种内容形态的坚定信仰 [3][29] - 吸引人才的核心在于共同愿景而非物质条件 [28][29]