3D生成

搜索文档
3D版DeepSeek卷起开源月:两大基础模型率先SOTA!又是VAST
量子位· 2025-03-28 18:01
3D生成模型技术突破 - VAST公司发布TripoSG和TripoSF两个基础3D生成模型,均刷新开源和闭源领域的SOTA性能[6][7][8] - TripoSG开源1.5B版本模型权重、推理代码及演示Demo,在质量、细节和保真度实现重大突破[14][15][16] - TripoSF采用阶段性开源策略,目前发布VAE预训练模型和推理代码,满血版将在Tripo 3.0开放[16][64] 技术创新亮点 - TripoSG首创将矫正流(RF)Transformer架构应用于3D生成,结合MoE层实现参数容量提升[21][22][24][25] - 开发基于SDFs的高精度VAE架构,引入混合监督训练策略提升几何表示质量[28][30][31] - TripoSF核心创新SparseFlex表示方法,支持1024³高分辨率训练,内存占用降低82%[48][49][54][57] - 构建200万高质量"图像-SDF"训练样本数据集,验证数据质量对性能的关键影响[32][34] 性能表现 - TripoSG在语义一致性上超越现有模型,能处理复杂拓扑结构和精细元素[35][37][43] - TripoSF在标准测试中实现82% Chamfer Distance降低和88% F-score提升[57] - 高分辨率版本(Ours1024)在Toys4k和Dora Benchmark上全面领先竞品[58] 开源战略布局 - 启动持续一个月的开源计划,每周发布新项目[10][13] - 后续将开源三维部件补全模型、绑定生成模型及SIGGRAPH Asia收录的交互式草图模型[66][67] - 此前已开源MV-Adapter多视图生成方案和MIDI单图3D场景创建技术[70][72][74][75] 行业影响 - 公司2024年发表数十篇论文,此前开源项目包括threestudio、Wonder3D等业界知名框架[80] - 被专业艺术工作者认可,成为3D生成领域国产代表企业[81][87] - 技术路线规划明确:从静态生成向动态交互演进,目标2025年底实现零门槛3D创作[83][84][85]
上海隐秘大学,正排队宣布融资
投资界· 2025-01-15 15:46
影眸科技融资与业务发展 - 3D生成大模型公司影眸科技完成数千万美元A轮融资,由美团龙珠、字节跳动领投,红杉中国种子基金及奇绩创坛跟投 [3] - 团队平均年龄24岁,孵化自上海科技大学,核心成员为该校本科生 [3][5] - 公司开发可控3D原生DiT生成框架CLAY与3D服装生成框架DressCode,获ACM SIGGRAPH 2024最佳论文提名 [3] - 2021年推出二次元生成器AI画板应用"WAND",获千万级浏览量,同年完成奇绩创坛天使轮融资 [6] - 2022年4月完成数千万元Pre-A轮融资,红杉中国种子基金领投 [6] - 转向3D生成领域后推出平台Rodin Gen-1,参数超40亿,解决行业薄面与边缘锐度问题 [9] - Rodin Gen-1上线45天实现100万美元年经常性收入(ARR),与Amazon、字节跳动、Unity等达成合作 [9] 上海科技大学创业生态 - 上科大累计孵化40多家科创企业,覆盖生物医药、人工智能、新能源等硬核领域 [3][12] - 技术转移办公室(OTT)2019年成立,2018年至今专利许可合同金额累计超70亿元,衍生企业总估值近70亿元 [12] - 典型案例包括灵秘科技(NeRF技术)、正序生物(基因编辑)、标新生物(生物医药)、飓晟科技(信息科技)、贻如生物(合成生物学)等 [12] - 80%本科生参与实验室科研,10%在本科阶段产出科研成果,本科师生比1:4 [15] - 2018年起每年举办创新创业大会,六届累计服务2500余师生,960位投资人参与,41%获奖项目实现转化 [15] 上科大办学模式与科研实力 - 2013年由上海市政府与中国科学院共建,聚焦新材料、新能源、生命健康等关键领域 [14] - 2023年录取分数线超650分,位列最年轻"双一流"大学 [13] - 教授团队包括2位诺奖得主、39位两院院士、5位美国国家科学院院士 [15] - 学科设置打破传统院系界限,实验室向本科生开放,鼓励交叉研究与早期创业 [15] - 校园位于张江科学城核心区,与国家级大科学设施深度联动 [15]
影眸科技获美团龙珠、字节领投数千万美元A轮融资,专注3D生成大模型
IPO早知道· 2025-01-13 11:55
融资与商业化进展 - 公司完成数千万美元A轮融资 由美团龙珠和字节跳动领投 红杉中国种子基金及奇绩创坛跟投 光源资本担任财务顾问 [2] - 融资资金将用于3D大模型前沿探索和商业化落地 重点推进Rodin为核心的Hyper3D产品全球市场拓展 [2] - 核心产品Rodin上线45天即实现100万美元ARR(年经常性收入) 并保持高速增长 [2][5] - 已与Amazon、字节跳动、Unity等全球客户达成合作 获得数百万元B端订单 覆盖游戏、电商、3D打印等8个行业 [2] 技术实力与产品迭代 - 团队研发的可控3D原生DiT框架CLAY和服装生成框架DressCode获ACM SIGGRAPH 2024最佳论文提名 研究质量达国际顶尖水平 [2][3] - CLAY框架被MIT教授Kaiming He收录至Deep Generative Models课程 公司是SIGGRAPH 50年来首个入选Real-Time Live环节的中国团队 [3] - 旗舰产品Rodin Gen-1拥有40亿参数 支持图像/文字输入生成高质量四边面几何模型及PBR材质 集成3D ControlNet与LoRA模块 达到当时最高商用标准 [5] - 2024年底发布Rodin Gen-1.5版本 通过3D原生表达解决薄面与边缘锐度问题 再次提升全行业商用标准 [5] 行业竞争格局 - 3D生成被视为"世界模型最后一块拼图" 2024年AutoDesk、Meta、NVIDIA、腾讯等巨头均推出3D大模型 行业进入高速发展期 [7] - 公司凭借3D表达/图形学技术积累及对用户需求的深度洞察 在技术与商业化层面持续领先行业巨头 [7] 团队与使命 - 公司孵化于上海科技大学 创始团队平均年龄24岁 2020年成立 [2] - 使命为"让每个人平等拥有3D创造能力" 致力于打造符合行业标准(Production-Ready)的3D大模型产品 [5]
独家专访 Tripo CMO,揭秘如何实现 3D 用户破圈增长和多社区联动策略
深思SenseAI· 2024-09-30 11:04
产品与技术能力 - 公司专注于3D大模型研发,核心产品Tripo支持文本和图片输入生成3D模型,例如输入"火烈鸟站在蓝色的球上"或上传帆船图片可快速生成对应3D模型[3][5] - 在图像输入场景中,几何形态还原度达95%以上,尤其擅长家居类标准物品,材质还原方面优化了贴图细腻度和PBR真实感[8][12] - 采用Scaling Law路线,探索高斯泼溅等新型3D表示方法,Tripo 2.0版本将在10月发布重大技术进展[13] 用户画像与商业模式 - 核心用户分为三类:AI科技爱好者、泛互联网/工业设计师、Roblox等内容消费转创作者群体,第三类用户比例自5月起快速增长[20] - 商业模式包括Web订阅、API调用收费(占主要收入)、GMV抽成(如3D打印农场合作)及社区扶持项目[27] - 典型落地场景包括家居行业快速打样闭环、游戏场景生成(如梵高房间3D化),相关研究被SIGGRAPH Asia收录[21] 社区运营与增长策略 - 早期以"8秒生成速度"为卖点吸引技术圈用户,后通过Blender社区举办"小屋杯"比赛吸引5000+创作者,并与ComfyUI社区合作扩展AI+2D用户群[28] - 关键策略包括:通过KOL争议事件获取曝光(如日本艺术家RuiHuang作品引发讨论)、马斯克转发空间站作品、ComfyUI节点开发降低创作门槛[34][37][39] - 针对Roblox青少年用户推出虚拟饰品生成服务,15天内吸引5万用户领取2万份道具,类比"虚拟时尚淘宝店"运营模式[44][46] 全球化与技术品牌建设 - 采取"模型出海"策略,通过开源TripoSR算法与Stability合作,在GDC大会渗透独立游戏开发者圈层,强化技术品牌影响力[49][51] - 举办全球AI 3D渲染大赛"Behind the Scenes"和3D打印国际象棋大赛"The Master Piece",以作品驱动传播[52] - X账号定位"3D与AI领域唯一必关注账号",价值观强调技术开放性与创意包容性[52]