World Model
搜索文档
干货超标!腾讯混元3D负责人郭春超:真正的3D AIGC革命,还没开始!
AI科技大本营· 2025-05-16 09:33
腾讯混元大模型家族演进 - 腾讯混元大模型自2023年2月启动研发,从大语言模型向多模态模型全面演进,早期聚焦大语言模型方向并于2023年9月发布基于万亿参数级NLP稀疏大模型的生成式能力 [8] - 2024年5月开源业界首个中文DIT架构图像生成模型实现中文图像生成领域开源突破,同年11月推出3D生成1.0模型成为业内首个同时支持文生3D和图生3D的开源大模型 [8] - 2024年12月混元文生视频模型加入开源行列,经过两年多发展已成长为覆盖文本、语音、图像、3D、视频等多模态能力的全面生成式AI基座 [8] 3D生成技术现状 - 3D生成仍处发展早期阶段,工业界大规模投入仅一年出头,当前可用度约50%相比大语言模型90%的成熟度仍有显著差距 [22] - 技术路线呈现自回归模型与扩散模型结合趋势,前者可提升可控性和记忆能力,后者在推理速度上保持优势 [36][39] - 主要挑战包括数据稀缺(千万量级3D数据vs百亿级图片数据)、工业级CG管线融合度不足、3D表达方式未达最优 [32][43] 行业应用与效率提升 - 传统人工建模成本高昂:游戏角色建模达1.2万元/个需7天,广告建模最低200元/秒需0.5天,而文生3D成本仅0.5元/次耗时约1分钟 [13] - 腾讯混元构建"3D创动引擎"架构,通过草图生3D、纹理换肤生成、动作融合建模和低多边形优化四类技术矩阵实现关键环节30%-40%效率提升 [13][14] - 应用分层明显:轻量小游戏资产已"踮脚可及",腰部游戏可辅助道具生成,3A大作需多轮原型迭代中提效 [31] 开源战略与技术生态 - GitHub Star数超1.2万,Hugging Face下载量超100万,最小开源模型参数仅0.6B支持本地运行 [19][28] - 开源与商业协同发展:开源模型反馈问题促进研发,社区插件可被复用,形成"持续迭代速度"的核心护城河 [28][34] - ComfyUI官方支持实现从草图到完整3D模型的一键生成,年内计划开放更多模型与数据集降低行业门槛 [17][19] 未来发展方向 - 2025年目标实现物体级生成接近人工建模水平,场景类生成具备初步雏形,向原生多模态统一架构演进 [20] - 世界模型构建分阶段推进:先实现局部空间合理性,再扩展至具备物理规律的三维世界,当前已在腾讯地图导航车标等场景落地 [19][42] - 专业工具定位明确:AI不会替代3D设计师而是成为生产力工具,帮助将创意实现效率提升10倍 [46][47]
小马智行上市后首份财报:2024年营收约5.5亿元创新高,坚持「三大优先」战略
IPO早知道· 2025-03-25 21:24
核心财务表现 - 2024年全年营收5.48亿元(7503万美元),创历史新高,成为中国营收规模最高的L4自动驾驶公司 [3] - 2024年第四季度营收2.59亿元(3550万美元) [3] - 全年研发费用10.06亿元(1.378亿美元),同比增长14% [5][18] - 剔除股权激励影响后,全年运营费用12.4亿元(1.699亿美元),净亏损11.21亿元(1.536亿美元) [5] - 截至2024年末现金及理财总额60.23亿元(8.25亿美元),同比增长39.4% [6] 业务战略与商业化进展 - 坚持"Robotaxi业务优先、中国市场优先、一线城市优先"战略,重点布局北京、上海、广州、深圳 [8] - 2024年Robotaxi服务收入5328万元(730万美元),主要来自一线城市付费服务拓展 [10] - 2024年2月开通广州自动驾驶示范运营专线,覆盖市中心至白云机场/广州南站,为广州唯一获批企业 [11] - 2024年3月开通北京南站至亦庄Robotaxi服务,成为北京首个高铁站与核心城区联通的商业化试点 [11] - 实现城市道路、高速路段、环路场景一体化自动驾驶运营 [12] - 国内首批在北上广深取得全无人驾驶许可的企业,唯一在四城获全监管许可的自动驾驶公司 [14] 技术研发与产品迭代 - 第七代Robotaxi系统成本较前代下降70%,2025年开始部署 [16][18] - 与丰田、广汽、北汽合作研发三款第七代Robotaxi车型,推进量产规模化 [16] - 自研"世界模型+虚拟司机"技术,每周生成超100亿英里训练数据,"虚拟司机"安全性指标提升16倍 [19] - 上市募资超4亿美元中60%投入L4算法优化、数据闭环及安全冗余设计 [19] 生态合作与产业链整合 - 拥有全球Robotaxi行业最多网约车/出租车合作伙伴,包括如祺出行、支付宝、高德打车等 [24] - 2024年与北汽新能源、广汽埃安合作开发L4车型,接入支付宝/高德地图App [24] - 2025年3月与康福德高(全球2.9万台出租车网络)在广州启动联合运营 [24] - 目标服务定价介于快车与优享之间,服务质量对标专车 [26] 行业前景与公司展望 - 自动驾驶技术将重构交通生态,覆盖乘用车、货运、公交、末端配送全场景 [23] - 行业处于规模化部署关键窗口期,未来1-2年或迎车辆规模化落地突破 [23] - 预计Robotaxi量产将提升运营效率与用户体验,带动财务表现增长 [26]