Workflow
混元3D Studio
icon
搜索文档
腾讯用AI把美术管线重新做了一遍,混元3D Studio架构曝光
量子位· 2025-09-22 19:16
核心观点 - 腾讯混元3D Studio是一个专为3D设计师、游戏开发者和建模师打造的专业级AI工作台 通过集成七大核心技术模块实现从概念设计到动画生成的全流程自动化 将3D资产生产周期从几天缩短至分钟级 [3][4][6] 核心技术模块 组件拆分 - 利用连通性分析和语义分割算法自动拆解复杂模型为功能独立组件(如步枪的弹匣、枪管和枪托) 支持独立编辑和动画制作 [9] - 采用原生3D分割模型P³-SAM进行部件检测 包含特征提取器、三个分割头和IoU预测头 通过FPS生成点提示和NMS合并冗余掩码 [14][15][18] - 提出可控扩散框架X-Part 基于部件级提示和语义特征扰动实现有意义的部件分解 在多个基准测试中达到最优表现(CD1指标0.11 Fscore-0.1达0.80 Fscore-0.5达0.71) [21][25][26] 可控图像生成 - 支持文本或图像输入生成多视图设计图 专用A-Pose标准化模块确保角色骨架姿势一致性 风格迁移模块匹配目标游戏美术风格 [9][32] - 图像风格化模块通过三元组训练数据(输入参考图像 风格类型 风格化3D设计图)实现写实图像与风格化作品的精确映射 [33][34] - 姿态标准化模块采用分辨率递进训练(512×512至768×768) 结合SFT和DPO微调提升生成图像在面部、复杂服饰等细节的保真度 [40][41] 高保真几何生成 - 基于Hunyuan3D框架 包含ShapeVAE变分编码解码结构和DiT扩散模型 通过21层Transformer堆叠(含MoE子层)提升模型容量 [43][45][46] - 支持单视图/多视图图像条件生成 引入包围盒条件控制(编码高宽长为条件向量)和多视图图像条件约束(通过LoRA适配层合成多视角视图) [47][49][51] - 采用流匹配目标训练 将高斯噪声映射到形状潜变量 实现高效高质量采样 [47] 低模拓扑生成 - 采用自回归模型PolyGen从高模点云预测低模拓扑顶点和面 通过Blocked and Patchified Tokenization(BPT)方法提升训练推理效率 [57][59][60] - 网络结构包含点云编码器(Perceiver架构)和Hourglass Transformer解码器 采用截断训练策略(4k面序列片段)和滚动缓存推理 [60] - 基于拓扑感知掩码的DPO后训练 通过边界边比(BER)、拓扑分数(TS)和豪斯多夫距离(HD)指标优化网格质量 [61][62][63] 语义UV展开 - 提出SeamGPT框架 通过自回归方式生成艺术家风格裁切缝 将曲面裁切问题建模为序列预测任务 [71][72] - 采用交叉熵损失和KL散度损失训练 结合随机缩放(0.95-1.05区间)、顶点抖动和旋转等数据增强技术 [73] - 在Bowl(0.49)、Ball(0.31)等多个模型上达到最优平均分数(1.95)优于Xatalas(1.98)、FAM(8.52)等方法 [74][75] 纹理生成与编辑 - 将2D扩散模型扩展为几何条件多视角生成模型 支持文本和图像引导的PBR材质编辑(包括基础色、金属度、粗糙度和法线贴图) [77][80][81] - 基于8万份高质量PBR材质数据集训练 采用MoE架构自适应处理图像输入(通过CLIP相似度判断几何匹配度) [81][83][84] - 创新性适配3D VAE框架压缩多域材质数据 实现4K分辨率纹理合成 [95] 绑骨蒙皮与动画特效 - 分人形角色动画(基于22关节模板骨骼)和通用角色动画(自回归骨骼生成+几何拓扑感知蒙皮)两条处理路径 [97][98][99] - 显式融合骨骼特征、顶点特征和拓扑关系 提升蒙皮精度和稳定性 [99] - 支持姿势标准化(转换任意姿势为T型姿势)和动作重定向 输出可直接用于Unity或Unreal Engine的可驱动动画资产 [99][105] 系统集成与输出 - 通过统一资产图协同管理各模块输出元数据 实现参数化控制和增量式更新 无需全量重算 [103][104] - 最终输出可根据目标游戏引擎规范配置导出 支持专业流水线应用 [105]
人工智能周报(25年第38周):阿里开源深度研究 Agent 模型 Deep Research,美团首款 Agent 小美公测-20250922
国信证券· 2025-09-22 19:02
证券研究报告 | 2025年09月22日 阿里开源深度研究 Agent 模型 Deep Research,美团首款 Agent"小美"公测 人工智能动态:1)产品应用:百度 AI 搜索月活再次登顶国内第一;腾 讯推出专业级AI 3D工作台混元 3D Studio;谷歌将 Gemini 添加到 Chrome 浏览器中,以支持 AI 搜索;可灵 AI 数字人上线,最长支持 1 分钟视频 生成;腾讯企点营销云三大升级,助力企业打造"一专多能"AI 营销团 队;飞猪 AI"问一问"推出拍照讲解功能;腾讯汤道生:用户每天向腾 讯元宝的提问量已达年初一个月的总量;腾讯 AI 能力全面开放,全面 适配主流国产芯片;高德 AI 出行智能体"小高老师"月活突破 4 亿; 美团首款 AI Agent 产品"小美"公测,"小美"搭载了月初发布的美 团自研模型 LongCat-Flash-Chat ,通过简单的自然语言交互、内部接 口调用,能够实现原生、丝滑的外卖下单、餐厅推荐、订座导航等本地 生活服务体验;Kimi-K2-0905 RooCode 开源榜单排名第一。 2)底层技术:通义首个深度研究 Agent 模型 DeepRes ...
人工智能周报(25年第38周):阿里开源深度研究 Agent 模型 Deep Research,美团首款Agent“小美”公测-20250922
国信证券· 2025-09-22 16:44
证券研究报告 | 2025年09月22日 人工智能周报(25 年第 38 周) 优于大市 阿里开源深度研究 Agent 模型 Deep Research,美团首款 Agent"小美"公测 人工智能动态:1)产品应用:百度 AI 搜索月活再次登顶国内第一;腾 讯推出专业级AI 3D工作台混元 3D Studio;谷歌将 Gemini 添加到 Chrome 浏览器中,以支持 AI 搜索;可灵 AI 数字人上线,最长支持 1 分钟视频 生成;腾讯企点营销云三大升级,助力企业打造"一专多能"AI 营销团 队;飞猪 AI"问一问"推出拍照讲解功能;腾讯汤道生:用户每天向腾 讯元宝的提问量已达年初一个月的总量;腾讯 AI 能力全面开放,全面 适配主流国产芯片;高德 AI 出行智能体"小高老师"月活突破 4 亿; 美团首款 AI Agent 产品"小美"公测,"小美"搭载了月初发布的美 团自研模型 LongCat-Flash-Chat ,通过简单的自然语言交互、内部接 口调用,能够实现原生、丝滑的外卖下单、餐厅推荐、订座导航等本地 生活服务体验;Kimi-K2-0905 RooCode 开源榜单排名第一。 2)底层技术:通 ...
平安证券(香港)港股晨报-20250922
平安证券(香港)· 2025-09-22 10:15
市场展望 港股晨报 港股回顾 点,跌幅随即扩大至 247 点,低见 23730 点,其后跌幅 一度收窄至仅 20 点,午后大盘走势偏软,尾盘沽压再 度扩大。截至收盘,恒指收报 23831 点,下跌 145 点或 0.61%;国指收报 9656 点,下跌 47 点或 0.49%,大市 成交进一步减至 827.99 亿。港股通录得净流入资金 4.84 亿,其中港股通(沪)净流入 2.83 亿,港股通(深)净 流入 2.01 亿。板块方面,本地地产、软件、5G 概念板 块跌幅靠前;黄金股逆市走强。 上周港股表现强劲。全周来看,恒指一度升越 27000 点,再创逾 4 年高,全周恒指升 156 点或 0.59%,恒生国企指数及恒生科技指数全周则分别 收涨 1.15%和 5.09%。分行业来看表现明显分化, 其中万得恒生非必需性消费业行业上周大涨 4.86%,而金融业指数则下跌 3%。处于指数权重 地位的资讯科技业指数上周收涨 1.76%。上周晨 报推荐的工程机械龙头公司中联重科(1157HK)单 周涨超 6%。 美股市场 1. 上周五美股延续强势,三大指数齐创收盘新高。 美联储降息预期强化,市场风险偏好提升,企业 盈 ...
腾讯研究院AI速递 20250922
腾讯研究院· 2025-09-22 00:01
生成式AI 一、 Chrome 迎来大更新,刚刚登顶 App Store 的 AI 直接用 1. Chrome自2008年发布以来进行最大更新,将Gemini AI助手集成到浏览器右上角,支持跨标签页对话和内容总 结; 2. 浏览器地址栏升级为"Omnibox全能框",可根据页面内容智能推荐问题,并支持直接在地址栏开启AI模式进行复杂 查询; 3. 新版Chrome还利用Gemini Nano增强安全保护,可识别有害网站、自动管理垃圾通知,以及一键修复泄露密码, 已向美国用户开放。 https://mp.weixin.qq.com/s/2LtnbHh769lYBPdibzmsvg 二、 Notion 3.0 版本正式上线,全面进入AI Agent 时代 1. Notion创始人Ivan Zhao宣布Notion 3.0发布,引入Agent功能,可自主执行所有Notion操作,时隔7年的重大更 新; 2. Agent能自主工作长达20分钟,可跨工具完成复杂任务,如整合多渠道客户反馈、更新知识库、生成入职计划等; 3. 新版本引入高度个性化的"记忆库",即将推出的"自定义Agent"功能还将支持自动运行和团队共享 ...
90后北大硕士升任永辉超市CEO;云海肴创始人赵晗去世,年仅40岁;雷军回应小米召回超11万辆SU7;智元披露合伙人名单丨邦早报
创业邦· 2025-09-20 12:39
小米汽车召回事件 - 小米汽车召回116887辆SU7标准版电动汽车 因L2高速领航辅助驾驶功能在极端特殊场景下识别、预警或处置可能不足 存在安全隐患[1] - 通过OTA技术免费升级软件以消除安全隐患 优化辅助驾驶速度控制策略并新增动态车速功能 提升辅助驾驶功能可靠性[2] - 本次召回仅针对2025年8月30日前生产的部分SU7标准版车型 不涉及其他版本[2] 云海肴创始人去世 - 云海肴创始人赵晗因突发心梗去世 享年40岁 名下关联40余家企业 其中21家为存续状态[2] - 业务版图涉及餐饮、投资、企业管理等领域 包括云海肴南京餐饮管理有限公司、上海联馔餐饮集团有限公司等[2] iPhone 17系列发售情况 - iPhone 17系列国行版正式发售 官网送货时间需3-4周 Pro Max 256G可加价600元回收 标准版256G和512G可加价400元回收[4] - 加价回收情况优于去年同期 此前iPhone 16和15系列标准版曾被黄牛拒收[4] 捷豹路虎网络攻击事件 - 捷豹路虎因网络攻击事件延长生产暂停时间至2025年9月24日 全球33000名员工受影响[6] - 公司正评估各环节潜在风险 目前尚未对中国市场交付产生影响 零售合作伙伴仍在正常营业[6] 智元机器人管理层披露 - 智元机器人合伙人团队名单披露 邓泰华为创始人、董事长、CEO 彭志辉为联合创始人、总裁、CTO[7] - 其他高管包括姜青松任营销服总裁 姚卯青任具身业务部总裁 王闯任通用业务部总裁等[7] 追觅科技造车进展 - 追觅科技官宣造车 首款超豪华纯电产品对标布加迪威龙 计划2027年亮相 已组建近千人团队[10] - 团队包括原智能硬件业务核心研发人员和传统整车制造领域资深专家 正在德国特斯拉柏林工厂附近选址建厂[10] 腾讯元宝及美团新功能 - 腾讯元宝全量上线公众号和视频号评论区 具备用户情绪感知与回应能力[10] - 美团试点"热菜现制现炒"信息展示栏 满足消费者对门店信息的知情权 帮助商家展示后厨动态[10] 深圳水贝金料商事件 - 深圳水贝金料商粤宝鑫负责人失联 多名商户支付大额预付款后公司突然停业[12] - 市场传言金料商出现跑路潮 但实地调查未证实 另有金料商发布清算公告[12] 格力回应小米包修政策 - 格力高管朱磊回应小米十年免费包修政策 称十年不用修才是实力 基于30年市场验证和持续下降的售后故障率[12] - 建议小米先修好召回的11万辆车再拍胸脯承诺[12] 阿里游戏及永辉人事变动 - 阿里旗下虎鲸文娱打造小游戏业务"熠点互动" 专注H5和小程序游戏平台运营[12] - 永辉超市聘任90后王守诚为CEO 1991年出生 北京大学硕士 2017年以管培生身份加入永辉[12] Meta及扎克伯格AI战略 - 扎克伯格表示宁愿浪费数千亿美元也不愿在AI领域落后 认为风险是不够激进而非过于激进[14] - AI泡沫可能出现 但人工超级智能提前到来将使技术落后的公司处于不利地位[14] 深圳房地产限购辟谣 - 网传深圳核心区放开限购 官方辟谣称不存在特殊渠道解决购房资格问题[14] - 深圳市9月5日出台房地产调控政策 未放开核心区限购[14] 淘宝闪购及谷歌AI整合 - 淘宝闪购和饿了么上线餐饮团购业务 优先在上海、深圳、嘉兴试点 后续扩展至全国一二线城市[17] - 谷歌将Gemini AI整合进Chrome浏览器 支持网页解释、多标签页信息整合和恢复关闭网站等功能[17] 黄仁勋评论马斯克及微软投资 - 黄仁勋称赞马斯克是优秀工程师 有机会在AI领域占据领导地位 经常使用xAI的Grok聊天机器人[17] - 微软在威斯康星州建第二座数据中心 累计投资超70亿美元 首座数据中心2026年初投运[17] 特斯拉及生数科技融资 - 特斯拉Optimus AI团队负责人Ashish Kumar离职加盟Meta 曾任Optimus项目AI开发负责人[18] - 生数科技完成数亿元A轮融资 由博华资本领投 百度战投等老股东跟投[20] 星际荣耀及瞻芯电子融资 - 星际荣耀完成D+轮融资首批资金7亿元交割 用于可重复使用运载火箭研发和生产基地建设[20] - 瞻芯电子C轮融资获超10亿元投资 由国开制造业转型升级基金领投[20] 英伟达投资及小米开源 - 英伟达拟向英国自动驾驶初创企业Wayve投资5亿美元 已签署意向书[20] - 小米开源首个原生端到端语音大模型Xiaomi-MiMo-Audio 基于上亿小时训练数据实现少样本泛化[20] 追觅手机及腾讯3D平台 - 追觅将推出首款智能手机Dreame Space 海外市场获超亿元人民币预售订单[20] - 腾讯发布一站式工作平台"混元3D Studio" 整合3D生产全流程 将生产周期从天级缩短到分钟级[22] 通义万相及深蓝汽车 - 通义万相开源动作生成模型Wan2.2-Animate 支持驱动人物、动漫形象和动物照片[24] - 深蓝S07正式上市 全系标配华为乾崑ADS SE和3C快充 南京数智工厂年产值超37亿元[24] PC掌机及北京大模型 - 2025年全球PC掌机销量预计达230万台 同比增长32% 2029年销量预计达470万台[26] - 北京备案大模型数量占全国近三成 达159款 全国560款大模型完成备案 注册用户超32亿[26]
小米开源首个原生端到端语音大模型;谷歌将Gemini AI引入Chrome浏览器丨AIGC日报
创业邦· 2025-09-20 12:39
1.【小米开源首个原生端到端语音大模型】9月19日消息,小米正式开源首个原生端到端语音模型 Xiaomi-MiMo-Audio,它基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL 的少样本泛化,并在预训练观察到明显的"涌现"行为。(每日经济新闻) 2025 DEMO CHINA「AI创新应用专场」招募开启 产品能 Dem o,就有机会入选《2025早期AI创新先锋50强》,直面200+投资机构~ 点击右边链 接,专属报名通道走起➡️ 创业邦·2025 早期 AI 创新先锋50强报名表 感谢关注创业邦,每天精彩内容不停 欢迎加入 睿兽分析会员 ,解锁 AI、汽车、智能制造 等相关 行业日报、图谱和报告 等。 关注 AIGC 等热门垂直赛道,扫码可订阅产业日报 2.【特斯拉Optimus AI团队负责人Ashish Kumar离职加盟Meta】9月19日消息,特斯拉Optimus AI 团队的负责人Ashish Kumar宣布离职,加入Meta担任研究科学家一职。Ashish Kumar于2023年7 月加入特斯拉,负责Optimus项目的AI开发工作,直至2025年9月离职。在特斯拉的两年多时 ...
AI进化速递丨生数科技完成数亿元A轮融资
第一财经· 2025-09-19 20:50
生数科技融资进展 - 生数科技完成数亿元人民币A轮融资 [1] 企业合作动态 - 当虹科技与阿里云及云深处科技达成签约合作 [1] - 腾讯推出专业级AI 3D工作台"混元3D Studio" [1] 华为云业务进展 - 华为云CloudMatrix384 AI Token服务实现全面上线 [1] - 华为云主导的具身智能"R2C协议"三项国家标准完成立项 [1][3]
氪星晚报 |腾讯元宝全量上线公众号和视频号评论区;宗馥莉名下南京娃哈哈宏振饮用水公司拟注销;淘宝闪购和饿了么做团购,与高德双线作战
36氪· 2025-09-19 16:31
淘宝、饿了么与高德业务动态 - 淘宝闪购和饿了么将于9月20日在上海、深圳、嘉兴启动餐饮团购试点 优先布局餐饮团购业务 后续扩展至全国一二线城市[1] - 淘宝闪购选择周六启动试点 因该日为订单高峰日 并可衔接十一黄金周客流 直接与美团、大众点评团购业务竞争[1] - 美团试点"现制现炒"信息展示栏 于9月19日测试该功能 允许商家通过后台展示热菜制作动态 旨在满足消费者知情权并助力商家差异化展示[1] 宁德时代供应链合作 - 富临精工控股子公司江西升华与宁德时代签订预付款协议 金额达15亿元 富临精工股价早盘一度大涨近8%[2] - 富临精工表示 其高压实密度磷酸铁锂正极材料受高端客户青睐 主要客户为宁德时代 协议履行将推动产能放量和订单扩大 产线规模效应显现[2] 韩国经济与就业数据 - 韩国第二季度海外直接投资额141.5亿美元 同比下降13.4% 去年同期为163.4亿美元 主因全球经济不确定性加剧[2] - 韩国四大企业集团(三星、现代汽车、SK、LG)2024年在韩员工总数达746,436人 较2020年698,526人增长6.9% 其中三星和现代汽车率先扩大雇佣规模[2] 追觅科技智能手机业务 - 追觅科技首款智能手机Dreame Space未正式发布即获超亿元海外预售订单 于9月19日宣布该消息[3] 娃哈哈子公司变动 - 宗馥莉实际控制的南京娃哈哈宏振饮用水有限公司新增简易注销公告 公告期为9月10日至29日 该公司成立于2015年 注册资本2500万元人民币[4] 卡儿酷IPO进展 - 深圳市卡儿酷科技股份有限公司启动A股IPO辅导 辅导机构为兴业证券 主营汽车应急启动电源、启停锂电及储能电源[5] 腾讯AI产品升级 - 腾讯元宝AI助手全量上线公众号和视频号评论区 具备用户情绪感知与回应能力 可洞察提问情绪倾向并给出用户视角回应[6] - 腾讯推出专业级AI 3D工作台混元3D Studio 基于混元美术级3D生成模型PolyGen 升级低模拓扑功能 新增低中高三档面数控制 满足多样化建模需求[9] 小米汽车软件召回 - 小米召回11.7万辆标准版SU7汽车 通过OTA技术免费升级软件以消除安全隐患 雷军表示OTA秋季大版本升级于9月19日启动 覆盖SU7和YU7车型[7] 激光雷达与碳化硅行业动态 - 激光雷达行业因汽车品牌宣传重点转向"辅助驾驶功能"而受益 机器人市场带来新增量 头部厂商形成规模与成本优势 行业进入量价齐升阶段[8] - 碳化硅功率器件商瞻芯电子完成C轮融资 总额超10亿元人民币 由国开制造业转型升级基金领投 资金用于产能扩张、研发及市场推广[8] 港股业绩展望 - 中信证券预计2025年下半年港股业绩增速迎拐点 科技、医药与原材料板块维持高景气 能源及必选消费等低迷板块有望反转[10] 阿里国际站跨境创业计划 - 阿里国际站联合多地政府设立大学生跨境创业孵化中心 首站在广州挂牌 后续落地杭州、长沙等地 提供AI产品免费使用、办公场地租金全免及选品对接支持 计划全年帮助1000支团队[12] 中国碳排放交易市场 - 中国建成全球规模最大碳排放权交易市场 覆盖全国60%以上碳排放量 并启动温室气体自愿减排交易市场 绿色发展内生动力提升[13]
腾讯推出专业级AI 3D工作台混元3D Studio
格隆汇APP· 2025-09-19 12:56
公司产品发布 - 腾讯宣布混元3D AI创作引擎升级并正式发布专业级AI工作台混元3D Studio [1] - 混元3D Studio专为3D设计师、游戏开发者、建模师等打造 [1] - 基于混元美术级3D生成模型PolyGen升级低模拓扑功能并新增低、中、高三档面数控制 [1]