3D生成
搜索文档
Gemini 3+Nano Banana Pro+3D 生成+手势控制=?藏师傅教你炫酷展示运动成果
歸藏的AI工具箱· 2025-12-05 20:02
文章核心观点 - 文章介绍了一套利用AI工具(特别是Nano Banana Pro和Gemini)为户外运动爱好者(徒步、滑雪、骑行、露营)生成个性化Q版数据展示海报,并将其进一步转化为可交互的3D模型展示网页的完整流程[3][4][6][7][8] 户外运动Q版海报生成方法 - 核心方法:在支持Nano Banana Pro的平台(如Gemini APP、AI Studio等)上传运动打卡照及数据截图,并输入特定提示词即可生成海报[8] - 滑雪海报提示词要点:任务为海报设计与滑雪轨迹留念,需联网查找雪场信息;画面主体为奶油蛋糕般的雪山切片模型,需刻画S型滑行轨迹;必须将用户上传的雪板/头盔图片转化为Q版微缩模型作为视觉焦点;底部采用冰雪酷炫风格排版,标题示例为“[雪场名称] 粉雪日”[10][11][12][13] - 骑行海报提示词要点:任务为海报设计与骑行成就记录,需联网查找地标建筑特征和天气;画面中心为漂浮的3D地形切片及地标微缩模型,地形上需呈现蜿蜒的柏油公路;必须将用户上传的自行车图片转化为Q版微缩模型置于路线终点;底部采用极简风格数据可视化,可包含海拔爬升剖面图[16][17][18][19] - 徒步海报提示词要点:任务为海报设计与户外徒步纪念,需联网查找地标建筑特征和天气;主体为地标建筑或景观的轴侧微缩模型,需包含蜿蜒的徒步小径;必须将用户上传的登山包/登山鞋/冲锋衣图片转化为Q版微缩人物模型置于山峰高点;底部采用户外杂志风格排版,标题示例为“[山峰名称] 登顶记录”[21][22][23] - 露营海报提示词要点:任务为海报设计与精致露营记录,需联网查找地点植被、地标及天气;主体为地标或景观的轴侧微缩模型;必须将用户上传的帐篷/天幕图片转化为Q版微缩模型置于场景中心,并还原颜色与品牌特征;氛围为夜景模式,帐篷有内透光效;底部采用日系杂志风格排版,标题示例为“[营地名称] 露营记”[25][26][27][28] 从海报到交互式3D模型的进阶应用 - 3D模型生成:使用tripo3d.ai或hyper3d.ai等工具,上传生成的Q版海报图片即可一键生成3D模型,下载时需选择GLB格式[31][33] - 3D模型展示网页构建:在AI Studio的“Build”模式下,用自然语言向Gemini 3 Pro描述需求(如上传GLB模型并渲染、展示运动数据截图卡片、采用伪3D拟物化设计风格),即可自动生成功能网页[40][41] - 手势控制功能添加:在已构建的网页基础上,通过向Gemini描述增加手势控制的需求(如手掌左滑停止旋转、右滑继续旋转、捏手指缩小、张开手掌放大),即可一次性实现该交互功能[7][41] 所用工具与技术的评价 - AI Studio被评价为“Vibe Coding神器”,内置各种谷歌模型和基础服务API,除个别模型外无需付费,编程成功率高[41] - 整套流程展示了利用现有AI工具(Nano Banana Pro用于图像生成,Gemini用于代码生成)快速构建个性化、可视化数字产品的可能性[8][40][41]
从游戏工厂到空间智能仿真:混元 3D 为何是腾讯 AI 的“侧翼突围”
AI前线· 2025-11-27 12:02
公司AI战略与产品发布 - 混元3D创作引擎发布国际版,API上线腾讯云国际站,同时开源版全球下载量突破300万次[2] - 公司AI战略路线基于业务需求端、技术端和生态端的复合能力,形成"业务—技术—生态"三位一体的独特优势[3][4] - 公司AI投入重点不是堆规模而是提效率,AI被定义为贯穿内部业务的基础能力,第三季度营收同比增长15%[33] 3D生成技术在游戏行业的应用 - 传统3D制作成本高昂,美术成本占游戏研发50%–80%,一个3D角色模型成本在几万元到近百万元,顶尖3D游戏投入高达数亿美元[6] - 混元3D通过两条技术主线提升效率:面向3D资产提升批量产出效率,面向世界模型解决场景级搭建问题[8] - 在《元梦之星》案例中,玩家输入描述后几秒钟即可生成可编辑3D资产,道具制作时间从2天缩短至0.2天,效率提升10倍[9][12] - 在《轻游梦工坊》中,新手可在一周左右完成游戏开发,约四成参赛者无游戏开发经验却完成了优秀作品[10] 3D生成技术面临的挑战与突破方向 - 技术上面临质量、可控性和速度三座大山,目前真正达到要求的内容比例不足10%[30][35] - 核心挑战包括组件化生成、低多边形拓扑平衡等问题,影响游戏工业化管线对AI产出的接纳[14] - 数据成为行业瓶颈,全球可用3D数据仅千万量级,远不及文本百亿级规模,限制模型泛化能力[38] - 公司正从数据层面、模型架构层面和交互面三个层面进行突破,包括扩充高质量数据和支持多模态输入等[42] 跨行业应用与商业化进展 - 超过150家企业通过腾讯云接入混元3D模型,应用横跨游戏制作、电商展示、影视特效等行业[25] - 3D打印领域率先跑通商业闭环,拓竹MakerWorld平台月调用量预计突破10万次,创想三维可实现5分钟生成Q版手办[26] - 电商场景中家居商家实现约35%的点击率提升,教育文博领域制作成本降至传统流程十分之一[29] - 在自动驾驶和具身智能领域,混元3D承担补齐仿真场景短缺的角色,被多家厂商用于补充真实道路采集[30] 技术竞争与生态建设 - 世界模型竞争白热化,Google DeepMind、Meta、OpenAI、NVIDIA、特斯拉等巨头都在推进相关技术[17][18] - 公司通过开源策略构建生态,开源版下载量超过300万次,社区反馈推动技术改进[20][22] - 混元图像3.0在LMArena全球26个模型盲测中登顶,获得最佳综合文生图模型与最佳开源模型两项第一[31] - 公司定位Model as a Service为核心竞争力,不急于求成,注重技术领先性巩固后的自然商业化平衡点[39]
图片生成仿真!这个AI让3D资产「开箱即用」,直接赋能机器人训练
量子位· 2025-11-23 12:09
技术突破与核心创新 - 提出PhysX-Anything框架,是首个面向仿真、具备物理属性的3D生成范式,仅需单张图像即可生成高质量、可直接用于仿真的3D资产[5] - 该框架能同时生成显式几何结构、关节运动以及物理参数,解决了现有方法普遍缺失密度、绝对尺度、关节约束等关键物理信息的问题[5][6] - 采用由粗到细的生成框架,通过多轮对话依次生成整体物理描述与各部件几何信息,最终解码输出六种常用格式的可仿真3D资产[8] 技术实现细节 - 提出一种新型3D表征方式,基于体素构建几何表示,在32体素网格上由视觉语言模型建模粗略几何,再由下游解码器细化,实现超过193倍的token压缩比[10][27] - 设计可控的flow transformer模块,将粗体素表示作为扩散模型的引导信号,以控制细粒度体素几何的生成[14] - 使用最近邻算法将重建网格划分为部件级组件,结合全局结构信息与细粒度体素几何,生成用于仿真的URDF、XML及部件级网格[15] 性能评估与比较 - 在PhysX-Mobility数据集上的评估显示,PhysX-Anything在几何与物理两类指标上均取得最优表现,其绝对尺度误差大幅降低至0.30[18][19] - 在基于视觉语言模型的评估中,PhysX-Anything在几何与运动学参数两项指标上均显著优于所有对比方法,得分高达0.94[20][21] - 人类志愿者评估结果显示,PhysX-Anything的生成结构在几何与物理属性都获得最高分,几何得分为0.98,物理属性多项得分在0.84至0.98之间[22] 应用潜力与行业影响 - 生成的仿真就绪3D资产可以直接导入模拟器,并用于接触丰富的机器人策略学习,展示了在推动多种下游机器人与具身智能应用方面的巨大潜力[25][26] - 该框架有望为3D视觉、具身智能与机器人研究开辟新的方向,推动从“视觉建模”到“物理建模”的范式转变[28] - 团队构建了覆盖47个常见真实类别、具备丰富物理标注的PhysX-Mobility数据集,大幅拓展了现有物理3D资产的多样性[27]
95 后团队做 3D 大模型,拿下头部游戏重磅合作,正在定义 3D 生成的新规则
Founder Park· 2025-11-18 19:06
公司技术与产品进展 - 公司主攻3D生成方向,其Rodin模型支持的Hyper3D.AI在移动端游戏环境中实现3D生成技术大规模即时应用[2] - 公司推出全新升级的新一代模型Rodin Gen-2,以全球最大规模的百万级别数据与百亿级参数实现生成质量的质的飞跃[6] - Rodin Gen-2支持百万级面数高精度生成,并能通过法线烘焙让低面数模型呈现高清纹理效果,同时兼容更高分辨率材质输出[6] - 模型生成更平滑、干净的几何表面,大幅减少后期修复成本,提升生产可用性[6][8] - Rodin Gen-2引入"Bang to Parts"功能,可将生成的3D模型按原有结构分件爆炸开来,支持局部重建和编辑[9][12][13] - 公司独有的3D ControlNet实现边框盒控制、体素控制、点云控制,降低生成抽卡率,提升可控性[20][25] - 模型矩阵提供四种生成模式:Zero(低面数优化)、Focal(高细节表现)、Speedy(快速预览)、Default(平衡细节与平滑度)[24] - Hyper3D.AI平均每9天上线一个新功能,部分重做功能实现用户对3D生成模型的局部编辑[21] - 在手机硬件端,公司将整体生成速度压缩到10秒以内,实现与生图相近的速度[24] 行业趋势与竞争格局 - 3D生成迎来大年,大厂开始布局:Roblox开源CUBE 3D并开放Mesh Generator API,字节发布基于DIT架构的3D大模型Seed3D 1.0,腾讯混元发布3D v2.5版本模型将参数量级从十亿提升到100亿[6] - 3D生成领域出现与文字/图像/视频生成领域一样的规律,实现"Understanding by Generation"[14] - 消费级3D打印机快速增长为3D内容增加C端可感知渠道,公司成为头部3D打印厂商的首批合作企业[27] - 3D形态在长期内仍是"藏在后面的形态",而非被广泛C端直接消费的内容,但作为标准化中间载体在空间一致性控制上具有不可替代优势[28][29] - 3D生成是支撑下一代智能应用落地的核心拼图与底层基座,对数字内容创作、工业设计、AR/VR交互、具身智能等领域至关重要[29] 研发成果与学术认可 - 公司研究论文《CLAY:用于创建高质量3D资产的可控大规模生成模型》和另一项研究同时入选计算机图形学顶级会议SIGGRAPH的最佳论文提名[2] - 在SIGGRAPH 2025上,公司凭借单图生成3D场景生成的研究CAST获得最佳论文(Best Paper),其BANG研究获选"Top 10技术论文速览"[14][15] - CLAY是完全基于原生3D数据训练的大模型,用远低于图像领域的3D原生数据规模和参数实现Scaling Law,首次在3D生成领域出现"涌现"现象[3] - BANG功能基于跨领域哲学思考实现,将大语言模型底层思维迁移至3D领域,使模型能理解物件内部部件之间的关系[13][18] 商业化与市场应用 - 公司完成由蓝驰创投领投的数千万美元融资,跟投方包括字节跳动和红杉中国种子基金等老股东[2] - Hyper3D.AI在某款大型UGC游戏中支持千万人实时在线生成萌宠或其他物品,对游戏产业而言很罕见[26] - 公司重点打通对不同领域的服务,以核心模型算法实现软件的SaaS化,横向拓展游戏、影视建模及更多工业场景[28] - 团队风格以市场需求为第一原则,将行业前沿技术与市场需求耦合,确保生成的3D模型在质量和使用习惯上符合生产方式[19][28]
智能早报丨字节跳动推出3D生成大模型;美法官承认使用人工智能导致法院裁决出错
观察者网· 2025-10-24 10:00
字节跳动3D生成技术进展 - 字节跳动Seed团队推出3D生成大模型Seed3D 1.0,实现从单张图像到高质量仿真级3D模型的端到端生成 [1] - 该模型基于创新的Diffusion Transformer架构,通过大规模数据训练完成,可生成包含精细几何、真实纹理和基于物理渲染材质的完整3D模型 [1] 快手AI编程产品发布 - 快手StreamLake正式推出“工具+模型+平台”三位一体的AI编程产品矩阵,包括智能开发工具CodeFlicker、多个自研大模型KAT-Coder以及大模型平台快手万擎 [2] - 其中KAT-Coder-Pro V1在SWE-bench Verified测试中以73.4%的解决率超越GPT-5与Claude Sonnet 4 [2] - KAT-Coder-Air V1版本将面向所有用户免费使用 [2] 流媒体行业潜在并购活动 - 苹果正考虑收购流媒体巨头华纳兄弟,以扩大Apple TV的影视阵容,亚马逊、派拉蒙等巨头也在积极参与竞标 [3] - 华纳兄弟CEO已向公司高层汇报相关计划,公司此前拒绝了派拉蒙子公司天空之舞的两次报价,理由是出价过低 [3] - 华纳兄弟将在数日内要求有意竞购的企业签署保密协议,以便在竞价战正式打响前分享敏感业务数据 [3] 人工智能在司法领域的应用影响 - 两名联邦法官承认,被批评“漏洞百出”的法院命令是工作人员使用人工智能协助起草的 [4] - 这两起案件的裁决在发布前并未经过各自法庭的常规审查程序,两位法官表示已采取措施改进裁决的审查方式 [4] 半导体供应链对汽车行业的影响 - 由于芯片供应形势进一步恶化,德国经济部召开紧急危机会议,安世半导体已连续数天减少或暂停了部分半导体的供货 [5] - 业内人士指出若情况持续恶化,10至20天内整个汽车产业供应链都将受到冲击,芯片短缺可能持续数月,大众汽车已被迫暂停沃尔夫斯堡工厂的生产 [5] - 安世半导体位于中国广东东莞的封测工厂是其规模最大的封装测试工厂,承担了公司全球约70%的封装任务 [5] - 欧洲汽车制造商协会警告,没有安世半导体的芯片,欧洲汽车供应商就无法生产所需零部件,最终可能导致停产 [5]
10.23犀牛财经晚报:权益基金发行又见“日光基” 京东旗下公司已获香港保险经纪牌照
犀牛财经· 2025-10-23 18:25
资产管理行业动态 - 权益基金发行市场显著回暖,9月以来已有16只基金“一日售罄”,华泰柏瑞盈泰稳健混合FOF单日募集金额或超50亿元 [1] - 银行理财市场存续规模达32.13万亿元,同比增长9.42%,理财公司产品规模占比高达91.13% [1] - 北京证监局对北京阳光天泓资产管理有限公司采取责令改正监管措施,因其未按基金合同约定进行信息披露 [3] 科技与互联网行业动态 - 字节跳动Seed团队推出3D生成大模型Seed3D 1.0,实现从单张图像到高质量3D模型的端到端生成 [2] - 京东旗下公司Jingda HK Trading Co., Limited获香港保险经纪牌照,并更名为京东保险顾问(香港)有限公司 [1] - 无人配送企业新石器完成超5亿美元Pre-IPO轮融资,腾讯、高成资本等参与投资 [7] 公司资本运作与融资 - 星河动力启动IPO辅导,拟于科创板或创业板上市,该公司已为27家客户将85颗商业卫星送入轨道 [7] - 信达证券获证监会批复,可向专业投资者公开发行不超过100亿元科技创新公司债券 [7] - 宇树科技完成工商变更,公司名称由“杭州宇树科技股份有限公司”变更为“宇树科技股份有限公司”,正处于IPO辅导期 [5] 公司重大项目与投资 - 精工钢构签约沙特奇迪亚文化艺术中心项目分包合同,金额约12.3亿元,占公司最近一期营业收入的6.7% [8] - 川发龙蟒子公司拟投资3.66亿元建设10万吨/年磷酸二氢锂项目 [9] - 万达出售广州增城万达广场,大连万达商业管理集团退出股东行列,由北京嘉君科技发展有限公司全资持股 [6] 公司股权与经营风险 - 绿地控股集团新增一则被执行人信息,执行标的1.6亿元,该公司现存23条被执行人信息,被执行总金额超56亿元 [3] - 安世半导体(中国)有限公司发布声明,强调其中国实体合法合规独立运营,生产经营正有序推进,以应对荷兰安世半导体现任管理层的质疑 [2] 上市公司三季度业绩 - 高铁电气前三季度净利润3632.95万元,同比增长54.32%,第三季度净利润791.56万元,同比增长242.35% [10] - 华绿生物前三季度净利润1633.35万元,同比增长146.55%,第三季度净利润7002.82万元,同比增长619.37% [11] - 北方导航前三季度净利润1.25亿元,同比扭亏为盈,营业收入24.68亿元,同比增长210.01% [12][13] - 浙江华业前三季度净利润1.81亿元,同比增长143.68%,第三季度净利润1.33亿元,同比大增350.62% [15] - 汇川技术前三季度净利润42.54亿元,同比增长26.84%,营业收入316.63亿元,同比增长24.67% [16] - 移远通信前三季度净利润7.33亿元,同比增长105.65%,营业收入178.77亿元,同比增长34.96% [20] - 洁雅股份前三季度净利润6790.31万元,同比增长95.78%,第三季度净利润3531.94万元,同比大增336.33% [17] - 飞天诚信前三季度净利润1038.13万元,同比增长146.05%,第三季度净利润432万元,同比大增167% [19] - 世纪瑞尔前三季度净利润4163.93万元,同比增长27.23%,但第三季度净利润11.02万元,同比大幅下降99.30% [14] - 宝丽迪前三季度净利润1.06亿元,同比增长31.25% [18] 证券市场表现 - A股市场探底回升,沪指与深成指均上涨0.22%,创业板指上涨0.09%,沪深两市成交额1.64万亿元 [21] - 深圳本地股与煤炭板块领涨,锂矿概念股午后走强,量子科技概念尾盘活跃,工程机械板块走弱 [21]
暴走东京电玩展,Game Show也AI上了
量子位· 2025-09-27 15:00
中国厂商在东京电玩展的展示 - 中国游戏厂商如网易、腾讯、叠纸、鹰角等在东京电玩展设立大型展台吸引大量玩家关注 [8] - AI厂商也在展会上展示技术实力 包括大模型和3D生成等应用 [8][10] - 中国游戏厂商在海外市场的影响力日益显著 游戏工业链条从3D建模到云计算展现出全面实力 [36] 阿里巴巴的大模型展示 - 阿里巴巴展台以通义千问和通义万相两个开源模型为核心展示 [11][12] - 本地化团队面向日本市场提供从IaaS到SaaS的大模型商用化方案 包括Model Studio和AI开发平台PAI [12][13] - 开展2天内已有不少B端客户到展台交流 显示开源影响力超出线上下载量 [15][16] MiniMax的创意展示 - MiniMax在展会现场推出日式算命活动 展示语言模型和音频模型能力 [17] - 通过互动形式展示大模型与游戏结合的潜力 [18] 腾讯云的3D生成技术 - 腾讯云展台强调云计算能力支持游戏安全和运营 但重点提及混元3D技术 [21] - 混元3D已被国内多家游戏厂商应用 不仅用于物品如桌椅板凳 还用于人物3D建模并展现良好效果 [22][24] VAST的3D生成项目 - VAST的Tripo作为开源3D生成项目在日本等海外市场吸引游戏厂商关注 [26] - 参展重要目的是与海外客户增强线下交流 [27] - Meshy AI也参与线上展 展示3D生成技术 [29] AI陪玩应用展示 - 逗逗AI游戏伙伴海外版HakkoAI基于实时VLM技术 能理解游戏画面并提供深度陪伴 支持多款游戏如黑猴、老头环和星露谷物语 [32][33] - 其视觉语言模型LynkSoul VLM v1在游戏场景中表现超越GPT-4o、Claude-4-Sonnet和Gemini-2.5-Flash等顶尖通用模型 [34] 游戏与AI融合趋势 - AI技术在游戏展中展现出越来越多潜力 与游戏融合趋势不断升温 [36] - 中国技术力量在海外输出过程中 为游戏玩家创造更多可能性并带来未来惊喜 [36][37]
3D生成补上物理短板!首个系统性标注物理3D数据集上线,还有一个端到端框架
量子位· 2025-07-23 12:10
3D生成技术突破 - 南洋理工大学-商汤联合研究中心S-Lab与上海人工智能实验室合作推出PhysXNet,首个系统性标注的物理基础3D数据集,填补了现有3D生成方法忽略物理属性建模的空白 [1][2][3] - PhysXNet包含超过26K带注释的3D物体,涵盖物理尺度、材料、可供性、运动学信息和文本描述五大核心维度,并推出扩展版PhysXNet-XL,包含600万个程序化生成的3D对象 [3][11][12] - 团队提出PhysXGen框架,通过预训练3D先验实现从图像到真实3D资产的生成,同步融合物理属性与几何结构 [13][26][29] 现有研究局限性 - 当前3D生成研究集中于几何结构与纹理(如Objaverse、ShapeNet数据集),但缺乏对物理属性的建模,难以满足现实世界对物理推理的需求 [6][7][8] - 物理属性标注存在测量难度高、耗时长的问题,导致相关数据集规模受限 [15][17] 数据集与标注创新 - PhysXNet采用人在回路的标注流程,结合GPT-4o获取基础信息并通过人工审核确保质量,标注内容包括部件级物理属性(如运动范围、材料参数) [16][19][20] - 数据集覆盖从室内小物体到大型室外结构,对象平均含5个部件,物理尺寸差异显著 [21][22][23] 生成模型性能 - PhysXGen在物理属性生成上显著优于基线模型(TRELLIS+PhysPre),在物理尺度、材料、运动学和可供性四个维度分别提升24%、64%、28%和72% [33][38] - 模型通过联合优化实现几何外观逼真度与物理自洽性的双重目标 [30] 行业应用前景 - 该技术将推动3D生成从虚拟向物理真实演进,适用于游戏、机器人技术和具身智能等领域 [6][44] - 团队提出端到端生成范式,包括数据集构建(PhysXNet)和生成框架(PhysXGen),为物理3D建模提供完整解决方案 [39][42]
直击CVPR现场:中国玩家展商面前人从众,腾讯40+篇接收论文亮眼
具身智能之心· 2025-06-18 18:41
CVPR 2025核心趋势 - 多模态和3D生成成为论文接收与研讨的热门方向 其中高斯泼溅技术是论文标题出现频率前五的关键词之一 [8][17] - 基础模型讨论深入并延伸至产业落地 具身智能和机器人AI成为独立Workshop板块 [8] - 中国企业参与度创纪录 腾讯、字节等大公司主导展区 但参与主体仍集中于成熟商业化企业 [4][9][32] 技术研究热点 - 多模态以75次出现频率位列论文标题关键词榜首 扩散模型(153次)、大语言模型(129次)紧随其后 [16] - 3D生成领域突破显著 高斯泼溅技术推动神经渲染研究 腾讯Hunyuan 3D 21版本实现几何与纹理双重优化并全面开源 [17][21][23] - 计算机视觉与图形学加速融合 3D重建相关论文数量激增 国内技术跃迁速度加快 [19][20] 企业参与动态 - 腾讯表现突出:40+篇论文入选 覆盖混元大模型团队(多模态推理/3D生成)、优图实验室(DeepFake检测/自监督生成)等方向 [34] - 中国企业赞助力度加大:6家中国机构进入赞助商名单 腾讯与字节跻身白金赞助商行列 投入规模创历史新高 [36][37] - 人才争夺策略升级:腾讯派出20人技术团队现场交流 通过Demo展示、学术活动直接对接顶尖人才 [38][44] 产业应用延伸 - Workshop议题设计呈现双轮驱动:既深化视觉概念等基础研究 又拓展3D场景理解、数字孪生等产业应用场景 [27][30] - 腾讯形成商业反哺技术闭环:2024年研发开支70686亿元 累计研发投入达3403亿元 专利授权超45万件支撑AI持续投入 [46] - AI商业化成效显现:腾讯AI能力已驱动广告与游戏业务增长 微信生态内新AI应用成为重点投入方向 [50]
直击CVPR现场:中国玩家展商面前人从众,腾讯40+篇接收论文亮眼
量子位· 2025-06-17 15:41
CVPR 2025核心趋势 - 多模态与3D生成成为论文接收热门方向 其中高斯泼溅技术为前五高频关键词之一[6][15] - 基础模型讨论深入并延伸至产业落地 具身智能与机器人AI设立独立Workshop板块[6] - 计算机视觉与图形学加速融合 神经渲染推动3D论文数量显著增长[16][17] 中国企业参与表现 - 腾讯、字节等企业展区规模创纪录 技术Demo体验排队现象突出[3][5] - 腾讯40+篇论文被接收 覆盖混元大模型团队、优图实验室等多方向[32] - 蚂蚁、字节、快手分别有21篇、12篇(含4篇Highlight)、12篇论文入选[32] - 中国企业赞助商占比达6/41 腾讯与字节跻身白金赞助商行列[34] 技术突破与开源进展 - 腾讯Hunyuan 3D 2.1版本实现几何与纹理双重优化 达到开源3D模型SOTA水平[21] - 该模型为全链路开源工业级3D生成大模型 支持消费级显卡适配[23] - 多模态领域高频词包括扩散模型(175次)、大语言模型(129次)、文生图(48次)等[14] 产业应用与人才战略 - Workshop议题新增3D捕获重建、数字孪生等方向 聚焦真实世界建模需求[28] - 腾讯研发投入超706亿元(2024年) 全球专利申请公开总数达8.5万件[44] - 腾讯科技类人才占比73% 青云计划提供无上限薪酬与顶尖科学家资源[51][52] - 企业通过顶会展示技术实力 形成商业反哺技术的良性循环[46][48]