Workflow
混元3D
icon
搜索文档
人工智能周报(25年第27周):Meta全资收购PlayAI,腾讯发布升级版混元3D-PolyGen模型-20250716
国信证券· 2025-07-16 15:56
报告行业投资评级 - 优于大市 [1][4] 报告的核心观点 - 互联网行业一季报业绩整体稳健,电商行业竞争激烈,各平台向商家让利或在外卖即时零售领域找增量,AI巨头业务场景持续受益,但短期AI Agent需打磨,恒生科技指数处于震荡期 [33] 根据相关目录分别进行总结 AI相关网站流量数据 - 展示了AI相关网站周访问量、第一梯队及第二梯队等相关网站周访问量变动情况 [9][11][12] 公司动态 - OpenAI推迟开源模型发布计划,以进行进一步安全测试 [18] - 谷歌24亿拿下Windsurf部分技术与核心团队,但未收购公司及获股权控制权 [20] - Meta全资收购PlayAI,加速布局语音人工智能赛道,PlayAI估值接近1亿美元 [21] - 英伟达市值突破4万亿美元,黄仁勋减持约22.5万股股票,套现约3640万美元 [23] - 腾讯元宝升级搜索功能,可智能匹配图片、视频号并输出文字+视频讲解内容 [24] - 字节跳动旗下飞书发表多款AI产品,并发布AI应用成熟度模型 [26] 底层技术 - 微软推出全新Phi - 4 - mini闪推理小型语言模型,采用SambaY架构,增强隐私保护 [27] - 谷歌Gemini接入Veo3模型,上线图像转视频功能,在部分地区向特定用户开放 [28] - 阿里开源HumanOmniV2多模态推理模型,推动AI解读人类情感与意图应用边界 [29] - 腾讯发布升级版混元3D - PolyGen模型,提升美术师建模效率70%以上 [30] 行业政策 - 上海市发布人工智能产业创新发展行动方案征求意见稿,聚焦重点领域,加强融合,给予财税支持并建立伦理审查机制 [31] - 广东省召开座谈会,推进基础设施建设,实施产业升级工程,加强人才培养并建立风险预警机制 [31] - 北京市发布人工智能产业高质量发展行动计划,建设创新中心,打造产业融合生态,加大金融支持和知识产权保护 [32] 重点事件预告 - 7月15 - 17日2025全球人工智能峰会;7月16 - 18日AI World 2025世界人工智能大会;7月17 - 19日中国人工智能产业发展大会;7月18 - 20日智能未来・2025人工智能与机器人峰会 [35] 投资建议 - 推荐与宏观经济相关性较低的网易云音乐、美图公司、腾讯音乐,以及业绩稳健、估值较低的防守型标的腾讯音乐、网易 [2][33] 重点公司盈利预测及投资评级 - 腾讯控股、网易 - S、美团 - W、百度集团 - SW、快手 - W、阿里巴巴 - SW、网易云音乐、腾讯音乐、美图公司投资评级均为优于大市,并给出了昨收盘、总市值、EPS、PE等数据 [3]
AI系列专题跟踪:视频及图像生成模型
华安证券· 2025-07-15 16:18
报告行业投资评级 - 行业评级为增持 [1] 报告的核心观点 - 生成式AI模型开源闭源并行发展,模型版本持续迭代,AI驱动的创新落地成竞争点 [3] - 生成式AI在影视行业全链路布局,多维度提升影视质量,但算力资源和一致性是主要限制因素 [4] - 生成式AI助力游戏内容生成,赋能游戏内交互场景 [5] - 生成式AI未来在影视领域会在精度、质量和时长三个维度创新迭代 [6] - 国内生成式AI行业各领域厂商均有布局,建议关注相关公司 [9] 根据相关目录分别进行总结 1 AI视频及图像生成模型未来展望 1.1 AI视频图像模型技术发展趋势 - 2024年11月至今,国内外AI视频图像模型不断迭代,分闭源和开源模型,海外和国内已发布多款新版本 [19] - 未来技术发展聚焦3D生成模型、多模态融合、参数性能提升 [20] - 3D生成模型未来或成重要竞争领域,推动多领域3D建模自动化,今年众多厂商发布相关模型 [25] 1.2 AI视频图像模型未来应用场景展望 - 游戏领域,AI陪伴成主流应用场景,如《Whispers from the Star》和《EVE》 [36] - “AI+影视动画”合作成果初现,上海电影和即梦AI发起活动,探索全链条创新应用 [39] - AI图像及视频生成赋能广告营销领域,创意营销引领潮流,如天猫、康师傅等案例 [43] - “AI+设计”探索新质生产力,AI建筑设计、品牌包装设计方兴未艾,如中南建筑设计院和Lovart [48] 2 Runway 2.1 Gen系列模型迭代更新,内容生成技术不断精进 - 2023年2月至2025年4月,Runway发布Gen-1、Gen-2、Gen-3 Alpha、Gen-4和Gen-4 Turbo模型,功能不断提升 [51] 2.2 Gen系列模型应用场景案例及核心技术 - Gen-1依赖文本或参考图像转化视频,Gen-2在其基础上增加多项功能,Gen-3 Alpha提升视频表现,Gen-4维护连贯环境,Gen-4 Turbo优化速度 [56][58][87][90] 2.3 Runway产品价格模式 - C端用户积分订阅制,年度订阅享20%折扣,不同付费计划对生成视频条件有限制 [94] - B端用户根据企业情况提供对应AI解决方案,分自助服务和全方位服务 [94] 3 可灵AI 3.1 可灵AI B端C端同步发展 - 可灵AI经历多次版本迭代,在视频时长、质量、物理规律真实性上优化 [99] - 可灵AI在B端与C端同步发展,C端为用户提供创作生产力,降低成本,带动付费增长;B端与数千家客户合作,提供API接口 [102][103] 3.2 可灵AI商业化模式及运营数据 - 可灵AI采用会员制和资源包付费,2025年5月,Web端全球访问量和APP端下载量有数据体现 [115][120] - ConceptMaster是多主体视频生成技术方案,支持多概念定制视频等功能 [123] 3.3 近期更新 - 4月15日,推出可图2.0和可灵2.0,在语义响应、动态质量、画面美学升级,基于MVL推出多模态编辑功能 [125] - 5月29日,推出可灵2.1系列模型,性价比和生成效率提升,生成质量全面提升 [128] 4 即梦AI 4.1 即梦AI模型版本迭代、核心功能及技术 - 即梦AI多次迭代,各版本有不同核心功能突破,底层技术包括深度学习模型、GAN、VAE [130][131] 4.2 即梦AI模型应用场景、生成效果及同行业产品对比 - 即梦AI领先应用场景包括文本生成图片视频、文本渲染、超现实主义肖像等,与其他模型有效果图对比 [134] 4.3 即梦AI产品价格模式 - 即梦AI采用积分订阅制和直接购买积分制,不同会员等级有不同价格和积分 [156] 5 Midjourney 5.1 Midjourney版本迭代、优化情况及效果图比较 - 2022年2月至2025年4月,Midjourney多个版本迭代,图像质量和功能不断提升 [160] 5.2 Midjourney核心技术及应用场景 - 核心技术为GAN和优化的变换器架构,V7模型有核心亮点,应用场景广泛 [163][164] 5.3 Midjourney产品价格模式 - 采用订阅制收费,不同付费计划在GPU时间、隐身模式等方面有不同服务 [173] 6 Stable Diffusion 6.1 Stable Diffusion版本迭代与变体及核心功能 - 2022年8月发布,多次版本迭代和变体更新,针对不同用户有多层次功能,基于多种核心技术实现 [178][181] 6.2 Stable Diffusion核心技术及应用场景 - 工作流程含CLIP、Diffusion、VAE模型,应用场景包括电商运营、设计等 [184] 6.3 Stable Diffusion产品价格模式 - B端采用API订阅制,C端采用积分订阅制,不同等级有不同价格和权益 [203] 7 豆包 7.1 豆包大模型关键更新迭代、主要功能变化 - 2023年8月至2025年5月,豆包模型层和产品层不断更新迭代,提升多方面能力 [205][207] 7.2 豆包大模型核心技术及应用场景 - 依托深度学习架构,采用Transformer等技术,有九类模型,应用场景广泛 [210] 7.3 豆包视觉理解模型、图片及视频生成模型产品价格模式 - 视觉理解模型按token计费,视频生成模型按token用量付费,图片生成模型按张数付费 [214][216] 8 海艺AI - SeaArt AI 8.1 SeaArt AI版本迭代、核心技术及合作情况 - 2023年6月发布,自研大模型经历三次迭代,与多方合作寻求技术突破 [221] 8.2 SeaArt AI用户分层及应用场景 - 版本迭代实现用户分层,落地页降低上手门槛,ComfyUI服务核心AI用户并筛选高阶用户,在游戏行业有应用优势 [227][231] 8.3 SeaArt AI产品价格模式 - 采用订阅制和算力充值收费两种模式,不同等级有不同价格和权益 [235] 9 LiblibAI 9.1 LiblibAI概况、融资情况及核心功能 - 2023年5月成立,已完成四轮融资,提供多种AI创作方式,构建AI内容创作分享及版权生态链 [241][242] 9.2 LiblibAI x星流Star - 3 Alpha大模型功能及应用场景 - Star - 3 Alpha大模型提供精准细腻图像生成能力,功能特性强大,应用场景广泛 [245][246] 9.3 全球第一款专业设计AI Agent:Lovart - 2025年5月12日发布,功能、技术层面有特点,应用场景包括品牌设计等 [267][271] 9.4 LiblibAI产品价格模式 - B端采用解决方案制和团队版会员订阅计划,C端采用会员订阅制,不同等级有不同价格和权益 [276] 10 美图AI Agent RoboNeo - 美图发布RoboNeo,定位图像设计AI Agent,有主要功能和应用场景,未来有广泛商业应用价值 [279][282][283] 11 投资建议 11.1 影视行业应用 - AI图片/视频生成在影视行业落地,多模态模型有商业化潜力,未来提升方向在精度、质量和时长 [290][291] - 多模态模型更多应用于影视作品,头部影视公司和短视频/短剧相关公司积极布局 [294][298] 11.2 游戏行业应用 - 生成式AI可从多方面进行游戏画面及场景生成,在内容生成和交互层面发挥作用,应用集中在研发降本增效和扩充交互模式 [299][300] 11.3 相关公司 - 腾讯在游戏和视频领域持续布局,赋能内容生成,业绩良好 [301][304] - 阿里巴巴在视频生成领域布局,模型能力强,业绩增长 [305] - 快手可灵大模型迭代,业绩提升,可灵AI营收增长势头强劲 [306] - 还可关注字节豆包大模型、即梦AI,海外Runway、Midjourney和Stable Diffusion [307]
腾讯3D生成模型上新!线稿可变“艺术级”3D模型,鹅厂内部设计师也在用
量子位· 2025-07-08 17:11
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 腾讯混元3D模型,又又又上新了! 这次带来的是艺术级3D生成模型 Hunyuan3D-PolyGen ,支持生成面数上万的复杂几何模型。 而且这个模型可 以把3D模型变成资产 ,鹅厂自己的游戏开发工作室用上之后,美术师建模效率提升了超70%。 有网友表示,AI已经学会了拓扑,自己已经很久没有对AI生成3D感到如此兴奋了。 目前,模型的拓扑功能已在混元3D工作台上线,与其他功能共享每天20次的免费使用额度。 实测"艺术级"3D生成模型 美术级的模型生成和一般的3D建模,区别主要有这几个方面: 面数 :需要满足游戏实时加载与渲染的需求,美术Mesh相对于一般的3D生成Mesh面数更少; 布线质量 :后续还需要进行UV展开、骨骼绑定等环节,需要高效、规整的布线; 组件式结构 :美术师需要对模型进行后期编辑,需要将生成的模型拆分成组件以便后期操作。 模型的入口是混元3D平台 (链接见文末) 的"3D智能拓扑"功能,支持文字生成以及单张或最多四张参考图。 目前,该功能支持以三角形或四边形两种形式对模型进行拓扑。 那么,混元3D的表现如何呢?来看量子位的实测。 第一 ...
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-06-20 21:13
芯片与硬件 - AMD发布MI355X芯片 [2] - 中科院上海光机所研发光计算芯片 [3] - 中科院实现国内首例脑机接口技术 [3] 模型与算法 - 谷歌推出Gemini 2 5正式版模型 [2] - 微软发布三大王炸算法 [2] - 港科大开发MeWM医学模型 [2] - LMArena的DS-R1模型取得新成绩 [2] - MiniMax推出MiniMax-M1模型 [2] - Kimi发布Kimi-Dev模型 [2] - 阿里推出Qwen3量化模型 [2] - 松下发布OmniFlow模型 [2] - OpenAI优化Muon优化器 [2] - 谷歌公布AI路线图 [2] - OpenAI研究AI善恶开关技术 [2] 应用与产品 - Meta与Prada达成AI合作 [2] - 百度推出罗永浩数字人 [2] - MiniMax发布海螺02应用 [2] - 腾讯元宝推出AI编程模式 [2] - 13岁CEO开发FloweAI智能体 [2] - 微软展示AI智能体案例 [2] - GenSpark推出AI浏览器 [2] - MIT开发AI艺术品修复技术 [2] - 小鹏汽车推进自动驾驶VLA技术 [2][3] - OpenAI升级Projects应用 [3] - Dia发布AI原生浏览器 [3] - 腾讯推出混元3D 2 1版本 [3] - 科大讯飞更新4大平台 [3] - 腾讯元宝提供高考志愿咨询 [3] - Midjourney发布V1视频模型 [3] - MiniMax推出Agent产品 [3] - DeepSite升级至V2版本 [3] - Raycast发布AI功能 [3] 观点与趋势 - YC AI创业营提出软件3 0概念 [3] - OpenAI发布10年AI发展预测 [3] - 斯坦福指出AI创业资源错配问题 [3] - Django提出Agent三大威胁观点 [3] - Anthropic强调深度研究细节重要性 [3] - a16z分析AI+社交趋势 [3] - 英伟达关注AI安全问题 [3] - Claude反驳苹果相关观点 [3] - Cursor讨论编程AI替代判断 [3] - 吴恩达提出AI应用工程师概念 [3] - 非营利组织公开OpenAI档案 [3] - YC AI创业营探讨AI技术与创业 [3] 科技与事件 - 星动纪元发布星动Q5产品 [3] - AI行业出现高管离职事件 [3] - 特朗普政府AI计划泄密 [3] - 腾讯举办广告算法大赛 [4]
人工智能周报(25年第24周):Opetai上线o3-pro模型,字节跳动发布豆包大模型1.6-20250619
国信证券· 2025-06-19 20:39
报告行业投资评级 - 行业评级为优于大市 [1][4] - 腾讯控股、网易 - S、美团 - W、百度集团 - SW、快手 - W、阿里巴巴 - SW、拼多多投资评级均为优于大市 [3] 报告的核心观点 - 互联网一季报业绩整体稳健,电商竞争激烈,各平台向商家让利或在外卖即时零售领域加大投入找增量,AI 巨头业务场景受益但短期 AI Agent 需打磨,恒生科技指数处于震荡期,推荐腾讯音乐、网易 [2] 根据相关目录分别进行总结 AI 相关网站流量数据 - 2025 年 6 月 4 日至 10 日,ChatGPT 周平均访问量 1251.00 百万,环比增长 0.24%;Bing 周平均访问量 319.50 百万,环比增长 1.20%等多个 AI 相关应用数据 [10] 人工智能动态 产品应用 - OpenAI 6 月 11 日上线 o3 - pro AI 模型,高效精准但有响应慢等不足 [20] - Meta 6 月 11 日推出世界模型 V - JEPA 2,环境理解与预测能力卓越 [20] - 苹果 6 月 10 日发布 Xcode26 开发者工具,内置 ChatGPT 赋能开发 [21] - 字节跳动 6 月 11 日发布豆包大模型 1.6,采用统一定价模式 [21] - 阿里 6 月 13 日开源 3D 数字人应用,革新直播与虚拟互动体验 [22] - 腾讯 6 月 14 日宣布混元 3D 2.1 全链路开源,几何生成与材质表现提升 [22] 底层技术 - 阿里通义实验室 6 月 10 日开源 MaskSearch 预训练框架,提升 AI 复杂问题解决表现 [23] - DeepMind 与布朗大学合作研发“力提示”技术,6 月 4 日报道可实现无 3D 模型逼真运动效果 [24] 行业政策 - 6 月工信部会议审议相关指导意见,以工业智能体推动制造业全流程智能化升级 [25] 重点事件预告 - 6 月 18 日 - 20 日举办 MWC 上海 2025 [28] - 6 月 19 日 - 20 日举办 2025 亚马逊云科技中国峰会 [28] - 6 月 20 日 - 22 日举办华为开发者大会 HDC 2025 [28] 投资建议 - 推荐业绩稳健、估值较低的防守型标的腾讯音乐、网易 [2]
人工智能周报(25年第24周):OpenAI上线o3-pro模型,字节跳动发布豆包大模型1.6-20250619
国信证券· 2025-06-19 17:33
报告行业投资评级 - 行业评级为优于大市,维持评级 [4] - 腾讯控股、网易 - S、美团 - W、百度集团 - SW、快手 - W、阿里巴巴 - SW、拼多多投资评级均为优于大市 [3] 报告的核心观点 - 互联网一季报业绩整体稳健,电商竞争激烈,各平台向商家让利或在外卖即时零售领域加大投入找增量,AI 巨头业务场景受益但短期 AI Agent 需打磨,恒生科技指数处于震荡期,推荐腾讯音乐、网易 [2][26] 根据相关目录分别进行总结 AI 相关网站流量数据 - 2025 年 6 月 4 日至 10 日,ChatGPT 周平均访问量 1251.00 百万,环比增长 0.24%;Bing 周平均访问量 319.50 百万,环比增长 1.20%等多个应用有不同访问量及环比增长情况 [10] 人工智能动态 产品应用 - OpenAI 6 月 11 日上线 o3 - pro AI 模型,性能高效输出精准,但有响应慢等不足 [20] - Meta 6 月 11 日推出世界模型 V - JEPA 2,环境理解与预测能力卓越 [20] - 苹果 6 月 10 日发布 Xcode26 开发者工具,内置 ChatGPT 赋能开发 [21] - 字节跳动 6 月 11 日发布豆包大模型 1.6,采用统一定价模式 [21] - 阿里 6 月 13 日开源 3D 数字人应用,革新直播与虚拟互动体验 [22] - 腾讯 6 月 14 日宣布混元 3D 2.1 全链路开源,几何生成与材质表现提升 [22] 底层技术 - 阿里通义实验室 6 月 10 日开源 MaskSearch 预训练框架,提升 AI 复杂问题解决表现 [23][24] - DeepMind 与布朗大学 6 月 4 日报道合作开发“力提示”技术,实现无 3D 模型逼真运动效果 [24] 行业政策 - 6 月工信部会议审议相关指导意见,以工业智能体推动制造业全流程智能化升级,提出多项具体措施 [25] 重点事件预告 - 6 月 18 日 - 20 日举办 MWC 上海 2025 [28] - 6 月 19 日 - 20 日举办 2025 亚马逊云科技中国峰会 [28] - 6 月 20 日 - 22 日举办华为开发者大会 HDC 2025 [28] 投资建议 - 推荐业绩稳健、估值较低的防守型标的腾讯音乐、网易 [2][26]
海外周报:曹操出行通过港交所上市聆讯,广州提振消费专项行动方案征求意见-20250615
华西证券· 2025-06-15 22:58
核心观点 - 曹操出行通过港交所上市聆讯,李书福离拥有第十家上市公司更近一步,公司业务增长但面临风险 [2][9] - 广州发布提振消费专项行动方案征求意见稿,全方位激活消费市场 [3][10] - 腾讯混元 3D 2.1 大模型全链路开源,在 3D 生成方面有提升 [4][16] - 投资建议为积极拥抱互联网&科技及新兴消费两条主线,给出相关受益标的 [6] 周观点 曹操出行通过港交所上市聆讯 - 6 月 10 日曹操出行通过聆讯并披露招股书,Ugo Investment Limited 持股 83.9%,由李书福全资持有 [2][9] - 截至 2025 年 3 月 31 日,在 146 个城市经营,一季度 GTV 48 亿元同比增 54.9%,订单量 1.644 亿单同比增 51.8%,亏损收窄但有风险 [2][9] 广州提振消费专项行动方案征求意见 - 《方案》围绕八大领域提出 33 项举措,打造“羊城消费新八景”,推动市内免税店开业等 [3][10] - 稳定和扩大就业,举办招聘会等,落实最低工资标准 2500 元/月 [11] - 减轻居民后顾之忧,落实育儿补贴等,增加教育供给 [11] - 加力扩围消费品以旧换新,支持个人装修改造 [11] - 服务消费亮点多,擦亮“食在广州”招牌,聚焦体育消费等 [12][14] 腾讯混元 3D 2.1 大模型全链路开源 - 在 CVPR 2025 上全链路开源,开发者可调用、了解训练等并二次训练 [4][16] - 模型在 3D 生成纹理质感和光影表现提升,更实用 [6][16] 市场回顾 港股走势 - 本周恒生指数涨 0.42%,恒生科技指数跌 0.89%,恒生中国企业指数涨 0.30% [18] - 12 个恒生行业指数中,非必需性消费业和必需性消费业排名靠后 [19] - 港股通涨幅前五有绿叶制药等,跌幅前五有中庆股份等 [22] 中概股走势 - 本周主要美股&中概股指数多数下跌,纳斯达克中国金龙指数跌 0.77% [26] - 10 个 wind 中资股行业指数中,中资股能源涨幅最大,公用事业跌幅最大 [27] - 中概股涨幅前五有城道通环保等,跌幅前五有森淼科技等 [31] 公司公告和新闻资讯 餐饮 - 星巴克计划出售中国部分业务,潜在买家探讨增门店至 2 万间 [35] - 满记甜品启动全球合伙计划,拓展市场 [35] 旅游 - 北京东城区文旅局推出 3 条世界遗产文化探访线路 [36] - 沈阳发布文物普查成果,新发现 230 余处不可移动文物 [37] 酒店 - Holidu 获 4600 万欧元融资,收购 Cybevasion,拓展业务 [38][41] 人服 - 三十个城市试点人力资源服务业与制造业融合发展,探索创新 [43] 科技&互联网 - 曹操出行通过港交所上市聆讯,业务增长有风险 [46][47] - 腾讯混元 3D 2.1 大模型全链路开源,多方面升级 [47][49]
哪吒汽车正式进入破产重整程序|首席资讯日报
首席商业评论· 2025-06-15 12:00
老凤祥与字节合作AI眼镜 - 老凤祥将在"老博会"推出AI眼镜,产品目前处于检测、测试及完善阶段,尚未取得销售许可证,预计9月后上市销售 [1] - 该AI眼镜镜框由老凤祥提供,其余部件通过采购集成,可与老凤祥眼镜APP连接,后台接入豆包大模型 [1] - 目前老凤祥与字节仅签署了业务合作协议 [1] 哪吒汽车破产重整 - 哪吒汽车关联公司合众新能源汽车股份有限公司破产审查案件新增管理人机构浙江子城律师事务所 [2] - 公司正式进入破产重整程序 [2] 日本制铁收购美国钢铁公司 - 美国总统特朗普批准日本制铁公司以149亿美元收购美国钢铁公司的交易 [3] - 交易需满足国家安全相关协议,包括到2028年前投资110亿美元的计划,涵盖治理结构、产能保障及贸易承诺 [3] 中国航司恢复接收波音787 - 吉祥航空接收一架全新787-9飞机,标志着波音时隔多时首次在美国本土向中国航司交付飞机 [4] - 此前中国航司因中美关税贸易战暂停接收波音飞机 [4] 北大清华回应校内湖水售卖 - 北大、清华表示校内河湖水是维系生态系统的宝贵资源,不应成为非法牟利商品,已联系平台下架相关商品 [5] - 法律专家指出商家宣传"提神醒脑"等卖点涉嫌虚假宣传 [5] 腾讯开源混元3D2.1大模型 - 腾讯在CVPR2025上宣布开源混元3D2.1大模型 [6] - 该模型在Hugging Face平台下载量已超过180万 [6] 茅台集团发展战略 - 茅台集团召开发展战略务虚会,为破解发展难题、推动可持续发展提供智慧支撑 [7] - 下一步将系统整合意见,科学推进"十五五"战略规划编制工作 [7] 特朗普加密货币收入 - 特朗普通过家族关联加密货币企业World Liberty Financial获得5735万美元收入 [8] - 该收入是其去年最大收入来源之一 [8] 中国脑机接口技术突破 - 中国成功开展首例侵入式脑机接口临床试验,成为全球第二个进入该技术临床试验阶段的国家 [9] 中国工业机器人出口增长 - 前5个月中国工业机器人出口货值同比增长55.4% [10] - 出口产品呈现智能化、高端化、定制化趋势,品牌影响力提升,新兴市场增量明显 [10] 英伟达CEO回应任正非讲话 - 黄仁勋表示虽然英伟达技术领先一代,但中国可通过使用更多芯片弥补性能差距 [11][12] - 任正非此前表示用叠加和集群方法可使计算结果与最先进水平相当 [11] AMD发布AI芯片新品 - AMD推出旗舰数据中心AI芯片、AI软件栈等产品,展现与英伟达竞争实力 [13] - 摩根士丹利认为明年推出的MI400/450产品可能带来更大影响 [13]
波士顿动力机器狗参加《美国达人秀》,大秀劲歌热舞获全票晋级;腾讯开源混元3D 2.1大模型丨AIGC日报
创业邦· 2025-06-15 08:48
腾讯开源混元3D 2.1大模型 - 腾讯在CVPR2025上宣布混元3D 2.1大模型对外开源 [1] - 混元3D模型在Hugging Face下载量已超过180万 [1] 德国政府与英伟达合作AI基础设施 - 德国政府与英伟达CEO黄仁勋讨论建立自主人工智能基础设施 [2] - 合作将推动德国人工智能生态系统发展 [2] - 英伟达将参与投资建设面向德国工业需求的AI基础设施 [2] 波士顿动力机器狗表演 - 波士顿动力五台Spot四足机器人在《美国达人秀》表演舞蹈 [3] - 机器狗伴随皇后乐队歌曲《Don't Stop Me Now》完成精心编排舞蹈 [3] - 表演使用自研Choreographer软件和动画工具实现流畅动作和情绪表达 [3] - 评委全票通过晋级下一轮 [3] 中国侵入式脑机接口临床试验 - 中国科学院联合医院和企业成功开展首例侵入式脑机接口临床试验 [4] - 中国成为全球第二个进入该技术临床试验阶段的国家 [4] AIGC产业资讯服务 - 提供AIGC产业日报订阅服务 [2][3] - 会员服务可解锁人形机器人、商业航天、AGI等热门赛道行业图谱和报告 [2][3]
腾讯开源混元3D 2.1大模型 开发门槛大大降低
广州日报· 2025-06-14 22:17
腾讯混元3D 2.1大模型升级 - 公司发布混元3D 2.1大模型 为首个全链路开源的工业级3D生成大模型 达到行业领先水平 [2] - 混元3D模型在Hugging Face下载量已超过180万 [2] - 新模型生成的3D首饰盒纹理清晰 质感细腻 光影保持一致性 [2] 模型应用场景 - 模型可用于生成游戏角色 电影道具 线上商城产品模型等3D内容 [4] 技术升级亮点 - 相较于混元3D 2.0模型 新模型优化了几何生成质量 [6] - 开放了PBR材质生成大模型 提升3D资产质感和光影表现 告别"塑料感" [6] - PBR技术模拟光线与材质物理交互 提升模型在不同光照环境下的视觉一致性 [8] - 用户盲测显示 混元3D 2.1模型的PBR纹理质感胜出率高达78% [8] 开发者友好特性 - 模型实现全链路开源 包括模型权重 训练代码和数据处理流程 [8] - 开发者可自由进行微调 二次训练或优化 满足定制化需求 [8] - 模型适配消费级显卡 可在个人电脑运行 [8] 模型技术细节 - 优化细节建模 提高网格精度 具备更好的拓扑一致性 [8] - 可生成基础颜色 金属度 法线 粗糙度等贴图 [8] - 支持皮革 木质 金属 陶瓷等多种复杂材质的高质量渲染 [8]