Workflow
混元Voyager
icon
搜索文档
互联网行业 2025 年 10 月投资策略:港美股巨头估值差异快速收敛,国内巨头加码投入 AI
国信证券· 2025-09-30 19:32
核心观点 - 港股互联网巨头估值与海外差异快速收敛,当前腾讯与Meta、阿里与谷歌的估值已回到类似水平 [2] - 国内互联网巨头正式进入加码AI投入阶段,类似于海外巨头在2023年中旬的资本开支扩张,该阶段股价主要受AI投入力度及技术边际进展驱动 [2] - 报告推荐AI投入最坚决的阿里巴巴、腾讯控股和快手公司 [2][64] 行情回顾 - 9月恒生科技指数上涨9.2%,同期纳斯达克指数上涨4.8% [11] - 港股方面,百度集团、阿里巴巴、阿里健康单月涨幅分别为44.4%、43.9%、13.7%,跑赢恒生科技指数35.2、34.7、4.5个百分点 [14] - 美股方面,谷歌、哔哩哔哩、贝壳单月涨幅分别为15.9%、12.2%、10.6%,跑赢纳斯达克指数11.1、7.4、5.8个百分点 [14] - 截至2025年9月29日,恒生科技指数PE-TTM为23.69倍,处于其成立以来33.09%分位点 [16] 人工智能动态 - 谷歌发布Nano Banana Prompt模板,其图像生成模型定价为每百万输出token 30美元,单图成本约0.039美元,低于OpenAI同类产品定价 [19];推出AP2支付协议 [20];并将Gemini添加到Chrome浏览器 [21] - OpenAI向免费用户开放ChatGPT Projects功能 [22];宣布将在美国新建五个数据中心,未来三年总投资预计超过4000亿美元,算力规模目标扩展至10吉瓦 [23] - Meta发布具备沙箱推演能力的代码世界模型CWM [25];并推出AI视频生成平台Vibes [25] - 微软发布GPT-realtime语音模型,价格较预览版下调20% [26];推出Copilot Audio音频模式 [26] - 腾讯开源3D世界模型混元Voyager [31];用户每天向腾讯元宝的提问量已达年初一个月的总量 [32];推出专业级AI 3D工作台混元3D Studio [33] - 阿里发布下一代基础模型架构Qwen3-Next,其800亿参数模型的训练成本仅为Qwen3-32B的十分之一不到 [35];开源动作生成模型Wan2.2-Animate [36] - 高德AI出行智能体“小高老师”月活跃用户数突破4亿,单日调用量达12亿次 [42] 行业政策 - 《人工智能生成合成内容标识办法》及配套强制性国家标准于9月1日正式生效,对AI生成内容实施全链条管理 [43] - 广东省印发行动方案,支持AI融合机器人开辟陪伴玩具新市场 [44] - 四川省提出到2027年全省算力总规模达到40EFLOPS,智能算力占比不低于60% [45] 行业动态 - 游戏:9月国产网络游戏版号下发145款,米哈游《崩坏:因缘精灵》、腾讯《归环》等游戏获批 [47];2025年8月国内游戏市场收入为292.63亿元,同比下降13.01% [46] - 金融科技:8月支付机构备付金达25010亿元,同比增长6% [48];跨境二维码统一网关于7月底上线试运行 [50] - 短视频:国家版权局约谈15家重点短视频平台,将重点打击侵权盗版行为 [51];主要平台集中下架数百部违规微短剧 [51] - 电商:抖音电商过去一年货架场GMV同比增长49% [56];超过511万名新电商作者和536万新商家通过平台获得收入 [56];天猫旗舰店接入闪购,首批超260个品牌参与 [55] - 本地生活:淘宝闪购上线到店团购业务,首批覆盖上海、深圳、嘉兴 [59];美团旗下国际外卖品牌Keeta在40天内开拓卡塔尔、科威特、阿联酋三个中东市场 [60][61];高德地图上线“高德扫街榜”并启动补贴计划 [63] 盈利预测与投资建议 - 重点推荐公司包括腾讯控股、阿里巴巴-SW、快手-W等,均给予“优于大市”评级 [4] - 国内巨头加码AI投入的阶段特征为短期利润或受影响,但股价由AI投入力度及技术进展驱动 [64]
世界模型,腾讯混元卷到了榜首
量子位· 2025-09-03 15:30
腾讯混元世界模型Voyager发布 - 腾讯混元发布业界首个支持原生3D重建的超长漫游世界模型HunyuanWorld-Voyager 该模型支持将视频直接导出为3D格式 并能够生成长距离且世界一致的漫游场景 [1][3][4] - 模型在发布后立即开源 距离上一代Lite版发布仅间隔两周 展现出快速迭代能力 [3] 核心功能与技术特性 - 新增"漫游场景"功能 支持通过鼠标和键盘在场景内自由活动 交互性远超360°全景图 用户可通过一句话或一张图生成高质量3D场景 [10][11][13] - 创新性将场景深度预测引入视频生成过程 通过空间与特征结合支持原生3D记忆和场景重建 避免传统后处理的延迟和精度损失 [31] - 采用视频生成与3D建模融合技术 基于相机可控的视频生成技术合成可自由控制视角的RGB-D视频 [32] - 关键组件包括世界一致的视频扩散架构和长距离世界探索机制 后者通过世界缓存机制支持迭代式场景扩展和平滑视频采样 [33] 数据集与训练体系 - 构建超过10万个视频片段的大规模数据集 整合真实世界采集与虚幻引擎渲染资源 通过自动化视频重建流水线实现无需人工标注的大规模数据构建 [33][34] - 训练数据构建引擎可自动估计相机位姿和度量深度 支持多样化训练数据的自动化生成 [33] 性能表现与基准测试 - 在斯坦福大学WorldScore基准测试中以77.62分位居综合能力首位 显著超越WonderWorld(72.69分)和WonderJourney(63.75分)等竞争对手 [36] - 在相机运动控制(85.95分)和风格一致性(84.89分)等细分指标表现突出 较第二名优势明显 [36] - 视频生成质量指标PSNR达18.751 SSIM达0.715 LPIPS为0.277 均优于See3D和FlexWorld等对比模型 [39] - 在场景重建任务中PSNR达18.035 SSIM达0.714 使用深度信息初始化点云后重建效果更佳 [42][43] 技术应用与扩展能力 - 支持视频场景重建 3D物体纹理生成 视频风格定制化生成和视频深度估计等多种3D理解与生成应用 [27] - 与混元世界模型1.0高度适配 可扩展1.0模型的漫游范围并提升复杂场景生成质量 [24] - 生成视频帧实时更新缓存形成闭环系统 支持任意相机轨迹同时维持几何一致性 [35] 模型部署要求 - 模型运行需要60GB GPU峰值内存 支持540p分辨率输出 [47] 腾讯开源生态布局 - 腾讯混元持续加速开源进程 产品矩阵包括MoE架构模型混元large 混合推理模型Hunyuan-A13B以及最小仅0.5B参数的端侧小模型 [48] - 最新开源翻译模型Hunyuan-MT-7B在国际机器翻译比赛中获得30个第一名 同时发布翻译集成模型Hunyuan-MT-Chimera-7B [48] 行业开源动态 - 阿里开源视频生成模型Wan2.2-S2V 美团发布首个开源大模型Longcat-Flash-Chat 显示国内大厂持续加码开源布局 [49][50][51]
腾讯混元发布Voyager 3D世界模型
每日经济新闻· 2025-09-02 16:45
公司产品发布 - 腾讯混元发布业界首个支持原生3D重建的超长漫游世界模型HunyuanWorld-Voyager(混元Voyager)[2] - 模型聚焦AI在空间智能领域的应用扩展[2] - 为虚拟现实、物理仿真、游戏开发等领域提供高保真3D场景漫游能力[2] 行业技术突破 - 混元Voyager是业界首个支持原生3D重建的超长漫游世界模型[2] - 模型将推动虚拟现实、物理仿真、游戏开发等领域的技术发展[2]