Workflow
Skywork Deep Research Agent v2
icon
搜索文档
全球AI周报:腾讯财报超预期,AI已成为业务增长的核心驱动力量-20250819
天风证券· 2025-08-19 21:06
行业投资评级 - 持续看好中国AI板块的中长期投资机会 [7] - 建议关注中国AI生态企业及互联网巨头 [7] - 海外AI应用及算力领域建议重点关注高频场景商业化闭环公司及基础设施标的 [7] 核心观点 - AI已成为腾讯业务增长的核心驱动力 财务表现超预期 [4][14][17] - 全球AI技术迭代加速 多模态与视觉推理模型成为竞争焦点 [4][29][34][39] - 算力需求持续高景气 云厂商及基础设施供应商资本开支上调 [4][18][22][26] 财报AI进展 腾讯 - FY25Q2营业收入1845亿元(同比+14.5%) 毛利润1050亿元(同比+22.3%) 每股收益6.8元均超预期 [4][14] - 增值服务收入914亿元(同比+16%) 其中游戏收入592亿元(同比+22%) 云服务国际收入增幅显著 [14] - 混元3D模型登顶Hugging Face排名 资本支出179亿元(同比+149%) 重点投入GPU与服务器 [4][17] Coreweave - FY25Q2营收12.1亿美元(同比+207%) 剩余履约义务301亿美元(同比+86%) [18] - 上调2025年营收指引至51.5-53.5亿美元 资本支出计划200-230亿美元 [22][26] - 完成Weights&Biases收购 新增1600客户 拟收购Core Scientific扩展数据中心容量 [26] 全球AI动态 技术突破 - 智谱GLM-4.5V模型总参数106B 在41项视觉多模态评测中达SOTA 推理速度60-80 tokens/s [29][33] - 腾讯混元Large-Vision采用MoE架构 激活参数52B 支持任意分辨率输入 LMArena Vision全球第五 [34][35] - 昆仑万维Skywork智能体并行思考模式使搜索正确率提升至38.7% GAIA Test基准达SOTA [39][44] 商业化进展 - 微信AI优化用户体验与商户服务 游戏AI提升内容制作效率与营销精准度 [7][17] - 海外AI应用公司Duolingo/Palantir/AppLovin财报超预期 显示AI驱动营收能力增强 [7] - GPT-5等大模型发布推动算力需求 微软/谷歌/Meta上调全年资本开支指引 [7] 重点公司业绩 - 腾讯连续五季度营收增长 25Q2毛利率回升至52% [11][13] - Coreweave 25Q2毛利率达60% 预计25Q3营收12.6-13亿美元 [20][21] - 昆仑万维智能体技术实现行业突破 并行推理框架提升任务处理能力 [39][44]
港股周报(2025.08.11-2025.08.15):龙头公司财报陆续发布,继续看好港股中概AI方向机会-20250818
天风证券· 2025-08-18 21:56
行业投资评级 - 继续看好港股中概AI方向 [1] 核心观点 - 南向资金持续流入港股市场,本周港股通净买入350.72亿元,年初至今净买入8745.76亿元,相当于2024年全年净买入的117.6% [1] - 南向资金重点加仓盈富基金、小米集团、阿里巴巴 [1] - 持续看好中国AI价值重估行情,建议关注平台型互联网公司和具备模型或应用能力的AI生态企业 [2] AI行业动态 - 智谱发布全球100B级效果最佳的开源视觉推理模型GLM-4.5V(总参数106B,激活参数12B) [2] - 腾讯发布多模态理解模型混元Large-Vision,采用MoE架构,激活参数52B [2] - 昆仑万维发布Skywork Deep Research Agent v2,整合多模态检索、理解和生成能力 [2] 互联网行业 - 腾讯集团Q2营收1845亿元,同比增长15%,经营利润(Non-IFRS)692亿元,同比增长18% [2][8] - 京东集团Q2收入3567亿元,同比增长22.4%,净利润62亿元 [2][9] - 快手Q2业绩符合预期,可灵持续贡献收入增量 [2] - 阿里巴巴Qwen3模型持续迭代,云业务预期高增,电商市场份额企稳 [2] - 美团外卖业务壁垒稳固,即时零售有望成为第二成长曲线 [2] 新消费行业 - 泡泡玛特核心IP全球化加速,海外规模效应显著提升盈利能力 [3] - 泡泡玛特泰国旗舰店落户曼谷暹罗天地,总面积超760平方米 [3] - Q4海外传统旺季有望驱动泡泡玛特海外高速增长 [3] 智能驾驶行业 - 特斯拉扩展奥斯汀Robotaxi服务区域,覆盖约85平方英里 [4] - 小鹏与德国大众合作拓宽至燃油和混动平台 [4] - 主流主机厂标配激光雷达趋势确定,看好头部主机厂、激光雷达和芯片提供商 [4] - 小鹏汽车新品周期顺应小米新品周期,承接溢出流量 [4] - 理想汽车纯电i8发布,短期关注订单增长 [4] 港股市场数据 - 恒生指数、恒生国企指数、恒生港股通指数近期走势显示市场活跃 [13][15][17] - 南向资金本周净流入前10个股包括盈富基金、小米集团、阿里巴巴等 [24] - 中美科技公司估值对比显示阿里巴巴、腾讯等港股公司估值低于美股对标标的 [20]
一周六连发!昆仑万维将多模态AI卷到了新高度
量子位· 2025-08-17 17:00
技术发布概览 - 一周内连续发布六款多模态AI模型,覆盖视频生成、世界模型、统一多模态、智能体及AI音乐创作等核心场景 [2][3] - 绝大部分模型已开源,包括音频驱动视频生成模型SkyReels-A3、交互世界模型Matrix-Game 2.0、3D场景生成模型Matrix-3D等 [3][19][25] - 技术周前公司入选"中国AI开源16强",与腾讯、阿里等并列 [5] 核心模型与技术突破 视频生成领域 - **SkyReels-A3**:支持音频驱动人像视频生成,预设8种运镜参数,可生成60秒单分镜视频,唇形同步指标Sync-C达8.66,超越OmniHuman(8.15)和Hydra(7.70) [8][10][12][14] - 技术原理:基于DiT视频扩散模型+插帧延展+强化学习动作优化,支持文本提示词输入画面变化及商品交互 [14][15] 世界模型领域 - **Matrix-Game 2.0**:国内首个对标谷歌Genie 3的开源模型,支持25 FPS实时生成分钟级交互视频,数据管线基于Unreal Engine和GTA 5构建1350小时高质量交互视频 [19][20][22][24] - **Matrix-3D**:单图像生成全景视频并还原三维空间,对标李飞飞World Labs,适用于游戏引擎、元宇宙等领域 [25][27] 统一多模态领域 - **Skywork UniPic 2.0**:2B参数模型在图像生成/编辑任务中超越7B的BAGEL和12B的Flux-Kontext,联合训练后模型UniPic2-Metaquery刷新多项SOTA [29][31][33] - 训练策略:采用渐进式双任务强化策略优化SD3.5-Medium架构,降低硬件门槛 [30][31] 智能体领域 - **Skywork Deep Research Agent v2**:多模态深度调研智能体整合图片检索与生成,自动插入图文混合文档;浏览器智能体支持社媒多模态分析(如小红书、Instagram) [37][38][44] - 技术手段:端到端强化学习(GRPO算法)、并行推理机制、多智能体协同框架 [48][49][50][51] AI音乐与语音 - **Mureka V7.5**:中文音乐生成模型在音色、情感表现上超越Suno v4.5,优化ASR技术提升人声真实度 [53][54][57] - **MoE-TTS**:基于MoE的语音合成框架,通过自然语言描述精准控制声音特征,域外描述贴合度领先闭源产品 [60][61] 战略与行业布局 - **战略定力**:2023年确立"All in AGI与AIGC"战略,2024年研发费用15.4亿元(同比+59.5%),研发团队占比73.41% [66][67][73] - **垂直领域聚焦**:CEO方汉强调垂直Agent与高频应用场景的价值,如数字人直播(国内市场规模近十万亿)、游戏引擎、具身智能等 [70][76] - **开源生态**:通过开源建立技术话语权,推动"技术-社区-应用"正向循环,强化行业地位 [78]
人工智能龙头“开花结果”:昆仑万维发布多款前沿模型,厚积薄发迎商业收获期
每日经济新闻· 2025-08-15 20:45
技术与商业同步跃升 - 公司正处于AI技术与商业同步发展的关键窗口期 在全球AI产业竞争加速背景下 [1] - 通过SkyWork AI技术发布周集中推出六款覆盖多模态AI核心场景的前沿模型 展示高强度研发投入转化为市场竞争力的成果 [1] - 2024年全年研发费用达15.4亿元 同比增长59.5% 重点投入AI算力芯片、大模型及应用等环节 [1][13] Mureka V7.5模型突破 - 模型构建了深度融合文化语境与语言特性的音乐音频理解模块 系统性训练覆盖中文音乐多样性 包括传统民歌、戏曲到当代民谣 [3] - 在音色与演奏技法上实现质的飞跃 通过优化ASR技术提升人声清晰度、结构感和情感真实度 显著降低机械感 [4] - 已形成成熟商业模式 包括C端流媒体平台Melodio和B端创作平台Mureka API 2025年3月年化流水超1200万美元 [3] MoE-TTS框架创新 - 首创基于MOE的角色描述语音合成框架 融合预训练大语言模型文本能力与语音专家模块 实现"知识零损失"的泛化理解能力 [4] - 在双测试集评测中 风格表现力贴合度和整体贴合度等声学控制维度领先 尤其擅长处理比喻、类比等复杂修辞 [6] - 应用潜力覆盖虚拟助手、数字人、有声创作等领域 推动行业从封闭标签式控制迈向自然语言自由控制 [6] 全栈AI技术突破 - SkyReels-A3模型实现音频驱动人像视频生成 基于DiT视频扩散模型+插帧模型+强化学习动作优化技术 [7] - Matrix-Game 2.0世界模型实现25FPS实时长序列交互生成 生成时长扩展至分钟级 为A股唯一对标谷歌Genie的模型 [7][9] - Matrix-3D模型从单图像生成可漫游三维空间 对标WorldLabs效果 短期革新游戏开发、影视制作流程 长期布局元宇宙基础设施 [9] 多模态与智能体技术 - Skywork UniPic 2.0构建理解、生图、编辑一体化能力 已全面开源模型权重与训练代码 降低开发者门槛 [9] - Skywork Deep Research Agent v2整合多模态检索、理解和生成 突破长距离信息收集与异步并行架构 输出视觉友好的深度报告 [10] - 技术迭代源于实际产品需求 具备高应用价值 为产业端提供高效、开放、可落地的AI工具集 [12] 研发战略与商业化闭环 - 公司采用"厚积薄发"策略 2025年一季度研发费用同比增长23.4%至4.3亿元 持续加码AI算力芯片与大模型研发 [13] - 技术突破快速转化为商业化应用 形成研发-落地-收益反哺的正向循环 2024年全球月活用户近4亿 海外收入占比91% [14] - AI社交业务单月最高收入突破100万美元 成为海外增长最快的中国AI应用 构建面向万亿级生态的双轮驱动模式 [14]
腾讯研究院AI速递 20250815
腾讯研究院· 2025-08-15 00:01
美国AI芯片追踪技术 - 美国当局在戴尔和超微等服务器内的英伟达和AMD芯片货运中秘密安装位置追踪装置,主要针对可能非法转运至中国的高风险先进AI芯片 [1] - 追踪器包括智能手机大小的运输箱装置及隐藏于包装或服务器内部的更小型设备,涉及美国商务部工业与安全局、国土安全调查局和联邦调查局等多部门协作 [1] - 白宫和国会提议要求美国芯片公司在芯片中嵌入位置验证技术以加强出口管制 [1] Claude Code Opus规划模式 - Claude Code新增"Opus规划模式",在规划阶段调用Claude 4 1 Opus模型,其他任务使用Claude 4 Sonnet模型以兼顾智能分析与效率 [2] - 该功能通过模型选择器或快捷键Shift+Tab切换,Opus权限用户更新后即可使用,结合Opus 4 1的复杂问题分析能力与Sonnet 4的代码生成经济性 [2] 昆仑万维Skywork Deep Research Agent v2 - Skywork Deep Research Agent v2整合多模态检索、理解和生成能力,解决传统文本检索丢失图像信息的问题 [3] - 多模态深度浏览器智能体支持小红书等内容平台分析,在BrowseComp评测中标准模式正确率27 8%,开启"并行思考"模式后提升至38 7%刷新行业纪录 [3] 腾讯混元Hunyuan-GameCraft - Hunyuan-GameCraft开源工具通过输入图片、文字和动作指令生成高清动态游戏视频,支持第一/第三人称视角及多样场景 [4] - 具备连续动作空间、场景一致性记忆增强和免人工建模三大优势,适用于游戏开发原型、视频创作和3D设计展示 [4] 微软AI Agent五大模式 - 微软发布工具使用、反思、规划、多智能体和ReAct五种Agent设计模式,支持快速开发自动化AI员工 [5][6] - Azure AI Foundry提供1400多条连接器,原生支持A2A、MCP等模式,每个智能体绑定Entra ID确保安全 [6] 月之暗面OpenCUA框架 - OpenCUA框架包含计算机使用演示注释基础设施、覆盖三大系统及200+应用的AgentNet数据集和长思维链推理工作流 [7] - OpenCUA-32B模型在CUA基准测试OSWorld-Verified上成功率34 8%,超越开源模型及OpenAI CUA [7] 苹果AI智能家居产品 - 苹果开发桌面机器人(带7英寸屏和15厘米机械臂)、带屏HomePod和智能安防摄像头三类AI产品,预计2026-2027年推出 [8] - 配套开发主动对话AI Siri(代号Linwood)和"Bubbles"视觉形象,运行"Charismatic"新操作系统 [8] 智元机器人Genie Envisioner - Genie Envisioner平台整合未来帧预测、策略学习与仿真评估,包含GE-Base、GE-Act和GE-Sim三大组件,基于3000小时真机数据训练 [9] - GE-Act仅需1小时遥操作数据即可跨平台迁移,长时序任务表现超越现有SOTA方法 [9] 百川智能医疗大模型 - 百川智能团队精简至200人以内,发布Baichuan-M2医疗大模型,HealthBench评测34分超过OpenAI宣称的32分 [10][11] - 聚焦AI家庭医生方向,预计2026年推出消费者服务,认为医疗AI协作需求将早于无人驾驶落地 [11]