Gemma系列模型 - 财报，业绩电话会，研报，新闻

Gemma系列模型

搜索文档

华安证券· 2025-08-17 20:55

行业评级 - 全球科技行业评级：增持 [1] 核心观点 - 腾讯25Q2业绩超预期，营收同比增长15%至1845亿元，游戏板块收入同比增长22%，国际市场表现亮眼 [3] - 腾讯持续加码AI战略投入，Q2研发投入年增17%至202.5亿元，资本开支年增119%至191.1亿元 [3] - 腾讯混元3D模型快速迭代，发布2.5版本及美术级3D生成大模型，开源3D世界生成模型1.0 [3] - 腾讯音乐25Q2总收入同比增长17.9%至84.4亿元，在线音乐服务收入同比增长26.4%至68.5亿元 [3] - 网易云音乐25Q2实现收入38.271亿元，经调整净利润19.46亿元，DAU/MAU超30%稳定增长 [4] 行业一周要闻 AI领域 - OpenAI考虑为ChatGPT引入广告 [37] - 谷歌开源Gemma 3 270M模型，拥有2.7亿参数，适合端侧部署 [34] - Grok 4基础版向全球用户免费开放，每12小时可发起5次请求 [35] - 苹果iOS 26将集成ChatGPT-5，预计下月全球推送 [4] - 腾讯开源混元3D世界模型1.0 Lite版，降低显存需求 [36] - 腾讯混元发布Hunyuan-GameCraft游戏视频生成框架及52B参数多模态模型Large-Vision [36] - 昆仑万维发布SkyReels-A3模型，支持全模态音频驱动数字人创作 [36] 半导体 - 台积电计划2年内退出6英寸晶圆制造业务 [7] - 鸿海FY25Q2营收1.79兆新台币，AI服务器营收首次超过iPhone业务 [37] - 格芯完成对MIPS的收购，后者将独立运营 [7] 智能驾驶 - 特斯拉奥斯汀Robotaxi服务将于9月向公众开放 [38] - 文远知行获Grab数千万美元投资，合作部署东南亚L4级Robotaxi [39] 电商与消费 - Amazon Haul在澳大利亚上线，主打低价商品以应对Temu等竞争 [9] - 京东Q2新业务收入同比提升198.8%，主要由外卖业务驱动，但运营亏损扩大至148亿元 [10] - 中美暂停24%对等关税90天，保留10%关税 [11] 影视与游戏 - 动画电影《浪浪山小妖怪》14天累计票房8.079亿元，创中国影史二维动画票房纪录 [15] - 腾讯25Q2游戏收入同比增长22%，网易Q2净收入279亿元，同比增长9.4% [16] 行情回顾 - 上证指数周涨1.7%，创业板指涨8.58%，人工智能指数涨11.42% [23] - A股传媒涨幅前三：游族网络(+19.88%)、壹网壹创(+14.36%)、联创股份(+8.93%) [30] - 港股涨幅前三：东方甄选(+39.61%)、阅文集团(+21.57%)、中国有赞(+13.16%) [29] - 美股涨幅前三：冬海集团(+20.1%)、微博(+16.78%)、腾讯音乐(+15.45%) [29]

精准调控大模型生成与推理！浙大&腾讯新方法尝试为其注入“行为定向剂”

量子位· 2025-06-05 18:28

大模型行为控制研究 - 文章核心观点：提出Steering Target Atoms（STA）方法，通过原子级神经元干预实现大模型精准控制，在保持通用智能的同时提升安全性[1][2][4] - 当前技术痛点：传统Prompt工程易被越狱攻击绕过，且安全防御与通用智能存在耦合削弱问题[4] - STA技术原理：分析各层神经元激活模式，针对性抑制有害神经元并保留正常神经元活性[4][5][7] - 方法创新点：将稀疏编码器应用扩展到开放生成任务，通过正向/负向回复的神经元激活差异定位目标原子[7][8] 实验验证 - 测试模型：覆盖Gemma-2-9B-pt、Gemma-2-9B-it和Llama-3.1-8B三大系列[9] - 性能对比： - Gemma-2-9B-pt：STA祛毒效果达83.45分（基准59.97），通用能力保持43.9分[10] - Gemma-2-9B-it：STA祛毒效果97.56分（基准83.89），通用能力49.12分[10] - Llama-3.1-8B：STA祛毒效果72.23分（基准59.08），通用能力33.85分[10] - 技术优势：相比Prompt工程，STA对越狱攻击鲁棒性更强，调控粒度更精细[12][13] 技术扩展应用 - 解决Overthinking问题：在DeepSeek-R1-Distill-Qwen-7B模型验证有效性[14] - 千亿级模型干预：通过nPMI指标定位MoE架构中的认知专家神经元，放大权重提升推理能力[16][17] - 开源资源：发布论文及代码库，涵盖STA方法和DeepSeek-R1干预技术[19]