Workflow
Gemma系列模型
icon
搜索文档
腾讯持续推进AI布局,关注AI模型迭代
华安证券· 2025-08-17 20:55
行业评级 - 全球科技行业评级:增持 [1] 核心观点 - 腾讯25Q2业绩超预期,营收同比增长15%至1845亿元,游戏板块收入同比增长22%,国际市场表现亮眼 [3] - 腾讯持续加码AI战略投入,Q2研发投入年增17%至202.5亿元,资本开支年增119%至191.1亿元 [3] - 腾讯混元3D模型快速迭代,发布2.5版本及美术级3D生成大模型,开源3D世界生成模型1.0 [3] - 腾讯音乐25Q2总收入同比增长17.9%至84.4亿元,在线音乐服务收入同比增长26.4%至68.5亿元 [3] - 网易云音乐25Q2实现收入38.271亿元,经调整净利润19.46亿元,DAU/MAU超30%稳定增长 [4] 行业一周要闻 AI领域 - OpenAI考虑为ChatGPT引入广告 [37] - 谷歌开源Gemma 3 270M模型,拥有2.7亿参数,适合端侧部署 [34] - Grok 4基础版向全球用户免费开放,每12小时可发起5次请求 [35] - 苹果iOS 26将集成ChatGPT-5,预计下月全球推送 [4] - 腾讯开源混元3D世界模型1.0 Lite版,降低显存需求 [36] - 腾讯混元发布Hunyuan-GameCraft游戏视频生成框架及52B参数多模态模型Large-Vision [36] - 昆仑万维发布SkyReels-A3模型,支持全模态音频驱动数字人创作 [36] 半导体 - 台积电计划2年内退出6英寸晶圆制造业务 [7] - 鸿海FY25Q2营收1.79兆新台币,AI服务器营收首次超过iPhone业务 [37] - 格芯完成对MIPS的收购,后者将独立运营 [7] 智能驾驶 - 特斯拉奥斯汀Robotaxi服务将于9月向公众开放 [38] - 文远知行获Grab数千万美元投资,合作部署东南亚L4级Robotaxi [39] 电商与消费 - Amazon Haul在澳大利亚上线,主打低价商品以应对Temu等竞争 [9] - 京东Q2新业务收入同比提升198.8%,主要由外卖业务驱动,但运营亏损扩大至148亿元 [10] - 中美暂停24%对等关税90天,保留10%关税 [11] 影视与游戏 - 动画电影《浪浪山小妖怪》14天累计票房8.079亿元,创中国影史二维动画票房纪录 [15] - 腾讯25Q2游戏收入同比增长22%,网易Q2净收入279亿元,同比增长9.4% [16] 行情回顾 - 上证指数周涨1.7%,创业板指涨8.58%,人工智能指数涨11.42% [23] - A股传媒涨幅前三:游族网络(+19.88%)、壹网壹创(+14.36%)、联创股份(+8.93%) [30] - 港股涨幅前三:东方甄选(+39.61%)、阅文集团(+21.57%)、中国有赞(+13.16%) [29] - 美股涨幅前三:冬海集团(+20.1%)、微博(+16.78%)、腾讯音乐(+15.45%) [29]
精准调控大模型生成与推理!浙大&腾讯新方法尝试为其注入“行为定向剂”
量子位· 2025-06-05 18:28
大模型行为控制研究 - 文章核心观点:提出Steering Target Atoms(STA)方法,通过原子级神经元干预实现大模型精准控制,在保持通用智能的同时提升安全性[1][2][4] - 当前技术痛点:传统Prompt工程易被越狱攻击绕过,且安全防御与通用智能存在耦合削弱问题[4] - STA技术原理:分析各层神经元激活模式,针对性抑制有害神经元并保留正常神经元活性[4][5][7] - 方法创新点:将稀疏编码器应用扩展到开放生成任务,通过正向/负向回复的神经元激活差异定位目标原子[7][8] 实验验证 - 测试模型:覆盖Gemma-2-9B-pt、Gemma-2-9B-it和Llama-3.1-8B三大系列[9] - 性能对比: - Gemma-2-9B-pt:STA祛毒效果达83.45分(基准59.97),通用能力保持43.9分[10] - Gemma-2-9B-it:STA祛毒效果97.56分(基准83.89),通用能力49.12分[10] - Llama-3.1-8B:STA祛毒效果72.23分(基准59.08),通用能力33.85分[10] - 技术优势:相比Prompt工程,STA对越狱攻击鲁棒性更强,调控粒度更精细[12][13] 技术扩展应用 - 解决Overthinking问题:在DeepSeek-R1-Distill-Qwen-7B模型验证有效性[14] - 千亿级模型干预:通过nPMI指标定位MoE架构中的认知专家神经元,放大权重提升推理能力[16][17] - 开源资源:发布论文及代码库,涵盖STA方法和DeepSeek-R1干预技术[19]