Workflow
Gemma 3 270M
icon
搜索文档
新力量NewForce总第4843期
第一上海证券· 2025-08-22 16:02
报告行业投资评级 - 报告覆盖多个行业,包括TMT、零售消费、博彩、软件及互联网、硬件及半导体、地产及物业、金融、公用事业、商品原材料、工业制造和基建、医药等,对多数公司给予"买入"评级 [15][17] 报告核心观点 - AI大模型行业处于高速发展和竞争加剧阶段,主要公司通过业务重组、基础设施投入、模型性能升级和战略合作等方式提升竞争力 [5][6][7][8][11][12][13] - 多模态能力、长上下文处理、能效优化和本地化部署成为技术迭代的关键方向 [6][8][13] - 行业聚焦降低推理成本、加速响应速度及保障隐私安全,以推动商业化落地 [8][10][12] AI大模型行业动态 - **Meta Platforms业务重组**:计划将AI业务拆分为四个独立部门(TBD Lab、产品AI部门、AI基础设施部门、安全与伦理AI部门),以提升创新效率和产品集成能力 [5] - **OpenAI基础设施投入**:拟投入数万亿美元用于AI基础设施建设,并设计新型金融工具支持资金需求 [6] - **Claude技术升级**:通过API将Claude Sonnet 4的上下文窗口扩展到100万个Token(支持75万单词请求),为之前限制的5倍和GPT-5的2倍多 [6] - **DeepSeek模型发布**:DeepSeek R2预计于2025年8月15日至30日发布,重点提升多模态能力和复杂任务处理稳定性 [7] - **谷歌模型发布**:推出Gemma 3 270M参数模型,专为任务特定微调设计,INT4量化模型在Pixel 9 Pro上进行25次对话仅消耗0.75%电池 [8][10] - **Perplexity合作**:与Truth Social合作推出Truth Search AI,提供直接答案和透明引用来源,主要引用保守派媒体 [11] - **阿里云免费服务**:Qwen 3 Code每天提供2,000次免费AI编码请求(中国大陆用户),无Token限制 [12] - **Mistral性能升级**:发布Medium 3.1模型,提升代码生成、STEM推理和跨领域问答能力,并引入多模态处理及语调适配层 [13] 公司估值与评级 - **零售消费行业**:李宁(目标价18.93港元)、安踏(目标价113.28港元)、特步(目标价7.36港元)等均获"买入"评级 [15] - **科技与互联网**:腾讯(目标价725港元)、美团(目标价230港元)、小米(目标价67.9港元)等市值超万亿港元,均获"买入"评级 [15][17] - **半导体与硬件**:中芯国际(目标价60港元)、舜宇光学(目标价84港元)等获"买入"评级 [15] - **美股重点公司**:英伟达(目标价160美元)、微软(目标价600美元)、苹果(目标价240美元)等均获"买入"评级 [17] - **A股重点公司**:贵州茅台(目标价1,900元人民币)、隆基股份(目标价18.92元人民币)等获"买入"评级 [17]
腾讯研究院AI速递 20250818
腾讯研究院· 2025-08-18 00:01
谷歌开源Gemma 3 270M - 谷歌发布轻量级模型Gemma 3 270M,参数规模2.7亿(嵌入参数1.7亿,Transformer模块1亿),下载体积仅241MB [1] - 模型在Pixel 9 Pro手机上25次对话仅耗电0.75%,INT4量化后适配资源受限设备 [1] - IFEval基准测试表现超越Qwen 2.5同级模型,下载量突破两亿次,支持任务微调 [1] Meta开源DINOv3视觉模型 - DINOv3采用自监督学习,在密集预测任务中超越弱监督模型,参数规模达70亿,训练数据17亿张图像 [2] - 创新技术包括Gram Anchoring策略和旋转位置编码(RoPE),提供ViT-B/ViT-L等系列模型 [2] - 商业许可开源,已应用于卫星图像分析和环境监测领域 [2] 腾讯混元3D世界模型Lite版 - 显存需求降至17GB以下,消费级显卡可运行,显存占用减少35% [3] - 动态FP8量化和SageAttention技术使推理速度提升3倍,精度损失小于1% [3] - 支持单文本/图片输入生成可漫游3D世界,可导出Mesh文件接入游戏引擎 [3] 昆仑万维音乐模型Mureka V7.5 - 一周内发布六款模型覆盖视频生成、AI音乐等热点领域 [4] - Mureka V7.5优化ASR技术提升中文歌曲音色与咬字,超越国外顶尖音乐模型 [4] - 同期推出MoE-TTS框架,通过自然语言控制语音特征,开源条件下超越闭源产品 [4] GPT-5编程提示技巧 - 指令需避免冲突与含糊,过分强硬措辞可能适得其反 [5] - 复杂任务用高推理力度,类XML语法可结构化规则 [6] - 零到一任务需先规划评判标准,控制Agent工具预算与查找节奏 [6] 人形机器人运动会 - 首日赛事包括1500米长跑(宇树机器人夺冠)、5V5足球等,蓝队1号球员完成3次进球 [7] - 现场解说聚焦AI技术,出现机器人集体摔倒等"鬼畜"场面 [7] DeepMind Genie 3世界模型 - 结合Veo 2和Genie 2,每秒生成24帧720p画面,支持单文本创建互动世界 [8] - 具备1分钟视觉记忆能力,物理规律表现随数据规模提升 [8] - 被视为AGI重要路径,可解决机器人训练数据瓶颈 [8] OpenAI战略动向 - 计划斥资数万亿建设数据中心,暗示未来AI可能担任CEO [9] - 与Jony Ive合作开发AI硬件,承认人类创作内容价值将上升 [9] - 认为当前AI泡沫类似互联网泡沫,但技术革命影响占比将达10%-20% [9] AGI发展观点 - AGI定义细化多维能力集合,评测基准需转向应用价值评估 [10] - 模型已在IMO/ICPC等竞赛展现推理能力,编程教育需结合AI辅助 [10][11] Agent市场展望 - AI市场将分基础模型、工具链、应用型Agent三赛道,后者机会最大 [12] - Agent将重构生产力曲线,未来按业务成果定价,长尾型公司大量涌现 [12]
腾讯混元开源游戏AI生成新工具,昆仑万维推出Matrix-3D
国盛证券· 2025-08-17 15:00
行业投资评级 - 增持(维持)[7] 核心观点 - 2025年下半年传媒行业继续看好游戏等基本面驱动板块,同时弹性方向看好AI应用及IP变现[1] - AI应用聚焦新应用的映射投资及部分较成熟应用的数据跟踪,重点关注AI陪伴、AI教育及AI玩具方向[1] - IP变现聚焦有IP优势及全产业链潜力的公司,潮流玩具、影视内容等方向有机会[1] - 临近中报期重视中报预期较好公司的投资机会[1] 行情概览 - 本周(8.11-8.15)中信一级传媒板块上涨1.25%[1][11] - 传媒板块本周涨幅前五:吉视传媒(45.2%)、游族网络(19.9%)、每日互动(18.2%)、浙文互联(12.9%)、大晟文化(11.7%)[12] - 传媒板块本周跌幅前五:ST北文(-18.6%)、中国电影(-6.5%)、华媒控股(-6.1%)、光线传媒(-6.0%)、盛迅达(-5.8%)[12] - 重点港股&中概股一周走势:阅文集团(21.6%)、腾讯音乐(15.5%)、爱奇艺(8.2%)、哔哩哔哩(9.2%)、腾讯控股(5.5%)[12] 板块观点与关注标的 - 游戏:重点关注ST华通、吉比特、恺英网络、巨人网络、神州泰岳、心动公司等[2] - AI:豆神教育、盛天网络、上海电影、荣信文化、中文在线、易点天下等[2] - 资源整合预期:中视传媒、国新文化、广西广电、华智数媒、吉视传媒等[2] - 国企:慈文传媒、皖新传媒、中文传媒、南方传媒、凯文教育等[2] - 教育:学大教育、粉笔、天立国际控股等[2] - 港股:关注阿里巴巴、腾讯控股、泡泡玛特、中旭未来、阜博集团等[2] 重点事件回顾 - 腾讯开源游戏AI生成工具Hunyuan-GameCraft,支持实时生成3A级动态游戏视频[3] - 昆仑万维推出Matrix-3D模型,实现单图生成高质量全景视频并还原3D空间[4] - 谷歌开源轻量化AI模型Gemma 3 270M,参数仅2.7亿且能耗极低[5] 子板块数据跟踪 - 游戏:腾讯《王者荣耀》稳居畅销榜第一,《和平精英》排名上升至第二[22] - 院线:周票房12.95亿元,《南京照相馆》(4.18亿元)、《浪浪山小妖怪》(4.13亿元)领跑[24] - 影视视频:《凡人修仙传》全网热度84.4排名第一,《生万物》《锦月如歌》分列二三位[26] - 综艺:《地球超新鲜》全网热度79.2排名第一,《脱口秀和Ta的朋友们第二季》排名第二[26]
谷歌版小钢炮开源!0.27B大模型,4个注意力头,专为终端而生
量子位· 2025-08-15 14:44
模型发布与市场反应 - 谷歌开源Gemma 3 270M模型 参数规模为2.7亿 其中1.7亿为嵌入层参数 1亿为Transformer模块参数 [1][14] - 模型可直接在浏览器本地运行 无需联网 支持创意内容生成如睡前故事 [3] - 发布后引发市场关注 网友误以为参数规模为270B 实际仅为0.27B [4] 架构与性能特征 - 采用紧凑高效架构 仅包含4个注意力头 较Qwen 3 0.6B模型少12个注意力头 [7] - 词汇量达25.6万token 可处理特定领域罕见词汇 适合进一步微调 [15] - 支持INT4量化运行 在Pixel 9 Pro手机25轮对话仅消耗0.75%电量 能效表现突出 [17] - 提供量化感知训练检查点 INT4精度下性能损耗极微 适合资源受限设备部署 [19] 功能与应用场景 - 开箱即用精准遵循指令 微调后可释放文本分类和数据提取能力 [12][13] - 支持OCR应用 可将图片或PDF转换为结构化Markdown格式 [6] - 适用于情感分析、实体提取、查询路由、文本结构化、创意写作及合规检查等批量任务 [27] - 支持完全本地化运行 无需云端数据传输 保障用户隐私 [24] 开发与部署优势 - 微调仅需数分钟 支持快速迭代实验 数小时内可完成用例配置 [1][24] - 可通过Hugging Face、Ollama、Kaggle等平台获取模型 [25] - 支持使用Hugging Face、UnSloth或JAX工具进行个性化微调 [28] - 可部署于低成本基础设施或终端设备 大幅降低推理成本 [24][27] 行业合作与案例 - Adaptive ML与SK Telecom合作案例 使用Gemma 3 4B模型微调后 在多语言内容审核任务中超越更大规模专有模型 [20][21] - 轻量化模型策略适用于明确界定的任务 可释放更高效率 [23]
谷歌开源Gemma 3 270M,性能超越Qwen 2.5同级模型
机器之心· 2025-08-15 12:17
产品发布 - 谷歌正式发布Gemma 3系列最新模型Gemma 3 270M,拥有2.7亿参数,专为特定任务微调设计[2][3] - 新模型继承Gemma 3系列先进架构,在IFEval基准测试中树立同级模型新性能水平[3] - 模型体积仅241MB,便于下载和使用[1] 技术架构 - 模型参数构成:1.7亿个嵌入参数和1亿个Transformer模块参数[6][7] - 采用256k token的庞大词汇量,可处理特定和罕见token[7] - 支持INT4量化,在Pixel 9 Pro手机SoC上测试显示25次对话仅消耗0.75%电量[7] - 提供量化感知训练(QAT)检查点,最大限度减少INT4精度下的性能下降[7] 功能特点 - 具备强大的指令跟踪和文本结构化能力[3] - 提供预训练检查点和指令调整模型,开箱即用支持通用指令[7] - 适用于情绪分析、实体提取、查询路由等定义明确的任务[12] - 支持完全在设备上运行,保障用户隐私[12] 应用场景 - 适合高容量且定义明确的任务,如创意写作和合规性检查[12] - 适用于时延要求高、需要精打细算的任务,可大幅降低推理成本[12] - 支持快速迭代和部署,微调实验可在数小时内完成[12] - 可构建多个专业模型,每个模型专注不同任务[12] 市场表现 - Gemma系列累计下载量已突破2亿次[14] - 案例显示微调后的Gemma 3 4B模型在特定任务上超越大型专有模型[11] - 开发者已使用该模型支持Transformers.js的网页应用开发[11] 开发者支持 - 提供完整微调指南和快速入门方案[12] - 发布预训练模型和指令调优模型[12] - 支持Vertex AI、llama.cpp等多种推理工具[13] - 可在Colab上快速完成微调,耗时不到5分钟[13]