Imagen 4图像生成模型

搜索文档
行业周报:周观点:AI有望持续精彩-20250525
开源证券· 2025-05-25 21:18
报告行业投资评级 - 看好(维持) [1] 报告的核心观点 - AI有望持续精彩,谷歌开发者大会展示AI技术与生态体系全面融合,字节、腾讯等大厂推动AI与业务体系融合,国内外科技厂商将AI能力与自身业务体系融合成重心,AI有望成生产力工具 [5][6][13] 一周市场回顾 - 本周(2025.5.19 - 2025.5.23),沪深300指数下跌0.18%,计算机指数下跌3.02% [4][14] 公司动态 对外投资与中标 - 高伟达以自有资金1000万元增资蓝芯算力,11.15万元计入注册资本,剩余计入资本公积,完成后将持有0.67%股权 [15] - 宏景科技与Y公司签署《智算项目服务合同》,提供服务器等服务及算力服务,合同总金额59699.20万元含税,期限五年 [15] 股权激励 - 格灵深瞳拟授予660万股限制性股票,占股本总额2.55%,首次授予11人,授予价8.05元/股,业绩考核目标2025 - 2026年营收增长率不低于113.68%、156.41%,触发值不低于80.34%、113.68% [16] - 焦点科技拟授予1532.40万份股票期权,占股本总额4.83%,首次授予1153人,行权价29.04元/份,业绩考核目标2025 - 2027年净利润增长率分别不低于20%、40%、60% [16] 其他公告 - 京北方董事赵龙虎拟减持不超52.92万股,占总股本0.061%;副总经理曹景广拟减持不超4.34万股,占总股本0.005% [17] - 青云科技嘉兴蓝驰、天津蓝驰拟减持不超1194992股,占总股本2.50%;横琴昭盛拟减持不超955992股,占总股本2% [17] - 金财互联股东徐正军拟减持不超1538.43万股,占总股本1.97% [18] - 拉卡拉股东孙浩然拟减持不超1927.09万股,占剔除回购股份后总股本2.45% [19] - 并行科技805.76万股股票解除限售,占总股本13.8375%,5月26日可交易 [19] - 纳思达拟出售美国利盟100%股权,预估交易对价0.75 - 1.5亿美元 [19] - 大豪科技控股子公司兴汉网际进入创新层 [19] 行业动态 国内要闻 - 阿里巴巴投资美图2.5亿美元,持股6.85%,双方将进行AI等业务合作 [20] - 小米自研3nm芯片玄戒O1大规模量产,小米15周年发布会发布搭载该芯片的两款旗舰 [21] - 华为发布首款鸿蒙折叠屏电脑MateBook Fold非凡大师,售价23999元起 [22] 国外要闻 - Meta推出激励计划助力初创企业采用Llama AI模型,入选成员每月最高获6000美元补贴,最长六个月 [23][24] - 苹果智能眼镜芯片计划2026年或2027年量产,能耗低于iPhone芯片 [25] - 苹果公布WWDC25日程,6月10 - 14日线上大会免费开放 [26] - 英伟达推出人形机器人基础模型N1.5,开发周期从三个月缩至36小时 [27] - OpenAI推出云端AI编程智能体Codex,提升开发效率 [28] 投资建议 AI应用端 - 推荐金山办公、鼎捷数智等,受益标的包括汉邦高科、海天瑞声等 [7][13] AI算力端 - 推荐海光信息、中科曙光等,受益标的包括优刻得、青云科技等 [7][13]
四点速读2025谷歌开发者大会
第一财经· 2025-05-21 11:22
谷歌AI技术进展 - 核心观点:谷歌在开发者大会上展示了AI技术的最新进展,包括基础模型升级、生成式内容工具推出和硬件更新,标志着其AI生态系统建设迈出重要一步 [1] Gemini模型升级 - Gemini 2 5 Pro和Flash模型全面支持视听输入和原生音频输出对话,开发者可通过Live API预览版微调对话体验的音调、口音和说话风格 [2] - Gemini可作为Chatbot登录Chrome浏览器,帮助用户快速理解页面上下文并完成任务 [2] - Deep Think模式引入增强型推理机制,显著提升模型在数学、编程和多模态任务中的推理能力 [2] 生成式内容工具升级 - Veo 3视频生成模型支持原生音频生成,可为视频添加背景音乐、音效甚至对白,解决AI视频"有影无声"问题 [3] - Imagen 4图像生成模型在细节和文本输出质量上有质的飞跃,支持渲染织物、水滴和动物皮毛等精细细节,可创建2K分辨率图像 [3] AI代理工具更新 - Project Mariner优化工作方式,可一次承担近十几项任务,如购买门票或杂货,无需访问第三方网站 [4] - 推出视频通话平台Google Beam,硬件包括六摄像头阵列和光场显示器,软件通过AI模型实现3D渲染,支持毫米级头部跟踪和60fps视频流 [4] XR智能眼镜 - 与Xreal、Samsung合作推出集成AI助手功能的Android XR智能眼镜,支持实时翻译、导航和信息提示 [5] AI订阅计划 - 推出每月249 99美元的AI Ultra订阅计划,提供Gemini 2 5 Pro的Deep Think模式、Veo 3视频生成工具等高级功能访问权限 [6]
四点速读2025谷歌开发者大会
第一财经· 2025-05-21 11:06
Gemini模型升级 - 核心亮点是Gemini 2 5 Pro和Flash模型全面支持视听输入和原生音频输出对话开发者可通过Live API预览版构建和微调对话体验的音调口音和说话风格等 [2] - Gemini可作为Chatbot登录Chrome浏览器帮助用户快速理解页面上下文并完成任务 [2] - Deep Think模式引入增强型推理机制在处理数学编程和多模态任务时显著提升模型的推理能力 [2] 生成式内容工具升级 - Veo 3视频生成模型支持原生音频生成能够生成高清视频并添加背景音乐音效甚至对白极大提升AI视频质量和真实感 [3] - Imagen 4图像生成模型在图像细节和文本输出质量上有质的飞跃能够渲染织物水滴和动物皮毛等精细细节支持照片级写实和抽象等多种风格 [3] - Imagen 4可创建各种纵横比高达2K分辨率的图像为创作者提供更强大的图像生成工具 [3] AI代理与视频通话平台 - 实验性AI代理工具Project Mariner可一次承担近十几项任务例如购买棒球比赛门票或在线购买杂货极大便利用户日常生活 [4] - 全新视频通话平台Google Beam硬件包括六摄像头阵列和定制的光场显示器软件上AI模型将不同角度摄像头视频转换为3D渲染 [4] - Beam可实现毫米级头部跟踪和60fps视频流与Google Meet一起使用时提供实时语音翻译功能保留说话者的声音语调和表情 [4] XR智能眼镜与订阅计划 - 集成AI助手功能的Android XR智能眼镜支持实时翻译导航和信息提示等功能是公司在可穿戴设备领域的新尝试 [5] - 推出每月249 99美元的AI Ultra订阅计划提供Gemini 2 5 Pro的Deep Think模式Veo 3视频生成工具等高级AI功能的访问权限 [5] - AI Ultra订阅计划还提供更高的使用限制和额外存储空间 [5]