计算机：Google AI全家桶，打响大模型反击战

谷歌进入Gemini时代，多款新模型更新亮相 - 谷歌在2023年I/O大会上首次分享了Gemini计划,旨在构建原生多模态模型,能够跨文本、图像、视频、代码等多种数据类型进行推理[12][13] - 今年I/O大会上,谷歌AI大模型已完成升级迭代,Gemini与Gemma性能进一步提升,逐步进入Gemini时代[13] - Gemini 1.5 Pro上下文长度可达200万tokens,性能在多项基准测试中取得显著改进[13][14] - Gemini 1.5 Flash是针对大规模、大批量、高频任务优化的轻量化模型,具有多模态推理能力和长上下文窗口[15][16] - 开源大模型Gemma升级至第二代,参数规模提升至27B,性能优于一些更大模型[17][18] - Gemini Nano未来将具备文本、图像、音频和语音的多模态能力[18][19] 2. Astra对标GPT-4o,图像、音乐、视频多模态模型发布 - 谷歌推出AI Agent项目Astra模型,具备类似GPT-4o的多模态实时推理能力[20][21] - 谷歌还发布了基于Gemini的对话式体验产品Gemini Live,可与之进行深入语音聊天[20] - 谷歌发布了Imagen 3、Music AI Sandbox、Veo等多模态大模型,在图像、音乐、视频等领域取得突破[23][24][25][26] 3. Gemini赋能谷歌全产品线,打造AI生产力工具集合 - 已有超150万个开发者在使用Gemini模型,利用它调试代码、获取新见解并打造下一代AI应用[27] - 谷歌将Gemini融入搜索引擎,支持多轮推理、规划能力以及对视频提问[28][29] - 谷歌Photos推出Ask Photos功能,可从图库中帮用户找到想要的照片和视频[29][30] - 谷歌Workspace实现邮箱、日历、文档等应用的协同,提升生产力[31][32] - NotebookLM可基于源文件生成个性化和交互式音频对话[32][33] - 安卓15引入Gemini后具备"Circle to Search"、AI助手等功能[34][35] 4. AI时代的基础设施,新一代TPU性能最强能效最高 - 谷歌为AI大模型定制基础设施TPU,支撑Gemini及其他模型训练与服务需求[35][36] - 谷歌推出第六代TPU Trillium,性能较上一代提高4.7倍,能效提高67%以上[38][39] - 谷歌还推出了CPU和GPU,支持任何工作负载,如Axion处理器和Nvidia Blackwell GPU[39][40] 5. 投资建议 - 建议关注AI多模态、AI算力、AI+办公、AI+教育/电商/医疗等相关领域的优质公司[41] 6. 风险提示 - AI技术迭代不及预期、产品落地不及预期、AI伦理风险等[42]