产业观察【AI产业跟踪】谷歌版「氛围编程」全栈平台发布，2028年中国AI总投资突破千亿美元

报告行业投资评级未提及报告的核心观点报告对AI产业最新趋势进行跟踪，涵盖行业动态、应用资讯、大模型资讯和科技前沿等方面，展示AI领域的发展现状与未来趋势，如2028年中国AI总投资将突破千亿美元等 [2] 根据相关目录分别进行总结 AI行业动态国内资讯 - IDC发布AI支出指南，2024年全球AI投资规模3.158亿美元，预计2028年达8159亿美元，五年复合增长率32.9%；中国预计2028年AI总投资突破1000亿美元，五年复合增长率35.2%，智能基础设施调配是最大应用场景，占比约四成 [11] - 中科院与之江实验室发布《人工智能赋能天文学开放科学白皮书》，倡导科学资源公平共享与全球协作，提出三大研究方向，计划成立“GOTTA学院”智能教育平台并组建8个工作组推动合作常态化 [12] 海外资讯 - Shopify CEO将AI应用设定为公司基本要求并纳入绩效考核，鼓励员工分享AI学习经验 [13] - Anthropic将推出Claude聊天机器人新订阅Max套餐，月费100或200美元，使用量分别为现有Pro方案的5倍或20倍，旨在测试AI付费天花板 [14] - Cerebras CEO预测3 - 5年后AI行业对Transformer架构依赖大幅降低，英伟达市场份额或降至50 - 60%，AI市场未来5年增长超100倍 [15] - 前OpenAI研究员团队发布《AI 2027》报告，预测AGI将在2027年中期实现，ASI年底出现，但部分专家质疑该预测 [16] - 2025年斯坦福AI指数报告显示中美顶级AI模型性能差距缩小至0.3%，AI模型训练算力每5个月翻番，数据集每8个月扩容一倍，推理成本大幅下降，小模型性能显著提升 [19] - Anthropic发布大学生Claude AI使用报告，STEM专业学生是AI早期采用者，学生主要用AI进行内容创建和技术解释等，Anthropic正与高校合作确保AI深化学习 [20] AI应用资讯国内资讯 - 字节跳动发布DreamActor - M1视频生成框架，基于扩散式Transformer，采用混合引导机制，在肖像等动画生成任务中表现优异 [21] - 米哈游创始人蔡浩宇的AI游戏《Whispers From The Star》曝光实机演示视频，通过AI实现实时剧情展开，玩家选择决定主角命运 [22] - 小智AI成为现象级开源AI硬件项目，两个月内接入设备数量增长10万台，月增长率达300%，吸引4万名开发者参与，多家芯片厂商已适配 [23] 海外资讯 - 谷歌官方宣布Gemini API支持MCP协议，MCP有改变技术格局的潜力，但谷歌面临依赖竞争对手主导标准的风险 [24] - Midjourney V7 Alpha发布，提升了对文本和图像提示的理解能力，推出“草稿模式”，新增“模型个性化”功能 [26] - The Browser Company发布新品AI浏览器Dia，深度整合GPT - 4o和Gemini Flash 2.0，支持个性化设置，AI浏览器成为Agent落地突破口 [27] - NVIDIA推出NIM微服务，提供预打包优化模型，简化RTX AI PC和工作站上的智能体工作流，即将推出NVIDIA AI Blueprint [28] - 微软推出Copilot系列更新，将AI助手升级为“专属AI伙伴”，新增多项功能，多项功能将在未来数月按平台分批推送 [29] - Meta AI系统MoCha开启自动化多轮对话电影生成新时代，仅基于语音和文本输入即可生成完整角色对话视频 [30] - Runway发布Gen - 4 Turbo视频模型，生成速度大幅提升，但需在速度与画质和流畅度间取得平衡 [31] - GitHub开源MCP服务器，为开发者提供自动化和智能化功能，配置简单 [32] - ElevenLabs推出MCP服务，实现AI系统与语音技术的无缝集成，适合开发语音交互系统 [35] - 加州大学伯克利、斯坦福和英伟达联合推出AI生成《猫和老鼠》短片，无剪辑一次性直出60秒连贯动画，突破视频生成长上下文瓶颈 [36] - alphaXiv推出“Deep Research for arXiv”功能，可一秒搜遍arXiv平台上的学术论文，大幅提升研究效率 [37] - Cloudflare推出AutoRAG服务，实现全托管端到端RAG系统，自动处理完整流程，开放测试期间免费使用 [38] - 谷歌推出开源A2A协议，使不同平台和厂商的AI Agent能安全协作通信，推动AI行业迈入多Agent协作时代 [39] - xAI正式推出Grok 3 API，包括普通模型和推理模型，每种有普通和fast模式，数据共享用户每月可获150美元免费额度 [40] - 谷歌发布Firebase Studio预览版，让用户在浏览器中通过自然语言创建App，集成Gemini提供AI辅助，早期用户反馈不一 [41] AI大模型资讯国内资讯 - DeepSeek发布推理时Scaling新论文，提出SPCT方法，开发了DeepSeek - GRM - 27B模型，为LLM后训练和推理发展提供新方向 [42][45] - 阶跃星辰发布新型多模态推理模型Step - R1 - V - Mini，支持图文输入、文字输出，具备高精度图像感知和复杂推理能力 [46] - Kimi开源轻量级视觉语言模型Kimi - VL和推理版Kimi - VL - Thinking，在多项基准测试中超越GPT - 4o，支持128K上下文窗口 [47] - 商汤发布第六代大模型SenseNova V6，采用6000亿参数MoE架构，实现文本、图像和视频的原生融合，能理解中长视频内容并直接推理 [48] - 智象未来开源17B参数的文生图模型HiDream - I1，采用MIT许可协议可商用，能在几秒内实现高质量图像生成 [49] 海外资讯 - Llama 4系列采用MoE架构发布三款模型，实现原生多模态支持，苹果Mac设备是部署稀疏MoE模型的“性价比之王”，但代码能力偏弱 [50] - 多科学家否认Llama 4在测试集上过拟合训练，Llama 4在多项基准测试中表现不佳 [51] - 奥特曼宣布GPT - 5虽推迟但将免费开放，OpenAI的o3和o4 - mini模型将在几周内上线，同时计划开源一个强大推理模型 [54] - 谷歌Deep Research升级搭载Gemini 2.5 Pro，性能超OpenAIDR 40%，价格仅为其1/10，显著提升分析推理与信息整合能力 [55] - 英伟达开源Llama Nemotron - 253B模型，在数学编码、科学问答中准确率登顶，吞吐量提升4倍，系列模型全部可商用 [56] - UC伯克利和Together AI联合推出开源代码推理模型DeepCoder - 14B - Preview，仅14B参数就媲美OpenAI o3 - mini，团队开源了verl - pipe训练系统提高训练速度 [56] - 亚马逊推出Nova Sonic语音基础模型，将语音理解和生成功能集成到单一模型中，实现更自然的对话体验，可用于多行业AI Agent [57] 科技前沿 - UALink 1.0规范发布，支持1024个GPU互连，每通道带宽200 GT/s，是反英伟达NVLink技术的开放替代方案，首批设备将在12 - 18个月内推出 [58] - 机器人专家拆解宇树网红机器狗Go2，其集成化程度高、模块化设计优良，但激光雷达埋得过深且颈部结构单薄，续航和耐用性仍有提升空间 [59][60] - 加州初创公司Lightmatter推出光子超级芯片M1000，提供114Tbps总光带宽，能在单一域支持数千GPU互联，发布全球首款3D共封装光学产品L200，性能提升5至10倍 [61] - 首个AI科学家2.0成功发表论文进入ICLR workshop，实现从选题到实验全程零人工干预，背后公司目标进军顶级科学期刊 [62] - Reallusion推出Character Creator 5，引入支持细分的HD角色基础，使3D数字人细节网格数量提升至CC4的16倍，实现毛孔级真实感，新增工具自动整合 [63]