报告行业投资评级 未提及 报告的核心观点 报告对AI产业最新趋势进行跟踪,涵盖行业动态、应用资讯、大模型资讯和科技前沿等方面,展示AI领域的发展现状与未来趋势,如2028年中国AI总投资将突破千亿美元等 [2] 根据相关目录分别进行总结 AI行业动态 国内资讯 - IDC发布AI支出指南,2024年全球AI投资规模3.158亿美元,预计2028年达8159亿美元,五年复合增长率32.9%;中国预计2028年AI总投资突破1000亿美元,五年复合增长率35.2%,智能基础设施调配是最大应用场景,占比约四成 [11] - 中科院与之江实验室发布《人工智能赋能天文学开放科学白皮书》,倡导科学资源公平共享与全球协作,提出三大研究方向,计划成立“GOTTA学院”智能教育平台并组建8个工作组推动合作常态化 [12] 海外资讯 - Shopify CEO将AI应用设定为公司基本要求并纳入绩效考核,鼓励员工分享AI学习经验 [13] - Anthropic将推出Claude聊天机器人新订阅Max套餐,月费100或200美元,使用量分别为现有Pro方案的5倍或20倍,旨在测试AI付费天花板 [14] - Cerebras CEO预测3 - 5年后AI行业对Transformer架构依赖大幅降低,英伟达市场份额或降至50 - 60%,AI市场未来5年增长超100倍 [15] - 前OpenAI研究员团队发布《AI 2027》报告,预测AGI将在2027年中期实现,ASI年底出现,但部分专家质疑该预测 [16] - 2025年斯坦福AI指数报告显示中美顶级AI模型性能差距缩小至0.3%,AI模型训练算力每5个月翻番,数据集每8个月扩容一倍,推理成本大幅下降,小模型性能显著提升 [19] - Anthropic发布大学生Claude AI使用报告,STEM专业学生是AI早期采用者,学生主要用AI进行内容创建和技术解释等,Anthropic正与高校合作确保AI深化学习 [20] AI应用资讯 国内资讯 - 字节跳动发布DreamActor - M1视频生成框架,基于扩散式Transformer,采用混合引导机制,在肖像等动画生成任务中表现优异 [21] - 米哈游创始人蔡浩宇的AI游戏《Whispers From The Star》曝光实机演示视频,通过AI实现实时剧情展开,玩家选择决定主角命运 [22] - 小智AI成为现象级开源AI硬件项目,两个月内接入设备数量增长10万台,月增长率达300%,吸引4万名开发者参与,多家芯片厂商已适配 [23] 海外资讯 - 谷歌官方宣布Gemini API支持MCP协议,MCP有改变技术格局的潜力,但谷歌面临依赖竞争对手主导标准的风险 [24] - Midjourney V7 Alpha发布,提升了对文本和图像提示的理解能力,推出“草稿模式”,新增“模型个性化”功能 [26] - The Browser Company发布新品AI浏览器Dia,深度整合GPT - 4o和Gemini Flash 2.0,支持个性化设置,AI浏览器成为Agent落地突破口 [27] - NVIDIA推出NIM微服务,提供预打包优化模型,简化RTX AI PC和工作站上的智能体工作流,即将推出NVIDIA AI Blueprint [28] - 微软推出Copilot系列更新,将AI助手升级为“专属AI伙伴”,新增多项功能,多项功能将在未来数月按平台分批推送 [29] - Meta AI系统MoCha开启自动化多轮对话电影生成新时代,仅基于语音和文本输入即可生成完整角色对话视频 [30] - Runway发布Gen - 4 Turbo视频模型,生成速度大幅提升,但需在速度与画质和流畅度间取得平衡 [31] - GitHub开源MCP服务器,为开发者提供自动化和智能化功能,配置简单 [32] - ElevenLabs推出MCP服务,实现AI系统与语音技术的无缝集成,适合开发语音交互系统 [35] - 加州大学伯克利、斯坦福和英伟达联合推出AI生成《猫和老鼠》短片,无剪辑一次性直出60秒连贯动画,突破视频生成长上下文瓶颈 [36] - alphaXiv推出“Deep Research for arXiv”功能,可一秒搜遍arXiv平台上的学术论文,大幅提升研究效率 [37] - Cloudflare推出AutoRAG服务,实现全托管端到端RAG系统,自动处理完整流程,开放测试期间免费使用 [38] - 谷歌推出开源A2A协议,使不同平台和厂商的AI Agent能安全协作通信,推动AI行业迈入多Agent协作时代 [39] - xAI正式推出Grok 3 API,包括普通模型和推理模型,每种有普通和fast模式,数据共享用户每月可获150美元免费额度 [40] - 谷歌发布Firebase Studio预览版,让用户在浏览器中通过自然语言创建App,集成Gemini提供AI辅助,早期用户反馈不一 [41] AI大模型资讯 国内资讯 - DeepSeek发布推理时Scaling新论文,提出SPCT方法,开发了DeepSeek - GRM - 27B模型,为LLM后训练和推理发展提供新方向 [42][45] - 阶跃星辰发布新型多模态推理模型Step - R1 - V - Mini,支持图文输入、文字输出,具备高精度图像感知和复杂推理能力 [46] - Kimi开源轻量级视觉语言模型Kimi - VL和推理版Kimi - VL - Thinking,在多项基准测试中超越GPT - 4o,支持128K上下文窗口 [47] - 商汤发布第六代大模型SenseNova V6,采用6000亿参数MoE架构,实现文本、图像和视频的原生融合,能理解中长视频内容并直接推理 [48] - 智象未来开源17B参数的文生图模型HiDream - I1,采用MIT许可协议可商用,能在几秒内实现高质量图像生成 [49] 海外资讯 - Llama 4系列采用MoE架构发布三款模型,实现原生多模态支持,苹果Mac设备是部署稀疏MoE模型的“性价比之王”,但代码能力偏弱 [50] - 多科学家否认Llama 4在测试集上过拟合训练,Llama 4在多项基准测试中表现不佳 [51] - 奥特曼宣布GPT - 5虽推迟但将免费开放,OpenAI的o3和o4 - mini模型将在几周内上线,同时计划开源一个强大推理模型 [54] - 谷歌Deep Research升级搭载Gemini 2.5 Pro,性能超OpenAIDR 40%,价格仅为其1/10,显著提升分析推理与信息整合能力 [55] - 英伟达开源Llama Nemotron - 253B模型,在数学编码、科学问答中准确率登顶,吞吐量提升4倍,系列模型全部可商用 [56] - UC伯克利和Together AI联合推出开源代码推理模型DeepCoder - 14B - Preview,仅14B参数就媲美OpenAI o3 - mini,团队开源了verl - pipe训练系统提高训练速度 [56] - 亚马逊推出Nova Sonic语音基础模型,将语音理解和生成功能集成到单一模型中,实现更自然的对话体验,可用于多行业AI Agent [57] 科技前沿 - UALink 1.0规范发布,支持1024个GPU互连,每通道带宽200 GT/s,是反英伟达NVLink技术的开放替代方案,首批设备将在12 - 18个月内推出 [58] - 机器人专家拆解宇树网红机器狗Go2,其集成化程度高、模块化设计优良,但激光雷达埋得过深且颈部结构单薄,续航和耐用性仍有提升空间 [59][60] - 加州初创公司Lightmatter推出光子超级芯片M1000,提供114Tbps总光带宽,能在单一域支持数千GPU互联,发布全球首款3D共封装光学产品L200,性能提升5至10倍 [61] - 首个AI科学家2.0成功发表论文进入ICLR workshop,实现从选题到实验全程零人工干预,背后公司目标进军顶级科学期刊 [62] - Reallusion推出Character Creator 5,引入支持细分的HD角色基础,使3D数字人细节网格数量提升至CC4的16倍,实现毛孔级真实感,新增工具自动整合 [63]
产业观察【AI产业跟踪】谷歌版「氛围编程」全栈平台发布,2028年中国AI总投资突破千亿美元
国泰海通证券·2025-04-17 15:01