Workflow
国泰海通证券【AI产业跟踪】 Gemini 2.5 Pro编程全球霸榜,OpenAI发布o4~mini和o3满血版
国泰海通证券·2025-04-22 14:39

报告行业投资评级 未提及 报告的核心观点 报告对AI产业最新趋势进行跟踪,涵盖行业动态、应用资讯、大模型资讯和科技前沿等方面,展示AI领域的新进展和发展方向 [1] 根据相关目录分别进行总结 AI行业动态 - 英伟达将在美国制造最强AI芯片,计划生产价值5000亿美元的AI基础设施,项目将创造大量就业岗位并推动万亿美元经济效益 [11] - OpenAI华人科学家认为AI发展下半场评估比训练重要,应转向现实世界实用性和人机交互 [12] - 图灵奖得主和谷歌RL副总裁合作发文,称AI正从“人类数据时代”过渡到“经验时代” [13] - Slingshot AI创始人开发AI心理咨询应用,以低成本帮助亚临床人群,弥补专业治疗师缺口 [14] - OpenAI倡导“迭代部署”理念,认为微调模型价值被低估,聊天界面是与AI交互理想方式 [15] - DeepMind团队用AI一年完成10亿年博士研究时间,AI在科学领域可解决复杂问题 [16] - Anthropic工程师分享构建有效Agent的方法,强调明智选场景、保持系统简单 [16][17] - AI数字人技术跨越“恐怖谷”,应用层即将爆发,未来向角色一致性等方向发展 [18] - OpenAI计划30亿美元收购AI编程助手Wind - surf,强化编程能力并拓展企业级应用 [19] - Hugging Face宣布收购Pollen Robotics,展现进军实体机器人的决心 [20] AI应用资讯 国内资讯 - 微信首个AI助手元宝AI入驻,搭载双模引擎,支持多种功能,但初期有功能限制 [21] - 可灵AI 2.0升级,形成多模态语言系统,新增编辑功能,已有大量用户和创作成果 [22] - 腾讯云大模型知识引擎升级支持MCP协议,降低开发门槛,提供多种开发方式 [23] - 魔搭ModelScope上线MCP广场,集成多款服务,降低AI开发门槛并推出评估工具 [24][27] - 字节发布视频生成基础模型Seaweed,参数少但性能优,支持多种功能 [28] - 魔芯科技研究人员提出图生3D新框架CADCrafter,解决AI生成3D模型难编辑问题 [29] - 小鹏汽车研发超大规模自动驾驶大模型,建成万卡智算集群,验证规模法则有效性 [30] - VAST开源两个3D项目,HoloPart可实现部件分割,UniRig提升绑定和动画精度 [31] - 上海AI Lab和西工大推出CityGS - X架构,提升大规模城市场景重建训练速度 [32] 海外资讯 - OpenAI开源轻量级代码Agent智能体Codex CLI,可自动进行代码重构与测试,未来将开源更多产品 [33] - AI助手Claude升级,新增Research功能,集成Google Workspace,语音模式即将上线 [34][35] - Grok发布Grok Studio第一个版本,支持Python代码执行预览,集成Google Drive [36] - Meta发布简易版Unity桌面编辑器,支持AI一键生成3D模型等,启动创作者基金 [37] - 开源语音模型Orpheus让LLM具备共情能力,性能超越闭源模型 [38] - OpenAI推出API组织验证,平衡技术开放与防止滥用 [39] - 谷歌Veo 2升级为专业视频创作平台,与Freepik AI Suite配合为创意工作者提供工具 [40] - OpenAI开源智能体浏览器功能测试基准BrowseComp,挑战大,新Agent模型表现好 [41] AI大模型资讯 国内资讯 - 上海AI Lab发布多模态书生·万象3.0,在开源模型评测中领先,提升多方面能力 [43] - Kimina - Prover预览版发布,在基准测试中创记录,开源多个模型和数据集 [44] - 理想MindGPT 3.0发布,实现长思维链推理能力突破,支持高性能生产环境 [45] - 字节发布豆包1.5深度思考模型,采用MoE架构,新增功能,测试成绩不错 [46] - 智谱GLM开源模型系列新增成员,启用新域名,推理模型性能好且价格低 [47] - Skywork - OR1成为最强32B中文推理大模型,性能优,将发布更强正式版本 [48] 海外资讯 - OpenAI发布最强、最智能模型o4 - mini和o3满血版,多模态且能自动调用工具,测试成绩好 [49][51] - OpenAI发布GPT - 4.1系列三个版本,支持大上下文窗口,性价比高 [52] - Gemini 2.5 Pro编程全球登顶,谷歌AI实力领先,兼顾性能与成本 [53] 科技前沿 - 全球首个人形机器人半马参赛选手阵容公开,参赛机器人进行专门改造以适配长跑 [54] - 谷歌AI破解海豚语,将实现水下实时人 - 海豚交流,计划开源模型 [55] - 上交大开发AI驱动助盲系统,帮助视障者完成导航和抓取,提升导航效率 [56] - MICrONS项目绘出最大哺乳动物脑连接图,揭示神经元连接规律,开放数据并计划新研究 [57] - 西班牙研究人员开发可触摸、抓取和操控的3D全息投影技术,有望应用于教育等领域 [61]