Workflow
Unmute
icon
搜索文档
AI产业跟踪:Google发布基于Gemma模型的变体,iOS19或将迎来12年最大更新
国泰海通证券· 2025-06-06 21:25
报告行业投资评级 未提及 报告的核心观点 未提及 根据相关目录分别进行总结 AI 行业动态 - 英伟达因美国出口管制在中国 AI 芯片市场份额从 95%暴跌至 50%,推出新款阉割版 Blackwell GPU,售价 6500 - 8000 美元,采用 GDDR7 内存技术,内存带宽约 1.7TB/秒 [4] - 阿联酋将成全球首个让全民免费使用 ChatGPT Plus 的国家,阿布扎比将建 Stargate UAE 高性能 AI 数据中心,支持 1 千兆瓦计算集群,初期目标 200 兆瓦容量,投资总额可能达 200 亿美元 [5] - Salesforce 以 80 亿美元收购云数据管理龙头 Informatica,整合双方 AI 引擎,完善其数据管理领域布局 [6] - SpAItial 获 1300 万美元种子轮融资,组建来自 Meta 和谷歌的豪华技术团队,专注文本生成逼真 3D 环境技术,目标创造可交互 3D 世界 [7] AI 应用资讯 - VAST 升级 Tripo Studio,推出智能部件分割、贴图魔法笔刷、智能低模生成和万物自动绑骨四大核心功能,非专业人士效率提升 10 倍以上 [8] - AI 科学家 Zochi 的论文被顶会 ACL 主会录用,其论文在 GPT - 3.5 上攻击成功率达 100%,GPT - 4 上达 97% [9] - Anthropic 推出 Claude 语音模式,用户可语音讨论文档和图片,可在文本与语音间自由切换,有使用限制 [10] - AKOOL 发布全球首款实时摄像头 AKOOL Live Camera,实现低延迟虚拟数字人等功能,标志 AI 视频进入“智能化响应”时代 [11] - 法国机构 Kyutai 推出模块化语音 AI 系统 Unmute,具备低延迟等功能,未来几周将完全开源 [12] - Google I/O 发布的 Veo3 视频生成模型实现流畅真实动画效果和同步音效,已达近电影级画质 [13] - OpenAI o3 模型在 Linux 内核 SMB 实现中发现远程 0 - day 漏洞,误报率约 1:4.5,标志着 LLM 在漏洞研究领域达实用水平 [14] AI 大模型资讯 - 自动驾驶大牛创立 Odyssey,推出世界模型实现视频实时生成,速度达 40 毫秒/帧,已获 2700 万美元融资 [15] - Google 发布三款基于 Gemma 的模型变体,分别面向医疗、手语和动物语言领域 [16] - Claude 4 采用可验证奖励强化学习范式,预计 2026 年将出现能独立完成实际工作的软件工程 Agent [17] 科技前沿 - 波士顿动力 Atlas 机器人升级,具备 3D 空间感知和实时物体追踪能力,可在汽车工厂执行复杂工业任务 [18] - 苹果将在 WWDC 2025 发布 iOS 19 等系统重大设计更新,代号“Solarium”,实现跨设备和操作系统视觉统一 [19] - 世界首个 AI 科学家团队 2.5 个月内发现治疗干性老年性黄斑变性新药 Ripasudil,将开源 Robin 系统 [20]
腾讯研究院AI速递 20250528
腾讯研究院· 2025-05-27 23:44
全球AI合作与投资 - 阿联酋成为全球首个全民免费使用ChatGPT Plus的国家,这是OpenAI与阿联酋政府合作的一部分 [1] - 阿布扎比将建设Stargate UAE高性能AI数据中心,初期目标200兆瓦容量,最终支持1千兆瓦计算集群 [1] - 该合作属于OpenAI"面向国家"计划,阿联酋承诺匹配美国同等资金,投资总额可能高达200亿美元 [1] AI模型竞争与创新 - OpenAI为GPT-4o启用唱歌功能,被认为是对谷歌I/O大会发布Gemini 2.5 Pro和Veo3的回应 [2] - 谷歌新发布的Gemini 2.5 Pro在多项基准测试中超越OpenAI和Claude模型 [2] - Claude Opus成功解决30年经验工程师4年未解决的顽固Bug,仅用几小时和约30轮对话 [3] - 阿里通义推出QwenLong-L1-32B,通过强化学习解决长上下文推理问题,支持13万token长度 [6] - 秘塔AI搜索推出"极速"模型,实现400 tokens/秒响应速度,大部分问题2秒内完成回答 [7] AI硬件与产品创新 - 雷鸟发布全彩显示AI眼镜X3 Pro,售价8999元,搭载通义定制多模态大模型,支持实时视觉问答 [8] - X3 Pro采用4nm高通骁龙AR1平台,亮度达3500尼特(峰值6000尼特),重量仅76g [8] - 法国Kyutai推出Unmute模块化语音AI系统,具备低延迟(200-350毫秒)和70+情感风格 [4][5] 人才流动与行业趋势 - Meta的Llama核心团队14人中已有11人离职,其中5人加入法国AI开源创企Mistral [10] - NVIDIA专家建议学生融合多项技能并提高适应能力,将AI整合到日常工作流中 [12] 前沿技术突破 - 北航团队实现通过语言指令控制无人机执行精细飞行动作,填补低层次语言交互控制研究空白 [11] - 研究团队构建UAV-Flow基准数据集,包含30K真实世界飞行轨迹,覆盖八种主要运动类型 [11]