腾讯研究院AI速递 20250509

OpenAI宣布全新AI发展计划OpenAI for Countries - OpenAI推出"OpenAI for Countries"计划，旨在为全球各国提供类似美国"星际之门"的AI基础设施建设 [1] - 计划包含数据中心建设、定制化ChatGPT服务、AI安全措施升级和国家创业基金四大核心服务 [1] - 首阶段将在全球选择10个国家合作，推广"民主的AI"理念以巩固美国AI领导地位 [1] Figma发布2025年重磅升级 - Figma推出五大新功能：Draw绘图工具、Grid响应式布局、Buzz品牌资产引擎、Sites网站构建工具和Make原型生成器 [2] - 新功能覆盖从视觉设计到网站发布全流程，支持AI辅助创作和批量生产 [2] - 产品定位从设计原型工具升级为全链路设计平台，整合插画、界面、网站、资产和上线功能 [2] Mistral AI发布Medium 3模型 - Mistral AI发布Medium 3模型，性能对标GPT-4o和Claude 3.7 Sonnet，价格仅为Sonnet的1/8 [3] - 模型专为企业设计，支持混合部署，在编程及多语言场景表现优异 [3] - 同步推出企业级聊天机器人Le Chat Enterprise，支持跨应用集成和AI智能体构建 [3] 谷歌Gemini图像生成功能升级 - Gemini原生图像生成功能提升视觉质量和文本渲染准确度，支持实时编辑和元素融合 [4] - 每张图片定价0.039美元，生成速度快但在整体效果上或仍不及GPT-4o [4][5] - 新功能可与Gemini 2.5 Pro结合使用，支持将图片转换为代码表示的动态效果 [5] 微软宣布AI Agent支持新协议 - 微软Azure AI Foundry和Copilot Studio支持A2A和MCP协议，旨在打破智能体开发和通信壁垒 [6] - 已有超7万企业通过Azure AI Foundry开发智能体，4个月内超1万家组织采用Agent Service [6] - A2A协议支持智能体跨平台协作，MCP协议提供统一通信框架 [6] HeyGen发布Avatar IV模型 - Avatar IV模型仅需一张照片和语音/文字输入即可生成逼真的AI数字人视频 [7] - 采用基于扩散模型的音频驱动表情引擎，能根据语音节奏和情绪自动生成对应表情与动作 [7] - 付费用户可生成30秒视频，免费用户每月3次10秒视频额度 [7] DeepSeek致谢腾讯技术贡献 - DeepSeek的DeepEP网络通信框架引入腾讯TRMT技术后性能翻倍 [8] - 腾讯优化方案包括拓扑感知的多QP建链、基于IBGDA的多Channel负载均衡传输等 [8] - 优化后的DeepEP已开源，可帮助MoE架构大模型摆脱NCCL依赖 [8] OpenAI人事变动 - OpenAI任命Instacart CEO Fidji Simo为应用部门CEO，负责推动技术落地和商业化 [10] - OpenAI发展为三大核心业务：全球产品服务、基础设施建设和非营利组织 [10] - Sam Altman将专注于研究、计算和安全系统三大支柱 [10] UC伯克利开发VideoMimic系统 - VideoMimic系统让机器人通过观看视频就能学习人类动作，已让宇树G1掌握100多种动作 [11] - 系统不需动作捕捉设备，仅靠视频就能让机器人适应各种地形和完成复杂动作 [11] - 工作流程包括从视频重建人体运动、在仿真环境训练控制策略、部署到实体机器人三个步骤 [11] Meta AI战略布局 - Meta以Llama为核心布局AI，强调开源路线，聚焦广告优化、用户参与度提升等四大方向 [12] - Meta AI月活用户达10亿，认为AI在社交陪伴和内容创作方面潜力巨大 [12] - 将持续推进VR和AR差异化布局，认为AR眼镜是未来手机，VR是未来电视 [12]