腾讯研究院AI速递 20250812

一、xAI开放Grok 4 - Grok 4向全球用户免费开放但限制每12小时使用5次达到限制后完全不可用 [1] - 该策略被视为对标GPT-5发布引发付费用户对订阅价值的质疑 [1] - Grok Imagine视频生成服务新增分享功能修复下载问题并强化图片审核机制 [1] 二、浪潮发布元脑SD200服务器 - 元脑SD200将64张GPU卡融合为统一内存节点支持四大国产开源模型并行运行 [2] - 采用3D Mesh架构与GPU虚拟映射技术显存达4TB 内存64TB 满足万亿参数模型推理需求 [2] - 64卡运行DeepSeek R1性能提升3.7倍 Kimi K2提升1.7倍专为Agentic AI计算需求设计 [2] 三、智谱GLM-4.5技术突破 - GLM-4.5公开预训练与后训练细节首创单模型融合推理、编码与智能体能力 [3] - 基于MoE架构与15T通用+7T专业数据训练强化长上下文与智能体性能 [3] - 在12项ARC测试中超越Claude Opus 4 部分指标超过OpenAI o3 [3] 四、昆仑万维SkyReels-A3视频模型 - SkyReels-A3基于DiT架构生成1分钟数字人视频优化手部动作与运镜控制 [4] - 采用改进插帧方法与ControlNet模块解决长视频稳定性与多视角切换问题 [4] - 作为五天技术发布周首款产品已上线Talking Avatar工具 [4] 五、腾讯混元3D生成能力升级 - 创想三维MakeNow平台接入腾讯混元增强CubeMe等工具的3D生成能力 [5] - 混元3D v2.5采用稀疏原生架构几何分辨率达1024³ 纹理贴图4K级 [6] - 用户上传照片5分钟内可生成可打印Q版手办支持三种风格个性化调整 [6] 六、阿里开源具身智能组件 - 开源RynnVLA-001视觉-语言-动作模型能从第一人称视频学习人类操作 [7] - RynnRCP协议打通传感器到执行的机器人工作流支持多款热门模型 [7] - RynnEC模型通过视频序列建立连续空间感知引入多模态世界理解能力 [7] 七、百川医疗大模型Baichuan-M2 - 32B参数Baichuan-M2在HealthBench评测中仅次于GPT-5 超越所有开源模型 [8] - 集成验证系统与患者模拟器严格遵循中国医疗指南并适配临床场景 [8] - 4bit量化后单卡RTX4090可部署成本较DeepSeek-R1 H20降低57倍 [8] 八、灵巧智能机器人手技术 - DexHand021 Pro拥有22自由度双绳驱动实现拇指对指等精细操作 [9] - 串并混联设计解决摩擦损耗问题四指负载>1kg 整手抓握>5kg [9] - 集成12个电机与多传感器成本仅为同类产品十分之一 [9] 九、Scaling Law行业观点 - Scaling Law反映数据内在幂律特性模型能力非线性增长源于数据结构 [10] - 需通过强化学习将计算转化为新知识建立生成-验证-学习的进化飞轮 [11] 十、2025大模型应用趋势 - 45%企业已部署大模型至生产环境 32%定制模型 27%采用API服务 [12] - 用户平均使用4.7家不同产品 ChatGPT领先但Gemini与DeepSeek增速显著 [12] - 55%接受中国模型但要求海外部署英伟达占据78%训练硬件市场份额 [12]