腾讯研究院AI速递 20250731

ChatGPT学习模式 - OpenAI推出"学习模式"新功能，采用苏格拉底式引导方式帮助用户理解复杂概念 [1] - 所有版本用户均可免费使用，功能包括交互式提示、分步解答和个性化支持 [1] - 系统会根据用户教育背景和知识基础自动调整教学策略 [1] Grok视频功能 - xAI即将为Grok iOS应用推出"Imagine"视频生成功能，支持带音频的视频生成 [2] - 可一次性生成4段视频，效果逼真细节丰富，支持多种风格生成 [2] - 提供近乎实时的图像生成，支持Spicy、Fun和Normal等预设模式 [2] 昆仑万维开源模型 - 开源多模态统一模型Skywork UniPic仅需1.5B参数即可实现与百亿参数专用模型相当效果 [3] - 在单一模型中实现图像理解、文生图和图像编辑三大能力深度融合 [3] - 在GenEval和DPG-Bench等多个基准测试中达到行业SOTA水平 [3] 群核科技3D数据集 - 发布全球首个大规模3D语义数据集InteriorGS，包含1000个精细3D高斯语义场景 [4] - 覆盖超过80种室内环境，将3D高斯技术与自研空间大模型SpatialLM深度融合 [4][5] - 已与谷歌、斯坦福、英特尔等机构合作，为智元机器人等企业提供仿真数据训练 [5] 拓竹科技3D打印 - 3D模型平台MakerWorld全面接入腾讯混元3D，预计月调用量突破10万次 [6] - 混元3D实现0.1毫米级高精度建模，几何分辨率达1024级 [6] - 支持文字图片输入快速生成，具备物理级材质建模能力 [6] WPS办公智能体 - 实现AI与办公软件深度融合，一站式完成文案写作、PPT制作等办公任务 [7] - 采用原子化操作技术智能识别修改边界，精准锁定内容范围 [7] - 提供AI搜索、知识库和AI聊文档等功能，支持随身语音助手 [7] 豆包图像编辑 - 发布SeedEdit 3.0模型，支持通过自然语言指令进行多种图像编辑操作 [8] - 在文字修改、背景替换等场景表现对标GPT-4o和Gemini 2.5 Pro [8] - 采用多阶段训练策略实现8倍推理加速，运行时长从64秒降至8秒 [8] NotebookLM视频功能 - 推出"视频总览"功能，可将笔记、PDF、图片自动生成结构清晰的视频 [10] - 用户可定制视频内容，增强个性化学习体验 [10] - 已向所有英文用户开放，Studio面板同步升级 [10] 理想汽车VLA模型 - 推出业内首个量产VLA司机大模型，8月OTA推送至AD Max车型 [11] - 能理解自然语言指令、根据记忆设定路段速度、复杂路况下判断风险 [11] - 开发依靠12亿公里有效数据和13 EFLOPS训练平台 [11] 中国AI发展 - 中国AI技术在两年内取得巨大进步，多个大模型达到全球领先水平 [12] - "开放权重"策略被认为是推动中国AI快速发展的关键因素 [12] - 提倡加强中美AI合作，共同应对技术滥用风险 [12]