腾讯研究院AI速递 20251024

谷歌AI学习平台 - 谷歌推出AI学习平台Google Skills，整合内部资源提供超过3000门课程，覆盖大型语言模型技术及伦理内容[1] - 平台采用游戏化激励方式，过去一年已有2600万人在其分散平台学习技能，现集中至统一入口[1] - 平台与150多家雇主组成招聘联盟，用户完成证书可跳过初筛直接进入面试，构建学习至就业的闭环[1] Sora项目升级 - Sora2将推出“角色客串”功能，允许用户将现实物品或生成人物投射到虚拟世界并创建独特IP进行互动[2] - 社交体验将优化，支持特定社群组队分享并减少过度内容审核，应用优化包括流畅度提升和视频编辑功能[2] - 安卓版即将上线，可在谷歌应用商店预注册[2] 快手AI编程产品 - 快手发布AI编程产品矩阵，包括KAT-Coder模型、CodeFlicker开发工具和万擎MaaS平台三位一体解决方案[3] - KAT-Coder模型在SWE-bench Verified榜单解决率达73.4%，其开源版达74.6%，收入在8个月内增长4倍[3] - CodeFlicker工具已在公司内部80%工程师中使用，支持自动生成代码仓库说明书和企业级定制服务[3] 多模态图像编辑模型 - 港科大贾佳亚团队推出DreamOmni2多模态图像编辑模型，在GitHub两周内获得1.6k星标，可处理多个参考图像并理解抽象概念[4] - 基于FLUX Kontext模型，该模型在传统任务上优于现有开源模型，支持风格迁移、动作模仿和多图编辑[4] - 采用创新三阶段数据构建范式和索引编码技术，首次实现从单一物体到完整3D场景的生成并已开源[4] 3D生成大模型 - 字节跳动推出3D生成大模型Seed3D 1.0，基于Diffusion Transformer架构，可从单张图像生成高精度3D模型[5] - 该1.5B参数模型在纹理材质生成上对标SOTA水平，能准确还原精细特征[5] - 生成的3D模型可导入仿真引擎供机器人训练，并支持从单一物体扩展至完整3D场景生成[6] Meta AI部门调整 - Meta在AI部门进行大规模裁员约600个职位，华人AI科学家田渊栋及其团队受影响，FAIR实验室成为重灾区[7] - FAIR实验室遭重创，有消息称其首席科学家可能辞职，而新成立的TBD超级智能实验室仍在招聘[7] - 公司认为原有架构过于官僚化，正将重心从开放式基础研究转向超级智能竞赛，近期达成270亿美元数据中心融资[7] AI智能终端 - 科勒推出Dekoda智能马桶售价599美元起，通过AI摄像头视觉分析排泄物判断肠道健康等状况[8] - 使用需订阅年费26至70美元的应用，其AI模型基于超100万数据点训练并采用布里斯托大便分类法[8] - 产品面临隐私争议和高昂价格限制，分析结果相对简单仅分为正常、硬便、稀便等类别[8] 量子计算突破 - 谷歌发布量子回声算法在Willow芯片上运行，解决原子相互作用速度比Frontier超级计算机快13000倍，数小时完成需3.2年的计算[9] - 这是量子计算机首次在真实硬件上成功运行可验证算法，结果可在其他同等水平量子计算机上重复验证[9] - 算法可研究从分子到黑洞的各种系统结构，为药物研发和材料科学应用铺路[9] AI模型性能比较 - Vercel公司CEO表示内部测试中Kimi K2运行速度是GPT-5和Sonnet 4.5的5倍（2分钟对比8-10分钟）[10] - Kimi K2准确率超60%，比GPT-5（低于40%）高出50%，比Sonnet 4.5（低于50%）也有优势[10] - 硅谷多家公司如Cline、Cursor等已接入K2模型，因其性能强且价格更便宜[10] 视频模型发展趋势 - a16z合伙人指出视频模型进入产品时代，不同模型如Sora 2和Veo 3正走向专业化发展[12] - 模型能力与产品间存在巨大鸿沟，创作者需手动完成的工作应由产品层面解决[12] - 未来将出现针对特定场景的专用模型、帮助用户选模型的产品和整合创作套件[12]