谷歌TPU产品战略更新 - 谷歌发布第八代TPU,首次将训练芯片TPU 8t与推理芯片TPU 8i分离,采取“训推分离”策略[1] - TPU 8t训练性能较上代Ironwood提升2.7倍,单超级节点可扩展至9600芯片和2PB共享内存,并引入原生FP4支持[1] - TPU 8i集成384MB片上SRAM是上代的3倍,单位价格性能提升80%,计划今年晚些时候向谷歌云客户开放[1] OpenAI产品动态与潜在技术方向 - OpenAI因测试环境误推,泄漏了包括GPT-5.5、Glacier、Heisenberg、Arcanine在内的多款未发布模型,显示其产品线深度远超外界认知[2] - GPT-5.5被定位为前沿智能体编码模型;Glacier系列含cy-block变体,疑似新架构;Heisenberg可能瞄准生命科学领域[2] - OpenAI正式推出团队级Workspace Agents,定位为GPTs的进化形态,面向Business、Enterprise、Edu、Teachers订阅用户开放[3] - Workspace Agents支持一句话搭建,可部署到ChatGPT或Slack,具备持久记忆、长流程执行能力,研究预览期免费至5月6日,之后转为按token计费的credit模式[3] 中国科技公司大模型与智能体进展 - 腾讯混元发布并开源Hy3 preview模型,采用总参数295B、激活21B的MoE架构,支持256K上下文,代码与智能体能力显著提升[4] - 该模型在SWE-Bench Verified、Terminal-Bench 2.0等基准表现强劲,CodeBuddy首token延迟降低54%,个人版API最低28元/月[4] - 阿里开源Qwen3.6-27B,这是一个270亿参数的稠密多模态模型,在智能体编程基准上全面超越前代15倍参数量的MoE旗舰Qwen3.5-397B-A17B[5] - 具体表现上,SWE-bench Verified达77.2,Terminal-Bench 2.0达59.3,模型支持思考与非思考模式,权重已开源[5] - 小米发布MiMo-V2.5全系列并开启公测,Pro版对标Claude Opus 4.6和GPT-5.4,单次可稳定完成近千轮工具调用[6] - 该模型用4.3小时完成北大编译原理项目并获满分233/233,定价优化取消上下文长度倍率区分,夜间时段8折,并计划全球开源[6] AI多模态与生成技术突破 - 字节发布Seed3D 2.0,可从单张图像生成高质量3D模型,在几何生成与纹理材质两项核心指标均取得SOTA[7] - 技术采用Coarse-to-Fine两阶段DiT策略解耦整体与细节,纹理统一PBR模型采用MoE架构并引入VLM先验,可输出URDF格式关节化内容[7] - 可灵AI视频3.0系列新增原生4K直出选项,每秒消耗30灵感值,告别超分后处理流程,呈现院线级清晰度与色彩层次[8] - 团队空间功能升级,支持个人向团队转移灵感值与资产,新增桌面端Win/Mac客户端和三级权限管控[8] 行业其他重要动态 - Meta启动“模型能力计划”,在美国员工电脑安装追踪软件采集鼠标、键盘及屏幕截图数据,用于训练智能体,工作电脑无退出选项[9] - Meta计划自5月20日起全球裁员10%约8000人,同时推行“AI构建者”通用岗位头衔以重塑人力结构[9] - Sony AI团队研发的乒乓球机器人Ace登上Nature封面,在ITTF规则下击败3位精英选手并赢下日本职业选手1局[10] - 该机器人采用model-free强化学习训练,配备8自由度机械臂,可稳定回击450 rad/s的超强旋转球,代表物理AI在复杂实时任务中达到专家水平[10]
腾讯研究院AI速递 20260424