智谱GLM-4.6模型发布 - 发布并开源新一代大模型GLM-4.6,在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升 [4] - 在8大权威测试中,GLM-4.6在部分榜单表现对齐Claude Sonnet 4/Claude Sonnet 4.5,稳居国产模型首位 [6] - 在真实编程评测中,GLM-4.6实测超过Claude Sonnet 4,同时平均token消耗比GLM-4.5低30%,为同类模型最低 [8] - 已在寒武纪国产芯片上实现FP8+Int4混合量化部署,是首套投产的芯片一体化方案,同时基于vLLM框架也能在摩尔线程新一代GPU上以原生FP8精度稳定运行 [10] 阿里通义Qwen模型进展 - 发布视、听、说全模态同传大模型Qwen3-LiveTranslate-Flash,覆盖18种语言的离线和实时两种音视频翻译能力 [11][13] - 实现最低3秒延迟的同传体验,采用语义单元预测技术,实现与离线翻译几乎无损的翻译质量 [13] - 在中英及多语言语音翻译准确度方面显著优于Gemini-2.5-Flash、GPT-4o-Audio-Preview和Voxtral Small-24B等主流大模型 [13] - 首次引入视觉上下文增强技术,提升对嘈杂音频、一词多译及专有名词翻译的精度 [17] 蚂蚁集团万亿参数模型 - 开源自研的首个万亿参数大模型Ring-1T-preview,其自然语言推理能力已相当亮眼 [18] - 在数学能力测试AIME 25上取得92.6分,超越所有已知开源模型及Gemini 2.5 Pro,更接近GPT-5(无工具使用)的94.6分 [20] - 在代码生成领域的CodeForces测试中斩获94.69分,直接超过GPT-5 [20] - 在LiveCodeBench、ARC-AGI-v1等权威榜单上位列开源模型首位,并在国际奥林匹克数学竞赛测试中展现出强大的逻辑与数学推理潜力 [22] 智源RoboBrain-X0开源 - 开源RoboBrain-X0,一个能够在零样本泛化、少量样本微调条件下驱动多种不同真实机器人完成复杂任务的跨本体基座大模型 [23] - 通过统一建模视觉、语言与动作,实现了跨本体的泛化与适配,具备从感知到执行的一体化能力 [24] - 同步开源RoboBrain-X0-Dataset,涵盖多模态问答、开源动作、产业合作及自采数据,构建覆盖“感知—思考—行动”的全链路训练基石 [24]
AI圈“集体开大”!DeepSeek、Claude带头,智谱、阿里、蚂蚁、智源都“卷”起来了