微软发布自研AI模型MAI系列 - 公司于当地时间8月28日发布了两款关键人工智能产品:大语言模型MAI-1预览版和语音生成模型MAI-Voice-1 [3] - MAI-1预览版是公司首个从头到尾自主训练的大语言模型,已在社区评测平台LMArena向公众开放测试 [3] - MAI-Voice-1语音生成模型已集成至Copilot Daily、Podcasts等应用,并在Copilot Labs提供体验 [3] 产品性能与技术细节 - MAI-1预览版在大约1.5万张英伟达H100 GPU上完成预训练和后训练,并已运行在最新的GB200芯片集群之上 [4] - 在LMArena的排行榜中,MAI-1预览版在文本任务上的表现位列第13名,落后于Anthropic、DeepSeek、谷歌、Mistral、OpenAI和xAI的模型 [4] - MAI-Voice-1能在单张GPU上不到一秒钟生成一分钟高保真音频,是当前效率最高的语音系统之一 [4] 战略动机与行业竞争 - 推出自研模型标志着公司在战略上减少对OpenAI的单一依赖,两家公司的关系中出现了新变化 [5] - 公司人工智能部门首席执行官穆斯塔法·苏莱曼表示,作为全球市值最高的公司之一,微软必须拥有内部专业技术来打造世界领先的模型 [12] - 公司过去数年累计向OpenAI投入逾130亿美元,但近期OpenAI在云端算力上更多依赖CoreWeave、谷歌与甲骨文,伙伴关系已不再如往昔般牢固 [8] - 公司去年已将OpenAI加入到其年度报告中的竞争对手名单,与亚马逊、苹果、谷歌和Meta并列 [8] 研发资源与未来规划 - 公司正在搭建一个规模庞大的GB200集群,该集群将供OpenAI、MAI项目以及推理合作伙伴共同使用,并着手建设全球规模最大的GB200与GB300芯片集群 [16] - 公司表示未来五年的发展路线图已十分明确,规模重要但效率同样关键 [16] - 公司计划在未来几周内逐步将MAI-1预览版部署到Copilot的部分文本场景中 [3] - 公司已经启动了下一代模型(MAI-2)的研发工作,新模型的规模将更大,计划在未来几个月到几年内公布更多进展 [25] 产品整合与商业化 - 公司的目标是打造一个“面向所有人的AI”,既要可靠、负责任,又要具备个性化与专业性,最终成为用户获取知识与能力的入口 [7] - 未来关键的知识产权将是“编排器”,该系统能决定在何时为特定查询选择哪款模型,公司会使用第三方模型、OpenAI模型及开源模型 [13] - 模型全面融入公司各类产品线的过程将很快启动,未来可能会通过Foundry API向更多用户开放模型使用权限 [23] - 公司对MAI模型未来开源的可能性持开放态度,但当前首要任务是测试模型在产品中的实际表现并收集反馈 [24] 团队建设与人才策略 - 公司AI团队近年来不断扩张,除吸纳苏莱曼创办的Inflection大量员工外,还招募了来自谷歌DeepMind的十余位研究人员 [7] - 团队已扩展至数百人,整体招聘工作按计划推进,公司通过证明能用较少GPU资源与高质量数据打造世界级模型来吸引顶尖人才 [20][21]
微软推出两款MAI-1系列自研模型,下一代模型MAI-2研发工作已启动