Workflow
微软(04338)
icon
搜索文档
微软AI自研大模型亮相,语音模型定制化程度高,CEO谈与OpenAI关系
搜狐财经· 2025-09-01 02:36
微软AI模型发布 - 公司推出两款全自研AI模型MAI-1-preview和MAI-Voice-1 标志着AI技术自研道路的重要里程碑 [1] - MAI-Voice-1提供高保真音频和高度定制化特性 支持40种语体风格及多种情绪模式和角色扮演 [1] - MAI-1-preview为混合专家模型 在约1.5万个英伟达H100 GPU上完成预训练和后训练 主打指令遵循和日常问题解答能力 [3] 模型应用与部署 - MAI-Voice-1已上线Copilot Daily和Podcasts平台 用户可通过Copilot Labs体验 暂不支持中文输出 [3] - MAI-1-preview将在未来几周内应用于Copilot部分文本场景 以获取用户反馈并优化体验 [3] 战略定位与合作关系 - 公司强调将继续与OpenAI等企业合作并使用开源模型 但自研模型可确保公司始终拥有选择权和战略主动权 [3] - 公司在AI模型开发中注重效率而非单纯规模 精挑细选高质量训练数据以优化GPU迭代效果 [4] 技术理念与未来规划 - 公司认为AI模型本质是"空心的" 可解释性研究虽有意义但不会揭示意识本质 反对盲目拟人化 [4] - 公司制定五年AI发展路线图 预计未来出现数百万种人格特质的AI模型 并考虑将自研模型开源 [4]
微软推出两款MAI-1系列自研模型,下一代模型MAI-2研发工作已启动
36氪· 2025-08-31 00:37
微软发布自研AI模型MAI系列 - 公司于当地时间8月28日发布了两款关键人工智能产品:大语言模型MAI-1预览版和语音生成模型MAI-Voice-1 [3] - MAI-1预览版是公司首个从头到尾自主训练的大语言模型,已在社区评测平台LMArena向公众开放测试 [3] - MAI-Voice-1语音生成模型已集成至Copilot Daily、Podcasts等应用,并在Copilot Labs提供体验 [3] 产品性能与技术细节 - MAI-1预览版在大约1.5万张英伟达H100 GPU上完成预训练和后训练,并已运行在最新的GB200芯片集群之上 [4] - 在LMArena的排行榜中,MAI-1预览版在文本任务上的表现位列第13名,落后于Anthropic、DeepSeek、谷歌、Mistral、OpenAI和xAI的模型 [4] - MAI-Voice-1能在单张GPU上不到一秒钟生成一分钟高保真音频,是当前效率最高的语音系统之一 [4] 战略动机与行业竞争 - 推出自研模型标志着公司在战略上减少对OpenAI的单一依赖,两家公司的关系中出现了新变化 [5] - 公司人工智能部门首席执行官穆斯塔法·苏莱曼表示,作为全球市值最高的公司之一,微软必须拥有内部专业技术来打造世界领先的模型 [12] - 公司过去数年累计向OpenAI投入逾130亿美元,但近期OpenAI在云端算力上更多依赖CoreWeave、谷歌与甲骨文,伙伴关系已不再如往昔般牢固 [8] - 公司去年已将OpenAI加入到其年度报告中的竞争对手名单,与亚马逊、苹果、谷歌和Meta并列 [8] 研发资源与未来规划 - 公司正在搭建一个规模庞大的GB200集群,该集群将供OpenAI、MAI项目以及推理合作伙伴共同使用,并着手建设全球规模最大的GB200与GB300芯片集群 [16] - 公司表示未来五年的发展路线图已十分明确,规模重要但效率同样关键 [16] - 公司计划在未来几周内逐步将MAI-1预览版部署到Copilot的部分文本场景中 [3] - 公司已经启动了下一代模型(MAI-2)的研发工作,新模型的规模将更大,计划在未来几个月到几年内公布更多进展 [25] 产品整合与商业化 - 公司的目标是打造一个“面向所有人的AI”,既要可靠、负责任,又要具备个性化与专业性,最终成为用户获取知识与能力的入口 [7] - 未来关键的知识产权将是“编排器”,该系统能决定在何时为特定查询选择哪款模型,公司会使用第三方模型、OpenAI模型及开源模型 [13] - 模型全面融入公司各类产品线的过程将很快启动,未来可能会通过Foundry API向更多用户开放模型使用权限 [23] - 公司对MAI模型未来开源的可能性持开放态度,但当前首要任务是测试模型在产品中的实际表现并收集反馈 [24] 团队建设与人才策略 - 公司AI团队近年来不断扩张,除吸纳苏莱曼创办的Inflection大量员工外,还招募了来自谷歌DeepMind的十余位研究人员 [7] - 团队已扩展至数百人,整体招聘工作按计划推进,公司通过证明能用较少GPU资源与高质量数据打造世界级模型来吸引顶尖人才 [20][21]
微软宣布将终止Windows域控制器注册表键支持 彻底修复Kerberos高危漏洞
环球网· 2025-08-30 10:37
微软安全更新调整 - 公司将于2024年9月9日停止对Windows域控制器中两项特定注册表键的技术支持并移除自2022年起保留的临时修复机制[1] - 此举旨在彻底解决Kerberos认证协议的高危漏洞[1] 漏洞技术细节 - 调整涉及CVE-2022-34691、CVE-2022-26931和CVE-2022-26923三个漏洞[3] - 漏洞均与Windows域控制器使用的Kerberos认证协议相关[3] - Kerberos是Windows Active Directory核心身份验证机制[3] - 漏洞利用可导致攻击者绕过认证流程获取域管理员权限或伪造票据实施横向渗透[3] 历史修复与兼容性 - 微软在2022年8月补丁日发布修复程序但为兼容旧系统保留了部分注册表键的临时支持[3] - 自2022年漏洞披露后公司建议企业禁用相关功能以降低风险[3] - 部分旧系统仍依赖这些注册表键运行[3] 更新实施影响 - 9月9日更新后相关配置将不再生效[3] - 系统将强制要求域控制器使用符合最新安全标准的Kerberos实现[3]
AI赛道新战况:微软谷歌苹果及微美全息竞相布局大模型
搜狐财经· 2025-08-30 10:12
微软AI自研进展 - 公司人工智能部门发布两款自研AI模型:MAI-Voice-1语音模型和MAI-1-preview通用模型 [1] - MAI-Voice-1模型仅需单块GPU即可快速生成一分钟音频内容 并应用于Copilot Daily功能的AI新闻播报和播客风格对话生成 [1] - MAI-1-preview模型已在LMArena平台公开测试 计划逐步融入Copilot助手以减少对OpenAI模型的依赖或增强功能 [1] 谷歌与苹果AI动态 - 谷歌DeepMind推出Gemini 2.5 Flash图像编辑模型 能依据文字指令精确修改图像并保持角色外观一致性 其图像修改准确率超越GPT-4模型 [2] - Gemini 2.5 Flash具备“角色一致性”功能 可在生成多张图像时保持同一对象外观 适用于系列照片创作和产品目录批量制作 [2] - 苹果公司高层正洽谈收购欧洲AI初创公司Mistral或Perplexity AI 以提升其在AI领域的竞争力 [2] 微美全息技术布局 - 公司构建“硬件+软件+平台”一体化能力 加速AI算法在各类场景中的应用落地 [4] - 致力于多模态大模型与空间计算技术融合 实现文本、图像、音频、视频等多模态数据的原生级整合 并重点布局文本生成视频、图像生成视频等场景 [5] - 开放模型代码、算力接口及技术工具链 构建覆盖云端与边缘端的“全息云”平台 为开发者提供二次开发支持 [5]
巨头竞逐AI新赛道:微软首推大模型,谷歌苹果微美全息紧随其后
搜狐财经· 2025-08-29 23:54
微软AI模型发布 - 推出MAI-Voice-1语音模型 仅需单块GPU即可在短时间内生成长达一分钟的音频内容[1] - MAI-Voice-1应用于Copilot Daily功能 AI主持人实时播报热点新闻并生成播客风格对话[1] - 推出MAI-1-preview通用模型 在AI基准测试平台LMArena公开测试 计划逐步应用于Copilot助手特定文本场景以替代或增强对OpenAI模型的依赖[1] 谷歌DeepMind图像模型进展 - 推出Gemini 2.5 Flash图像编辑模型 根据文字指令精准修改图像并保持人物与动物外观一致性[2] - Gemini 2.5 Flash图像修改准确率显著提升 在多项任务中超越ChatGPT所用的GPT-4模型[2] - 具备"角色一致性"功能 生成多张图像时保持同一对象外观一致性 适用于系列照片创作和产品多角度展示[4] 苹果AI战略动向 - 高管正商讨收购欧洲最大AI初创公司Mistral或Perplexity AI[4] - Mistral AI通过多轮融资筹集巨额资金 若收购成功将极大增强苹果在AI领域的实力和创新力[4] 微美全息技术布局 - 通过"硬件+软件+平台"一体化能力构建竞争壁垒 加速AI算法场景化落地[6] - 推动多模态大模型与空间计算技术结合 实现文本/图像/音频/视频等多模态数据的原生级融合[6] - 重点布局文本生成视频和图像生成视频场景 为剧情创作和短视频生成提供应用空间[6] - 开放模型代码/算力接口及技术工具链 构建覆盖云端与边缘端的"全息云"平台支持开发者二次开发[6] - 凭借多模态处理能力与跨行业场景落地经验 成为大模型变革背后的关键力量[6]
AI进化速递 | 微软正式推出其首批两款自研AI模型
第一财经· 2025-08-29 21:06
阿里巴巴AI业务进展 - 阿里云AI收入占比已超过20% [1] 人工智能政策支持 - 国家发改委推出多项措施支持人工智能发展 [2] - 将发放算力券降低创新主体研发成本 [2] 行业技术发展动态 - xAI推出智能代码生成模型Grok Code Fast 1 [3] - 新模型限时免费开放使用 [3] - 微软正式推出首批两款自研AI模型 [4] - 包括MAI-Voice-1语音模型与MAI-1-preview通用模型 [4]
微软争分夺秒首款大模型出炉,谷歌/苹果/微美全息大模型升级跟进行业AI浪潮
搜狐财经· 2025-08-29 14:52
微软AI模型发布 - 微软人工智能部门推出首批两款自研AI模型MAI-Voice-1语音模型与MAI-1-preview通用模型 [1] - MAI-Voice-1语音模型仅需单块GPU在1秒内生成1分钟音频 MAI-1-preview模型展示Copilot未来发展方向 [2] - MAI-Voice-1已应用于Copilot Daily新闻播报和播客风格对话生成 MAI-1-preview开始应用于Copilot文本场景并在LMArena平台公开测试 [4] 谷歌AI模型升级 - 谷歌DeepMind推出Gemini 2.5 Flash图像编辑模型 可根据文字指令修改图片并保持人物与动物外观一致 [6] - 新模型在文字修改图像时准确率更高 多项任务表现优于ChatGPT的GPT-4o [6] - Gemini 2.5 Flash具备角色一致性功能 可保持同一人物动物或物体外观一致 适用于系列照片和产品多角度展示 [8] 科技巨头AI布局动态 - 苹果高管讨论收购欧洲AI初创公司Mistral或Perplexity AI Eddy Cue是内部最积极支持者 [8] - Mistral AI通过七轮融资总共筹集11亿欧元 收购可能增强苹果AI能力和创新能力 [8] - 头部大模型性能提升适配算力加速AI生态繁荣 科技大厂研发强劲 AI应用和算力领域发展前景可期 [10] 微美全息AI技术布局 - 微美全息具备硬件设计软件开发能力 通过硬件+软件+平台一体化构建竞争壁垒 [11] - 公司推动多模态大模型与空间计算技术结合 实现文本图像音频视频多模态数据融合 重点布局文本生成视频和图像生成视频场景 [11] - 开放模型代码算力接口及技术工具链 构建全息云平台支持开发者调用DeepSeek等通用大模型进行二次开发 [12] AI技术商业化进展 - DeepSeek-V3 1大模型发布推动AI技术商业化应用 阿里云升级表格存储Tablestore的AI Agent记忆存储功能 [13] - AI市场渗透分阶段推进 未来可拓展至家居养老宠物陪伴等领域持续扩大市场覆盖 [13]
微软AI首个自研模型来了,实测可玩性超强,CEO回应与OpenAI隔阂
36氪· 2025-08-29 14:45
微软AI模型发布 - 微软AI推出首批两款全自研AI模型 包括端到端基础模型MAI-1-preview和语音生成模型MAI-Voice-1 [1] - MAI-Voice-1提供高保真音频 支持至少40种语体风格和多种角色扮演 包括情绪模式和声音模板定制 [1] - MAI-1-preview为混合专家模型 在1.5万颗英伟达H100 GPU上完成预训练和后训练 主打指令遵循和日常问题解答能力 [2] 语音模型技术特性 - MAI-Voice-1生成速度达1秒输出1分钟音频 可在单块GPU上运行 但暂不支持中文输入 [2] - 语音模型已上线Copilot Daily和Podcasts 用户可通过Copilot Labs体验 [1] 战略定位与合作伙伴关系 - 微软AI CEO强调自研模型计划始于14个月前 旨在确保内部专业能力和模型选择权 [4][6] - 公司将继续与OpenAI及开源模型合作 未来核心知识产权在于模型编排器(路由器) [6][7][8] - 明确否认与OpenAI关系疏远 称合作"非常成功"且将进一步深化 [9] 训练效率与资源投入 - MAI-1-preview使用1.5万颗H100 GPU训练 集群规模小于行业顶级(对比10万颗H100)但实现世界级性能 [10][12] - 强调数据选择效率 避免无意义token算力浪费 未来将使用世界最大规模GB200/GB300集群 [5][12] - 团队规模达数百人 招聘顺利且无需过度扩张 [25][26] 模型能力与发展方向 - MAI-1-preview被定义为"人格原材料" 通过后训练可呈现数百万种人格特质 [4][16][19] - 模型在多模态方向持续扩展 已在主流基准测试进行通用性训练 [11] - 下一代模型MAI-2已在开发中 规模更大且采用新训练方案 [34] 技术哲学与风险认知 - 认为大模型本质"空心" 可解释性研究属于拟人化误区 不会揭示意识本质 [20][22] - 否认模型会涌现自主欲望或动机 强调后训练对行为控制的有效性 [23][24] - 呼吁行业提前思考AI社会影响 避免盲目追求人类能力模仿 [15] 产品化进程 - MAI-1-preview将于未来几周内应用于Copilot文本场景 后续可能通过Foundry API开放给外部开发者 [2][32] - 不排除未来开源可能 当前优先聚焦产品迭代和客户反馈 [33]
微软发布首批自主研发的人工智能模型
环球网· 2025-08-29 14:15
产品发布 - 微软人工智能部门发布首批自主研发的人工智能模型 包括MAI-Voice-1语音模型和MAI-1-preview通用模型 [1] - MAI-Voice-1语音模型仅需单块GPU即可在不到一秒的时间内生成一分钟的音频 [2] - MAI-1-preview通用模型展现了Copilot未来产品的雏形 [2] 技术特性 - MAI-Voice-1已应用于Copilot Daily功能 AI主持人基于该模型播报头条新闻并生成播客风格讨论 [2] - 用户可在Copilot Labs试用MAI-Voice-1 支持输入朗读内容并更改声音和说话风格 [2] - MAI-1-preview为特定需求用户设计 具有遵循指令能力 可对日常查询提供有用响应 [2] 战略方向 - 公司内部人工智能模型不专注于企业应用场景 重点创造对消费者极其有效的产品 [2] - 模型优化基于广告和消费者行为数据等极具预测性和实用性的数据资源 [2] - 研发重点在于构建真正适合陪伴消费者的模型体系 [2]
微软和EA放弃游戏涨价,可这不是玩家的全面胜利
36氪· 2025-08-29 07:53
核心观点 - EA和微软放弃将游戏定价从70美元提升至80美元的计划 维持现有定价策略 [1][3] - 游戏行业面临开发成本上升和用户规模停滞的双重压力 但玩家对价格敏感度极高 导致厂商暂缓涨价 [7][13][15] 定价策略调整 - EA首席执行官明确表示当前财年不会调整游戏定价 《战地6》将维持70美元售价 [1][3] - 微软游戏部门确认《天外世界2》及其他假期全价游戏均按69.99美元发售 放弃80美元定价方案 [3] - 两家公司均强调通过在线服务和多定价方案提升玩家生命周期价值(LTV)而非直接涨价 [3] 财务压力背景 - EA 2026财年Q1净利润同比下滑28.2%至2.01亿美元 2023年以来持续进行项目取消、重组和裁员 [4] - 微软因800亿美元AI投资和768亿美元动视暴雪收购案进行资源重组 游戏部门裁员9000人 [7] - 游戏开发成本持续攀升 开发者工资上涨 市场竞争加剧导致行业陷入内卷状态 [11] 行业历史定价分析 - 游戏行业60美元定价标准形成于1990年代中期 持续近20年未调整 [9] - 2020年首次从60美元涨至70美元 四年后尝试涨至80美元遭强烈反对 [7][9] - 若计入通货膨胀 游戏实际价格在过去20年呈下降趋势 [9] 玩家行为变化 - Newzoo数据显示2021年以来每年只玩1-3款游戏的玩家占比持续上升 成为主流群体 [13] - 玩家将游戏视为廉价娱乐手段 80美元定价意味着较60美元基础上涨33% 超出承受范围 [7][13] - 社交媒体大规模反对声浪直接影响厂商决策 玩家明确表示涨价即拒绝购买 [7] 潜在行业演变 - 厂商可能转向通过DLC扩展内容拉长付费周期 降低消费痛感 [15] - 游戏发售时提供半成品再逐步完善的模式或更普遍 70美元购买完整体验的模式面临挑战 [15] - 定价策略转向侧重在线服务和多层次定价而非直接提高基础售价 [3][15]