MiniMax M2.7
搜索文档
腾讯QClaw宣布版本更新,微信入口升级为小程序;MiniMax发布新一代大模型M2.7丨AIGC日报
创业邦· 2026-03-19 08:09
腾讯QClaw产品更新 - 腾讯本地AI助手QClaw于3月18日宣布版本更新并扩大内测范围,其微信入口升级为小程序,支持上传或接收电脑端文件[2] - 该产品将陆续支持在小程序快速创建定时任务、实时接收任务消息、远程切换底层模型等能力,并同步上线“灵感广场”,预置常用任务与skills,用户无需编写指令即可一键使用[2] 阿里云产品价格调整 - 阿里云于3月18日发布公告,因全球AI需求爆发及供应链涨价,其AI算力、存储等产品最高涨价34%[2] - 具体而言,平头哥真武810E等算力卡产品价格上涨5%-34%,文件存储产品CPFS(智算版)价格上涨30%[2] - 此次涨价的另一个重要原因是“Token调用量暴涨”,阿里云的MaaS业务百炼在2024年1月至3月创下历史最高增速,公司正在将紧缺的AI算力资源向Token业务倾斜[2] 德国AI算力发展规划 - 德国政府于3月17日公布一项数据中心扩容战略规划,计划到2030年,将通用数据中心的算力在2025年基础上至少翻一番[2] - 规划中专门用于人工智能的算力,到2030年将至少增至2025年水平的4倍[2] MiniMax发布新一代大模型 - MiniMax于3月18日发布新一代Agent旗舰大模型M2.7,首次展示“模型自我进化”路径[2] - 该模型通过构建Agent Harness体系深度参与自身训练与优化流程,在部分研发场景中可承担30%-50%的工作量,并在内部评测集上实现约30%的效果提升[2] - 在核心能力上,M2.7在SWE-bench Pro中取得56.22%的成绩,同时在VIBE-Pro、Terminal Bench 2等真实工程测试中支持端到端项目交付与复杂系统理解[2] - 在办公场景方面,其在GDPval-AA的ELO得分为1495,为开源最高,并提升了Office文档处理与多轮编辑能力[2] LiblibAI推出AI视频创作产品 - LiblibAI于3月18日宣布推出AI视频创作产品LibTV[2] - 公司表示,如果用户在使用小龙虾等Personal Agent,可以直接调用LibTV的创作能力[2]
实测MiniMax M2.7:上能拆英伟达,下能演我爸妈
36氪· 2026-03-19 07:43
模型迭代与行业趋势 - 公司模型迭代速度显著加快,MiniMax M2.7在M2.5发布仅一个月后上线,期间跨越了春节假期[1] - 行业共识认为AI将向“递归式自我改进”发展,系统将以人类无法理解的速度学习,并重塑人类运作方式[1] - 当前行业工程路径具体化为:用模型生成数据、用模型做评测、让模型参与代码修改和实验流程[1] - 模型被置于可不断试错和反馈的循环系统中,模型既是执行者也是部分决策者,人类更多退居设定目标和边界的角色[1] 核心能力与Benchmark表现 - 新模型强调其“Agent Harness”能力,旨在将多人协作的研发流程压缩进一个可持续运行的循环,由模型承担更多环节[2] - 在工程执行类任务中已进入第一梯队,在SWE Bench Pro上的表现接近或超过部分一线模型[5] - 在VIBE-Pro端到端项目任务中同样处于第一梯队,具备从需求到交付的完整产出能力[5] - 在MM-ClawBench等多步骤长流程Agent测试中表现接近头部模型,表明其具备稳定的长流程执行能力[5] - 在更偏研究和复杂推理的任务(如MLE-Bench)上仍有进步空间,这类任务目前仍是头部模型的优势区间[6] 多角色交互与一致性测试 - 在模拟家族微信群聊的测试中,模型成功维持了多个角色的人格状态、角色关系,并实现了自然的互动碰撞[8][9][19] - 测试要求模型同时维持三个AI角色(父亲、母亲、弟弟)的独特说话方式、关注点及相互关系,并实现了高还原度的交互[8][9] - 对于不同角色,模型会分别调用,而非一次性生成所有对话,这要求模型具备同时处理多线程角色状态的能力[19] 自主智能体(Agent)开发能力 - 在Agent Harness测试框架下,模型使用提供的五个工具,成功完成了从零开发一个霓虹灯风格数字时钟的任务,过程流畅高效[22][24] - 在开发贪吃蛇游戏的复杂任务中,模型展示了自主规划、编码、检查、调试和交付的完整工作流,共消耗25882个token,在5轮内完成[25][27][28][29][30][32][34] - 开发过程并非一帆风顺,模型在早期迭代中曾出现工具调用格式错误,但能自我纠正,这表明其具备自主调试和迭代能力[36] - 从简单任务到复杂任务的测试,展现了模型作为智能体高效执行和自主调试的两面性,这正对应其核心的Agent Harness能力[36] 复杂数据处理与专业内容生成 - 在基于英伟达FY2026财报(总营收$2,159亿,同比增长+65.5%)的分析任务中,模型生成了投行风格的深度研究报告、交互式财务仪表盘和12页演示文稿[39][40][41][42] - 模型展示了对复杂金融数据的理解能力、对多种输出格式(报告、仪表盘、PPT)的驾驭能力,以及生成专业级可视化内容的能力[43] - 该测试直接对应了官方宣传的复杂Office自动化能力,在金融分析场景下能输出接近专业水准的内容[43] 未来方向与生态建设 - 公司正在构建名为OpenRoom的Agent交互系统,将AI互动置于万物皆可互动的Web GUI空间,其原型项目已开源,且大部分代码由AI编写[44] - 该系统理念是“对话即驱动”,实现实时视觉反馈与场景交互,旨在探索人与Agent之间全新的交互方式[45] - 随着模型Agentic能力的提升和社区共建,该系统有望持续进化[45] - 评测整体感受表明,模型正从“问答工具”转变为可被嵌入系统持续运转的“搭档”,开始参与并推进完整流程,而不仅负责单点输出[45]
腾讯研究院AI速递 20260319
腾讯研究院· 2026-03-19 00:06
生成式AI - **OpenAI发布轻量级模型GPT-5.4 mini和nano,性价比显著提升**:GPT-5.4 mini在SWE-Bench Pro编码测试中得分达54.4%,仅比满血版低3.3%,在计算机使用OSWorld测试中达72.1%媲美旗舰版;其输入价格为每百万token 0.75美元,输出价格为4.5美元,仅为GPT-5.4价格的1/3;GPT-5.4 nano价格更低至输入每百万token 0.2美元,输出1.25美元,并已向ChatGPT免费用户开放 [1] - **OpenAI提出子智能体架构,优化资源使用**:公司提出“大模型决策+小模型执行”的子智能体架构,GPT-5.4 mini在Codex中仅消耗旗舰版配额的30%,尽管长上下文处理仍是短板,但分层调度思路正成为行业共识 [1] - **Anthropic推出跨设备Agent功能Dispatch**:通过Cowork新功能Dispatch,用户可通过手机扫码配对远程指挥Mac上的Claude操作电脑,实现从“盯着AI干”到“AI自己干”的跨设备Agent跃迁 [2] - **Dispatch功能实测表现与部署策略**:MacStories实测综合成功率约50%,能完成文件查找、Notion操作、邮件总结等任务,但打开应用、跨应用发送和Safari操作仍失败;该功能目前仅面向Max订阅用户,所有操作在本地Mac执行不经过云端,手机仅作为遥控器,与此前面向程序员的Claude Code Remote Control形成双线布局,覆盖GUI桌面和命令行两大场景 [2] - **MiniMax发布首个深度参与自我迭代的大模型M2.7**:M2.7是首个模型深度参与自身迭代的模型,能自主构建RL Harness、更新记忆、驱动强化学习并优化过程,在内部脚手架上自主迭代超100轮实现30%效果提升 [3] - **M2.7在多项专业测试中表现优异并支持多智能体协作**:模型在SWE-Pro编码测试中得分56.22%接近Opus水平,VIBE-Pro端到端项目交付测试得分55.6%,支持原生Agent Teams多智能体协作,40个复杂skills保持97%遵循率;在GDPval-AA专业办公ELO测试中得分1500为开源最高,可自主完成从研报分析、营收建模到PPT/Word/Excel全套交付,公司同步开源了互动娱乐框架OpenRoom [3] - **腾讯QClaw进行重大更新,降低使用门槛**:微信入口从客服号升级为小程序,支持直接接收电脑端文件,即将支持语音、图片等多模态交互;全新上线“灵感广场”功能,围绕办公提效、深度研究、娱乐游戏等场景预置常用任务和skills,用户无需编写指令即可一键运行 [4] - **QClaw基于OpenClaw封装并计划扩展功能**:该产品基于OpenClaw进行极简封装,主打下载即用的零门槛体验,后续将支持通过小程序创建定时任务、实时接收消息、远程切换底层模型等能力 [4] - **LiblibAI推出同时面向人与Agent的AI视频创作平台LibTV**:该平台同时为人类创作者提供无限画布专业工具和为Agent提供Skill接口,支持从剧本到成片的全流程闭环创作 [5][6] - **LibTV上线多项独家AI能力并实现高性价比**:一次性上线20多个独家AI能力,包括角色三视图、360度角度呈现、多机位9宫格、大师运镜、视频精准编辑等专业控制功能;已发布OpenClaw适配的Skill,Agent可一句话完成从剧本生成到视频剪辑全流程,平台集成可灵3.0等顶级模型,定价比竞品低最高达92% [6] 前沿科技 - **2025年图灵奖授予量子信息科学奠基人**:ACM将2025年图灵奖授予Charles Bennett和Gilles Brassard,表彰二人创建量子信息科学基础,这是图灵奖首次颁给与量子物理直接相关的研究 [7] - **获奖者贡献奠定了量子通信与互联网的基石**:两人于1984年提出的BB84量子密码协议,其安全性直接根植于量子力学定律而非数学假设;1993年又证明量子隐形传态可行,奠定了量子互联网的技术基石 [7] - **量子信息领域从边缘想法发展为战略领域**:二人合作始于1979年,历经四十余年将量子信息从边缘想法发展为拥有完整学科体系和国家战略的领域,BB84协议的变体已在全球量子通信网络中实际部署 [7] 报告观点 - **Anthropic内部Skill构建已形成体系化经验**:公司Claude Code团队内部已积累数百个活跃Skills,并将其归纳为9大类型,包括库和API参考、产品验证、数据获取分析、业务流程自动化等 [8] - **Skill构建的核心最佳实践**:核心经验包括将Skill视为文件夹而非单个Markdown文件,利用文件系统实现渐进式信息披露;内容应聚焦“常见坑”专区而非陈述显而易见的知识;给予方向而非剧本避免过度约束 [8] - **推荐实现Skill记忆与效果衡量的方法**:推荐使用日志文件或SQLite实现Skill记忆能力,通过PreToolUse Hook记录调用日志来衡量效果,并建议团队建立内部插件市场以实现Skills的发现与分发 [8] 行业动态与战略 - **月之暗面提出重构Transformer底层技术路线**:公司创始人杨植麟认为单纯堆算力不够,需对优化器、注意力机制和残差连接等底层基石进行重构,推出的Kimi Linear和Attention Residuals方案获得Karpathy和马斯克高度评价 [9] - **月之暗面将Kimi进化逻辑归纳为三个维度并实现高估值增长**:公司将Kimi进化逻辑归纳为Token效率、长上下文和智能体集群三个维度的共振,K2.5通过Orchestrator机制将复杂任务拆解给数十个子Agent并行处理;公司估值从去年底的43亿美元在不到半年内跳涨至180亿美元,正进行10亿美元融资,并计划继续开源MuonClip、Kimi Linear等底层创新 [9] - **英伟达CEO黄仁勋对AI影响持乐观态度并发布新产品**:黄仁勋表示AI不会让人失业,反而会让人更忙碌,因为30分钟完成过去一个月的工作意味着人们将持续处于执行关键任务中 [10] - **英伟达发布新一代产品并大幅上调收入预期**:公司发布Rubin架构的7颗芯片和5个机架等新品,将加速芯片收入预期提至1万亿美元;展望10年后,公司员工将从4.2万增至7.5万,并配备750万个全天候工作的智能体 [11] - **英伟达高度看好OpenClaw生态**:黄仁勋高度看好OpenClaw,称其为开源代理式AI标准,类比Linux生态将持续获得全球开发者贡献,英伟达已针对性推出NemoClaw软件栈 [11]
Agent时代“龙虾”只是前菜,企业家最关心如何用AI做好管理
第一财经· 2026-03-18 23:53
文章核心观点 - AI智能体(如“龙虾”)是当前商界关注的技术焦点,但其核心意义在于引发对通用人工智能(AGI)时代管理逻辑和组织形态系统性变革的思考,企业家的重点应从追逐具体产品转向修炼内功,以驾驭AI变革浪潮 [3][9] AI在企业管理中的应用与价值 - AI智能体被定义为高管的“隐形助理”,通过高效信息处理和多角度数据支持,提升复杂决策的质量和效率,规避经营风险,但其推广需视具体决策场景而定 [5] - 在执行层,AI正致力于打破场景壁垒,通过深度集成至办公软件(如读取聊天、文档、日历等),成为员工的真正工作助理,指导并协助完成任务 [5] - AI的应用为办公软件带来新商机,其能力使AI能落地到丰富场景,促进各业务战线联合发力,并为新应用(如微信agent)的开发带来启发 [6] AI驱动的组织与生产力变革 - AI推动了“超级个体”的崛起,现实案例显示两人即可运营九百万用户的社区 [6] - 未来组织形态将趋向小型化,预计3至5人的小团队即可交付传统需30人的项目,导致产品、运营与设计等岗位结构被重构和整合 [6] - 在“人机共同体”时代,不善于使用AI的个人将面临淘汰风险,而善于利用AI杠杆的创作者和企业可通过“技能打包”实现价值最大化 [6] 底层技术范式与产业影响 - 人工智能发展正从生成式AI走向智能体AI,智能体在消费、工业、科学领域均有应用 [7] - 基础大模型被视为AI时代的操作系统,其规模将远超PC和移动时代的操作系统,而智能体则被视作未来的SaaS和APP,成为主要交互界面 [8] - 部分SaaS公司近期股价暴跌被认为是市场错杀,许多公司价值会更高,因为它们正在自主开发智能体(Agent) [8] - 大模型本身也在利用智能体实现自我进化,例如MiniMax发布的M2.7模型展示了“模型自我进化”路径,通过构建复杂的智能体执行框架,让模型参与数据处理、实验设计、训练调优等完整研发流程 [8] - 在部分研发流程中,M2.7智能体已可承担30%至50%的工作量,显著降低了人工介入频率 [9] - 进入智能体时代后,互联网的架构、逻辑和商业模式将被颠覆,未来公司需要具备数据、tokens和模型等关键要素,人类的工作形态也将发生根本改变 [9]
全行业都在忙着“吃虾”,MiniMax M2.7已经让虾自己拿起筷子了
量子位· 2026-03-18 19:32
MiniMax M2.7模型发布与核心能力跃升 - 公司于M2.5发布仅一个月后,再次重磅推出全新的M2.7模型 [1] - 新模型的推理、工程能力及处理复杂任务与多智能体协作能力显著增强 [2][3] 核心性能亮点与基准测试表现 - 在指令遵循与多智能体协作方面表现稳健,在包含40个复杂技能的场景下保持97%的遵循率,在MM-Claw“龙虾测试”中正确率达62.7%,直逼Claude Sonnet 4.6 [8] - 代码能力从生成拓展至高阶领域,在SWE-Pro测试中以56.22%的正确率追平GPT-5.3-Codex [10][11] - 在办公场景处理能力上,于GDPval-AA评测中ELO评分位列开源第一,并超越GPT-5.3 [13] - 原生支持十种语言,并在角色扮演场景中强化了人设稳定性与对话情商 [16] 多智能体协作与复杂任务执行能力 - 模型原生支持多智能体协作,无需外部框架即可组建Agent团队,能稳定锚定身份并自主决策,协作完成长流程任务 [8] - 实测中成功统筹1个主持人和5个玩家Agent,完成“谁是卧底”游戏的全套搭建,包括撰写独立人设文件、开发后台程序与前端网页 [20][21][23] - 六个原生Agent能基于规则在游戏房间内进行顺畅交流,并完全自主地跑通整个游戏流程 [27][28] 工程与系统故障排查实战能力 - 在模拟真实生产环境的SRE级故障排查测试中,能迅速从复杂日志中精准定位导致数据库CPU飙升的根本原因 [30][31] - 提供的紧急恢复脚本专业地使用了PostgreSQL的CONCURRENTLY语法执行非阻塞建库索引,严格遵守生产环境“严禁锁表”的安全红线 [32][33] - 能生成完整、规范的数据库迁移文件代码,可直接用于提交合并请求 [35] 技术底层进化:自我构建与迭代能力 - 模型具备了自我构建复杂Agent Harness(工具箱/操作台)的能力,不再局限于使用人类提供的工具,而是能够自己创造工具 [39][41] - 在强化学习实验中,给定初始想法后,模型能自主运行实验、监控状态、查看日志、排查故障、修改代码并完成提交合并请求和冒烟测试 [42][43] - 模型能主动迭代优化Harness本身,在内部测试中通过自主试错探索优化路径,使模型在内部评测集上的效果提升30% [45] - 模型具备自主训练和升级机器学习模型的能力,通过短时记忆、自反馈和自优化机制,在MLE Lite的22道高难度竞赛题中,于24小时内自主优化ML模型并取得9金5银1铜的成绩 [47][48] 行业意义与战略定位 - 行业普遍在适配OpenClaw等开源框架以追赶热度,但公司已切入让模型自主造工具、搞研发的新阶段,使模型成为自身研发链条的一环 [49][50][51] - 这种让模型具备主动进化、自我迭代的能力,被认为是决定下一代大模型核心竞争力的关键分水岭 [52] - 具备此能力的M2.7模型,标志着公司已抢先开启模型自我迭代的新纪元 [53]
深V反转!午后万亿巨头直线拉升!原因找到了,阿里官宣:最高涨价34%!
雪球· 2026-03-18 17:13
A股市场表现 - A股三大指数集体上涨 沪指涨0.32%收报4062.98点 深证成指涨1.05%收报14187.80点 创业板指涨2.02%收报3346.37点 [2] - 沪深京三市成交额2.06万亿元 较昨日缩量1635亿元 [2] - 行业板块涨多跌少 通信服务、元件、通信设备、半导体等板块涨幅居前 白酒、能源金属、石油石化板块跌幅居前 上涨股票数量超过3500只 70只股票涨停 [2] 云计算与AI算力服务涨价 - 阿里云宣布对AI算力、存储等产品进行价格上调 最高涨幅达34% 核心源于Token调用量暴涨 其MaaS业务百炼在1-3月创下历史最高增速 [7] - 腾讯云智能体开发平台已完成部分模型计费策略优化调整 其中部分模型涨幅超400% [7] - 百度云宣布对部分产品价格进行结构性优化 AI算力相关产品服务上调约5%~30% 并行文件存储等上调约30% 原因包括全球AI应用发展带来的算力需求攀升及核心硬件成本显著上涨 [7] 港股AI大模型板块表现 - 受阿里消息提振 港股AI大模型板块爆发 MiniMax股价最高涨超27% 收盘涨幅超18% 股价突破1200港元 智谱午后涨超13% 股价逼近700港元 刷新上市以来新高 [9] - MiniMax发布新一代Agent旗舰大模型M2.7 首次展示“模型自我进化”路径 [12] - 根据OpenRouter数据 MiniMax M2.5周调用量达1.75万亿Token 连续五周蝉联全球榜首 中国AI大模型的周调用量已连续两周超越美国 [12] - 摩根大通研报指出 OpenClaw热潮反映人工智能形态由对话向执行层面转变 最早及最直接的受益者可能是模型及推理企业 [13] 存储芯片行业动态 - 存储芯片板块成为A股主线 与美股形成跨市场共振 美股美光科技涨4.5% 股价刷新历史纪录至461.69美元 年内累计涨幅达61% 西部数据涨超9% 希捷科技涨5.59% [15] - A股佰维存储涨超9% 股价续创历史新高 同有科技、诚邦股份、中电港等涨停 [15] - 美光计划在中国台湾铜锣建设第二座大型芯片制造设施 专门扩大高带宽存储产能以支撑激增的AI算力需求 [17] - 美光指引显示平均售价环比涨幅可能接近30% 闪迪预计NAND价格单季暴涨60% OPPO、小米、苹果、三星、戴尔等终端厂商已全面开启涨价模式 [17] - 三星电子最大工会成员正就是否于5月发起罢工进行投票 若未达成协议计划从5月21日起举行为期18天的罢工 工会主席预计罢工将导致平泽半导体工厂减产约一半 [17][18] - 摩根士丹利将美光目标价从350美元大幅上调至450美元 列为半导体板块首选 认为AI驱动的需求增长与供给端产能爬坡缓慢导致供需失衡加剧 预计美光2026年每股收益有望超过52美元 远高于市场普遍预期的12美元 [18] - 东吴证券指出存储芯片正迎来“量价齐升”的超级周期 三星新一代HBM4报价约700美元 较HBM3E高出20%-30% AI服务器对高带宽内存、DDR5及企业级SSD的需求已占据全球内存产能的过半份额 [18] 腾讯音乐业绩与市场反应 - 腾讯音乐港股暴跌22% 隔夜美股跌24.65% 创下近52周新低 [20] - 公司2025年四季报营收、利润均实现双位数增长 但月活跃用户仅5.28亿 同比下滑5% 为上市以来首次明显萎缩 公司宣布自2026年一季度起将停止披露MAU、付费用户数等核心指标 [23] - 字节汽水音乐被视为MAU下滑主因 其MAU已达1.4亿 DAU接近5000万 正在快速蚕食腾讯音乐的基本盘 [23] - 摩根大通将腾讯音乐评级从“增持”下调至“中性” 美股目标价从30美元腰斩至12美元 港股目标价从120港元砍至48港元 认为其投资逻辑已从“清晰的订阅复利”转向“模糊的多元引擎” [23]