Long Context

搜索文档
53万美金训练出顶级AI?揭秘MiniMax的「省钱」绝招
36氪· 2025-06-20 08:11
这几天,MiniMax 搞起了技术周,第一天就放出"王炸",开源了全球首个大规模混合架构推理模型 MiniMax-M1。据最新消息,M1 已经成为全球前二的 开源模型。 MiniMax 分别用最大生成长度的 40K 和 80K token,训练了两个版本的 MiniMax-M1 模型——MiniMax-M1-40k 和 MiniMax-M1-80k。MiniMax-M1-80k 在 复杂的数学和编码任务上优于 MiniMax-M1-40k。 据观察,MiniMax-M1 在全球科技领域引起了强烈的反响。产品不仅迅速占据海外主流媒体如 VentureBeat、Seekingalpha 等重要版面,更获得 Aran Komatsuzaki 等行业 KOL 的深度解读,同时在 TestTM 等国际社交平台引发讨论,形成多维度、跨圈层的传播矩阵。 (全球科技领域大V评论截图) 全球最长上下文,MiniMax-M1 是如何做到的? MiniMax-M1 基于之前的 MiniMax-Text-01 模型开发,总共包含 4560 亿个参数,459 亿个激活函数,并具备 32 层架构,其最大的亮点是支持目前业内最 高的 10 ...
AI创业效率预警:“立即行动”
第一财经· 2025-06-04 15:16
AI行业发展趋势与机遇 - OpenAI CEO山姆·奥尔特曼认为2026年是AI驱动发现的关键年,AI将从辅助工具升级为帮助人类解决复杂问题的核心角色 [1] - 红杉中国提出AI Agent是当前AI落地的重要方式,企业需根据智能目标层级(如Leval 2 vs Leval 4)选择差异化路径 [1] - 具身智能概念受关注,无论硬件机器人或软件Agent均需具备信息获取与交付能力 [1] AI技术应用现状 - Revelio Labs数据显示ChatGPT发布后,招聘广告中"可被AI完成"的任务比例整体下降19%,技术岗位降幅达31% [2] - ChatGPT日活/月活比例已接近Reddit水平,应用场景覆盖广告文案创作、教育可视化、医疗诊断等领域 [2] - AI编程场景达到PMF最佳状态,OpenAI的Codex Agent可实现后台持续任务处理,成为工程师"搭档" [3] 行业竞争策略 - 红杉资本指出AI市场需求强劲,宏观经济因素为"杂音",创业者需抢占先机避免真空 [4] - 吴恩达AI Fund募资1.9亿美元,强调创业成功首要因素是执行速度,技术理解力比传统商业技能更稀缺 [5][6] - 实验成本降低使企业可快速试错修正,技术快速演进要求团队具备方向直觉判断力 [5][6] Agent领域发展格局 - 中美大厂Agent发展路径分化:北美云厂商侧重模型部署,国内沿用流量逻辑推通用Agent产品 [7] - OpenAI与Anthropic领跑LLM竞争,Coding+Agentic AI被视为AGI时代的超级应用机会 [7] - 长上下文技术突破将引爆Agent应用,2030年前或出现多家10万亿美元市值公司 [7] 企业融资与国际化 - AI Agent领域融资情绪乐观,投资人看重创始人对技术趋势的洞察力及团队执行力 [8] - 国际化公司需构建海外架构(人力/品牌/合规),并通过全球人才协同提升竞争力 [8]