公司及产品发布 - MiroMind团队于1月5日正式发布其自研旗舰搜索智能体模型MiroThinker 1.5 [1] - 该公司由企业家陈天桥与清华大学学者代季峰教授联合发起,其使命是在未知条件下重建对世界的理解,押注“发现式智能” [1] - 公司提出智能的“奇点”在于“发现式智能”,即智能不靠全知,而靠会研究、会查证、会修正,像顶级情报官和严谨研究员一样工作 [1] 模型性能与效率 - MiroThinker-v1.5-30B仅用30B参数规模,跑出了比肩众多1T(万亿)参数模型的性能表现 [2] - MiroThinker-v1.5-235B版本在多个搜索智能体基准测试中跻身全球第一梯队 [2] - 在BrowseComp评测中,MiroThinker-v1.5-235B得分为69.8,在BrowseComp-ZH中得分为71.5,在GAIA Val-165中得分为80.8 [6] - 与参数量高达30倍的Kimi-K2-Thinking相比,MiroThinker-v1.5-30B单条调用成本低至0.07美元,仅为前者的1/20,且推理更快,并在BrowseComp-ZH评测中实现性能超越 [7] 核心技术与理念 - 公司指出传统以扩大模型内部参数为核心的Scaling Law已触及边际瓶颈,提出必须转向以“外部信息交互”为核心的Interactive Scaling [8] - 该模型性能提升的关键在于从“做题家模式”转向“科学家模式”,核心不是死记硬背,而是勤查证,执行“提出假设→查证→修正假设→再查证”的研究闭环 [9] - 公司刻意将模型规模控制在30B–200B的轻量级,将算力重点投入对外部信息的获取与交互,而非盲目追求万亿参数 [10] - MiroThinker 1.5通过Interactive Scaling将“推理”与“外部环境”深度耦合,构建“推理-验证-修正”循环,用外部信息作为校验锚点,解决逻辑坍塌问题 [11] 训练机制创新 - 公司将Interactive Scaling从推理阶段前移并内化为训练阶段的核心机制,系统性地训练模型成为善于向外求证、敢于否定自己、能够快速修正的Agent [12] - 训练过程强化三种行为模式:Evidence-Seeking(主动求证)、Iterative Verification(多轮校验与自我修正)、Anti-Hallucination(对捷径的系统性过滤) [12][13] - 采用“时序敏感训练沙盒”,约束模型“只能看过去,不能看未来”,在严格的时间可见性约束下做判断和验证,杜绝Future Leakage,使模型更接近真实世界的认知过程 [14] 应用案例展示 - 在A股涨停板预测案例中,模型展示了在信息噪声大、情绪切换快的市场环境中,利用开放世界证据与因果推断进行预测的能力 [15] - 具体案例显示,在12月10日市场情绪退潮(晋级率25%)时,模型从8支二板股中精准押中唯一晋级的一支 [16] - 在12月11日市场环境持续降温(晋级率22%)时,模型命中了9支连板股中的高位晋级者 [19] - 在12月12日情绪回暖(晋级率54%)时,模型不仅命中市场最高连板,还准确预判其继续晋级,后续累计涨幅高达58% [22] - 在美股事件影响分析案例中,模型对可能影响“美股七巨头”的事件进行了梳理,并给出了对股价方向的基准判断 [25]
MiroMind发布全球最强搜索智能体模型MiroThinker 1.5,以“发现式智能”挑战传统大模型路径
36氪·2026-01-06 17:06