Workflow
人工智能零幻觉
icon
搜索文档
美版“梁文锋”不信邪
虎嗅APP· 2025-07-31 17:50
核心观点 - Harmonic是一家专注于解决AI幻觉问题的初创公司,其产品Aristotle在数学推理领域实现了零幻觉,通过形式化验证手段确保输出准确性 [5][6][21] - 公司成立仅两年估值接近9亿美元,吸引了红杉资本、凯鹏华盈等顶级投资机构近2亿美元投资 [7][30][34] - 技术核心是基于Lean的交互式定理证明系统,通过严格逻辑约束确保数学推理的准确性 [36][38] - 在MiniF2F测试中达到90%成功率,远超GPT-4等通用AI模型的20-35% [41][42] - 面临DeepSeek、谷歌DeepMind等强劲竞争对手,后者在数学AI领域已有显著成果 [43][46][47] 公司背景 - 由Vlad Tenev和Tudor Achim联合创立,前者是Robinhood CEO(公司估值55亿美元),后者有自动驾驶AI算法开发经验 [9][10][14] - 创始团队具备数学天赋和AI经验,初期使用个人资金启动研发 [11][15] - 公司理念是让AI"会思考、讲真话",通过严格逻辑约束避免无根据回答 [15] 产品与技术 - Aristotle是首个可进行推理并正式验证的AI产品,在定量推理领域保证零幻觉 [5][21] - 通过Lean证明系统实现:每一步推导需系统认可,错误结论会被立即拒绝 [21][38] - 解决了三大问题:幻觉、推理不清晰、不够严谨,适合金融、医疗等高风险场景 [21] - 在MiniF2F测试集(488道数学题)中创下90%成功率的新纪录 [22][41] - 能自动生成严格数学证明,如2001年国际数学奥林匹克难题 [22][23] 融资与估值 - 种子轮由创始人个人和天使投资人提供 [29] - 2024年9月A轮融资7500万美元,估值3.25亿美元 [30] - 2025年7月B轮融资1亿美元,估值接近9亿美元 [30] - 投资方包括红杉资本、Index Ventures、Kleiner Perkins等顶级机构 [34] 行业竞争 - DeepSeek的Prover-V2模型在MiniF2F测试中达到88.9%通过率 [43] - 谷歌DeepMind的AlphaProof在2024年IMO中获得银牌(6题解出4题) [46] - OpenAI新模型在IMO2025斩获金牌(6题解出5道) [49] - 竞争对手普遍拥有大模型生态支持,如DeepSeek-V3、Gemini等 [51] 市场定位 - 瞄准B端精密场景(金融建模、科学推理等)对极低容错率的需求 [19] - 计划发布企业API和消费者网络应用 [24] - 可能选择被大厂收购作为退出路径,成为基础模型技术生态的一环 [51]