Workflow
形式化验证
icon
搜索文档
美版“梁文锋”不信邪
虎嗅APP· 2025-07-31 17:50
核心观点 - Harmonic是一家专注于解决AI幻觉问题的初创公司,其产品Aristotle在数学推理领域实现了零幻觉,通过形式化验证手段确保输出准确性 [5][6][21] - 公司成立仅两年估值接近9亿美元,吸引了红杉资本、凯鹏华盈等顶级投资机构近2亿美元投资 [7][30][34] - 技术核心是基于Lean的交互式定理证明系统,通过严格逻辑约束确保数学推理的准确性 [36][38] - 在MiniF2F测试中达到90%成功率,远超GPT-4等通用AI模型的20-35% [41][42] - 面临DeepSeek、谷歌DeepMind等强劲竞争对手,后者在数学AI领域已有显著成果 [43][46][47] 公司背景 - 由Vlad Tenev和Tudor Achim联合创立,前者是Robinhood CEO(公司估值55亿美元),后者有自动驾驶AI算法开发经验 [9][10][14] - 创始团队具备数学天赋和AI经验,初期使用个人资金启动研发 [11][15] - 公司理念是让AI"会思考、讲真话",通过严格逻辑约束避免无根据回答 [15] 产品与技术 - Aristotle是首个可进行推理并正式验证的AI产品,在定量推理领域保证零幻觉 [5][21] - 通过Lean证明系统实现:每一步推导需系统认可,错误结论会被立即拒绝 [21][38] - 解决了三大问题:幻觉、推理不清晰、不够严谨,适合金融、医疗等高风险场景 [21] - 在MiniF2F测试集(488道数学题)中创下90%成功率的新纪录 [22][41] - 能自动生成严格数学证明,如2001年国际数学奥林匹克难题 [22][23] 融资与估值 - 种子轮由创始人个人和天使投资人提供 [29] - 2024年9月A轮融资7500万美元,估值3.25亿美元 [30] - 2025年7月B轮融资1亿美元,估值接近9亿美元 [30] - 投资方包括红杉资本、Index Ventures、Kleiner Perkins等顶级机构 [34] 行业竞争 - DeepSeek的Prover-V2模型在MiniF2F测试中达到88.9%通过率 [43] - 谷歌DeepMind的AlphaProof在2024年IMO中获得银牌(6题解出4题) [46] - OpenAI新模型在IMO2025斩获金牌(6题解出5道) [49] - 竞争对手普遍拥有大模型生态支持,如DeepSeek-V3、Gemini等 [51] 市场定位 - 瞄准B端精密场景(金融建模、科学推理等)对极低容错率的需求 [19] - 计划发布企业API和消费者网络应用 [24] - 可能选择被大厂收购作为退出路径,成为基础模型技术生态的一环 [51]
速递| 红杉、Kleiner Perkins押注数学AI革命:Harmonic B轮融资1亿美金,打造数学超智能
Z Potentials· 2025-07-12 13:17
Harmonic AI融资与估值 - 人工智能初创公司Harmonic AI完成1亿美元B轮融资 由Kleiner Perkins领投 红杉资本 Index Ventures和Paradigm跟投 [1] - 本轮融资后公司估值达8 75亿美元 略低于10亿美元独角兽门槛 创始人称此为有意为之的选择 [1] - 公司此前已从红杉资本和Index Ventures获得7500万美元融资 累计融资额达1 75亿美元 [1] 公司背景与团队 - 公司由Robinhood Markets CEO弗拉德·特涅夫与都铎·阿基姆于2023年联合创立 总部位于加州帕洛阿尔托 [1] - CEO都铎·阿基姆曾领导自动驾驶初创公司Helm ai 特涅夫担任非执行董事长 [1] - 公司专注于开发解决复杂数学问题的人工智能系统 目标打造"数学超级智能" [1] 技术方向与产品规划 - 旗舰AI模型Aristotle计划2025年向研究人员和公众开放 [2] - 短期目标为开发数学解题能力超越人类水平的AI 长期目标攻克数学领域未解难题并拓展至物理学和计算机科学 [2] - 采用形式化验证技术消除AI幻觉问题 确保模型输出和推理步骤可验证 [2][3] - 公司认为以数学为核心的策略将优于现有大型语言模型 后者普遍存在数学能力不足缺陷 [2] 创始人观点 - 特涅夫强调不应追求估值最大化 公司主动控制估值低于独角兽门槛 [1][3] - 提出形式化验证将成为未来AI模型主流构建方式 [3]
陶哲轩:感谢Lean,我又重写了20年前经典教材!
机器之心· 2025-06-01 11:30
陶哲轩实分析教材形式化项目 核心观点 - 陶哲轩为《Analysis I》教材创建Lean配套项目 将教材中的定义、定理和练习转换为Lean可交互形式 为学生提供新型学习工具[1][2] - 项目采用渐进式策略 前期独立构建数学结构 后期逐步迁移至标准数学库Mathlib 兼具教材辅助和工具入门双重功能[5] - 形式化内容严格遵循原书结构 但刻意避免直接引用原文 定位为注解式辅助资料而非替代品[4] 项目技术细节 - 使用Lean依赖类型理论 特别利用其出色的商类型支持 与教材采用的朴素类型理论高度兼容[2] - 当前已完成部分章节形式化 采用"先独立后迁移"模式 例如第2章先自定义自然数体系 再建立与Mathlib标准体系的同构关系[5] - 习题部分以"sorry"占位符呈现 不提供官方解答 鼓励用户自行完成并创建项目副本[2][4] 教育应用价值 - 为数学系学生提供即时反馈机制 错误证明无法通过编译 显著提升学习效率[10] - 架设教材与Mathlib工具间的桥梁 降低形式化验证的学习门槛[9] - 开源项目允许自由协作 陶哲轩本人将持续收集用户反馈以优化项目[7] 社区反响 - 数学爱好者高度认可该项目价值 认为其首次实现编程式严谨构建数学体系的教学目标[9] - 教育工作者期待未来结合LLM技术 使Lean编译器能提供类似Rust的指导性错误修正建议[10]
CertiK 荣获以太坊基金会两项资助,领跑 zkEVM 形式化验证
Globenewswire· 2025-05-14 22:00
文章核心观点 以太坊基金会公布 2025 年第一季度研究资助名单,CertiK 获两项源于 zkEVM 形式化验证竞赛的资助,彰显其在零知识证明系统形式化验证领域的全球技术领导力,其工作将为以太坊生态系统的可扩展性和安全性提供保障并为其他区块链项目树立标杆 [1][3] 公司情况 - CertiK 获以太坊基金会 2025 年第一季度两项研究资助,源于 zkEVM 形式化验证竞赛 [1] - CertiK 的“先进形式化验证”技术相比传统方案有四大突破,适合处理复杂零知识证明系统 [1][2] - CertiK 自创立以形式化验证为核心技术,依托学术成果为 Web3 项目提供安全服务 [1] - CertiK 去年完成 zkWasm 电路的首次完整形式化验证 [2] - CertiK 的形式化验证技术在多个 Web3 顶级项目和基础设施中广泛应用 [2] 行业情况 - zkEVM 通过零知识证明实现以太坊可扩展性,但面临安全风险,形式化验证是确保其正确性和安全性的关键工具 [2] - 随着区块链技术发展,特别是零知识证明系统广泛应用,形式化验证将成确保系统安全和可靠性的关键工具 [3]