公司融资与估值 - 美国AI初创公司LMArena完成A轮融资,融资额为1.5亿美元,投后估值达17亿美元(约120亿人民币)[3] - 本轮融资由Felicis Ventures和UC Investments领投,A16Z、光速创投等多家知名VC跟投[3] - 公司估值在七个月内从6亿美元(种子轮)增长至17亿美元,翻了近三倍,快速晋升独角兽[4] - 公司员工总数仅有29人,相当于人均估值近4亿元人民币[5] 公司起源与产品 - LMArena起源于开源学术组织LMSYS Org,该组织由加州大学伯克利分校、加州大学圣地亚哥分校、卡内基梅隆大学等名校的师生发起,核心使命是使大模型的使用和评估平民化[8] - 组织华人含量高,多名核心成员为华人学者[9] - 最初为解决开源模型Vicuna的可靠测试需求,于2023年4月推出开放测试平台Chatbot Arena,后于2024年9月更名为LMArena[9] - 产品核心理念是“匿名对战”,用户输入提示词后,系统随机挑选两个AI模型生成输出,由用户在不知情的情况下投票选择胜者,以此积累分数进行排名[10] - 该平台已成为全球最权威的大模型评测平台之一,已有400多个大模型被打分和排名,每月有数百万独立用户参与评测[14] 产品价值与行业痛点 - 传统大模型评测方式(如MMLU、GSM8K)面临饱和、污染与脱节三大挑战[11] - 饱和指模型刷题能力逼近人类上限,测试区分度变小[11] - 污染指公开的测试考题可能被模型针对性训练,污染测试结果[12] - 脱节指考题与真实使用场景不同,导致“高分低能”[13] - LMArena通过收集真实人类偏好,将评价方式从“考场考试”改为“竞技场决斗”,一举解决了上述三大问题[14] - 其排名已被AI行业广泛接受为最权威的“人类偏好”风向标,各大公司发布新模型都会送测[14] 商业化进展与收入 - 2025年初,LMArena正式注册为公司,开始从学术项目转向商业化发展[16] - 2025年9月,公司推出首个商业化产品AI Evaluations,主要面向开发AI大模型的企业或研究机构,提供模型评估服务[22] - 截至2025年12月,AI Evaluations的年度经常性收入(ARR)已达到3000万美元[22] 发展潜力与投资逻辑 - 投资方A16Z认为LMArena的打分已成为评价AI大模型性能的事实标准,是AI产业发展的“关键基础设施”[22] - 公司打造了成功的飞轮机制:用更多模型吸引更多用户,产生更多偏好数据,进而吸引更多模型加入,形成难以复制的壁垒[22] - 中立、持续的评测未来将是AI大模型监管的刚需,可为受监管行业(如医院)提供合规性支持,“LMArena认证”可能成为AI产品的“绿色认证”[23] - 平台上的用户评测次数未来可能从数百万次增长至数十亿次[23] - 2025年初推出的Inclusion Arena产品,通过API/SDK将测试嵌入真实AI应用以收集生产环境反馈,截至2025年7月已收集超过50万次真实对战记录,构建了“AI的持续集成/持续部署管道”[23] 面临的挑战与争议 - 公司面临在商业压力下保持中立性的巨大挑战[24] - 曾被质疑帮助部分AI公司操纵排名,例如Meta被指在发布Llama 4前私底下测试了27个模型变体,但只公开了表现最好的一个模型的得分[18] - 还被指偏向性地增加Meta、OpenAI和谷歌等大厂模型的“对战”次数,使其获得不公平的排名优势[18] - 公司回应称一些指责与事实不符,并认为公布预发布模型的分数毫无意义[19] - 为维持透明度,公司会开源部分代码并定期发布对战数据集,但公正性争议可能伴随其商业化进程[20]
29个人,估值120亿
投中网·2026-01-19 14:54