Chatbot Arena - 财报，业绩电话会，研报，新闻

Chatbot Arena

搜索文档

36氪· 2026-01-19 15:29

公司融资与估值 - 美国AI初创公司LMArena完成A轮融资，融资额为1.5亿美元，投后估值达17亿美元（约120亿人民币）[1] - 本轮融资由Felicis Ventures和加州大学伯克利分校旗下的投资基金UC Investments领投，A16Z、光速创投、The House Fund、LDVP、Kleiner Perkins等美国知名VC跟投[1] - 公司估值在七个月内翻了三倍，其上一轮种子轮融资于2025年5月完成，当时估值为6亿美元[1] - 截至2026年初，公司员工总数仅有29人[1] 公司起源与产品 - LMArena起源于一个名为LMSYS Org的开源学术组织，该组织由来自加州大学伯克利分校、加州大学圣地亚哥分校、卡内基梅隆大学等名校的学生和教授发起[2] - 组织核心使命是通过开发开源模型、系统和数据集，使大模型的使用和评估变得平民化[2] - 其前身Chatbot Arena平台于2023年4月推出，并于2024年9月正式更名为LMArena[2] - 公司核心产品是一个大模型评测平台，核心理念是“匿名对战”，用户通过对比两个匿名模型的输出来投票决定胜负，从而为模型打分和排名[3] - 该平台解决了传统大模型评测方式面临的饱和、污染与脱节三大挑战[3][4] 市场地位与运营数据 - LMArena已成为全球大模型最权威的评测平台之一，其排名被AI行业广泛接受为最权威的“人类偏好”风向标[4] - 平台已有400多个大模型被打分和排名，每月有数百万个独立用户参与评测[4] - 包括OpenAI、谷歌以及国内各大AI公司在发布新模型时，都会将模型送至LMArena进行评测[4] 商业化进展 - 2025年初，LMArena正式注册为公司，开始从学术项目转向商业化发展[5] - 2025年9月，公司推出首个商业化产品AI Evaluations，主要面向开发AI大模型的企业或研究机构，为其提供模型评估服务[7] - 截至2025年12月，AI Evaluations的年度经常性收入已达到3000万美元[7] - 2025年初，公司推出了Inclusion Arena产品，通过API和SDK将测试嵌入真实AI应用以收集生产环境反馈[8] - 截至2025年7月，Inclusion Arena已收集了超过50万次的真实对战记录[8] 投资逻辑与未来展望 - 投资方A16Z认为LMArena的打分已成为评价AI大模型性能的事实标准，是AI产业发展的关键基础设施[7] - 公司打造了一个飞轮机制：用更多模型吸引更多用户，从而产生更多偏好数据，进而吸引更多模型加入，形成竞争壁垒[8] - 中立、持续的评测被认为是未来AI大模型监管的刚需，公司可能为受监管行业提供合规性支持[8] - 投资方畅想“LMArena认证”未来可能成为AI产品的“绿色认证”[8] - 平台上的用户评测次数未来可能从数百万次增长至数十亿次[8] 面临的挑战与争议 - 公司面临在商业压力下保持中立性的巨大挑战[9] - 2025年4月，有研究文章指责LMArena帮助部分AI公司操纵排名，例如Meta被指在发布Llama 4前私底下测试了27个模型变体，但只公开了表现最好的一个模型的得分[5][6] - 文章还认为平台偏向性地增加了Meta、OpenAI和谷歌等大厂模型的“对战”次数，使其获得不公平的排名优势[6] - 对于指责，LMArena回应“一些说法与事实不符”，并表示公布预发布模型的分数毫无意义[6] - 公司为维持透明度，会开源部分代码并定期发布对战数据集供研究者分析[6]

Artificial Intelligence

大模型评测

Artificial Intelligence

AI Evaluations

Inclusion Arena

Vicuna

Artificial Intelligence

大模型评测

Artificial Intelligence

36氪· 2026-01-07 19:04

融资与估值 - 公司LMArena完成1.5亿美元A轮融资，由Felicis和加州大学投资公司UC Investments领投，Andreessen Horowitz、The House Fund等机构跟投 [3] - 本轮融资后，公司估值升至17亿美元 [1] - 此前在2025年5月，公司曾获得1亿美元种子轮融资，当时估值为6亿美元 [7] 公司背景与发展历程 - 公司前身为Chatbot Arena，最初由来自UC伯克利、斯坦福、UCSD、CMU等顶尖高校成员组成的开源组织LMSYS创建 [4] - 早期创建Chatbot Arena的目的是为了更有效地评估其自身开发的开源模型小羊驼Vicuna [4][6] - 该平台通过用户众包投票进行模型评估的模式获得成功，后从开源项目独立成为商业公司lmarena.ai [7] - 公司核心团队为90后，且华人含量高 [3] 核心技术产品 - 公司主要项目为全球大模型动态竞技场LMArena [8] - 公司开发的开源推理引擎SGLang在业内首次实现了在96块H100上跑出几乎媲美DeepSeek官方报告吞吐量的开源方案，并已被xAI、英伟达、AMD、谷歌云、甲骨文云、阿里云、美团、腾讯云等企业和机构采用 [4] - 平台核心评估机制为匿名对战、基于Bradley–Terry模型的Elo式评分以及人机协同框架 [9][10] - 用户输入问题后，系统随机匹配两个模型进行匿名回答，用户根据回答质量投票，投票后揭晓模型身份 [10] - 平台通过算法平衡模型的出场次数、任务类型和样本分布，以确保评估公平客观 [10] 市场地位与运营数据 - LMArena已成为模型测评首选的排行榜，各家新模型发布时常在该平台测试 [7][10] - 平台累计获得涵盖文本、视觉、网络开发等跨模态的5000万张投票 [12] - 平台已完成400余种开放及专有模型的评估 [12] - 平台产出了覆盖文本、多模态、专家及职业等多个类别的14.5万个开源战斗数据点 [12] - 根据实时排行榜，当前Gemini 3 Pro以1490分位居榜首，获得21,938张投票 [10][11] 资金用途与未来计划 - 新筹集的资金将用于平台运营，确保稳定高效运行并提升用户体验 [12] - 资金也将用于扩大技术团队，为平台发展注入更多专业技术力量 [12]

Artificial Intelligence

大模型评估

Artificial Intelligence

Chatbot Arena

LMArena

SGLang

Artificial Intelligence

大模型评估

Artificial Intelligence

Chatbot Arena

LMArena

SGLang

给AI打个分，结果搞出17亿估值独角兽？？？

量子位· 2026-01-07 17:11

融资与估值 - 大模型评估平台LMArena完成1.5亿美元A轮融资[1] - 公司估值在此轮融资后升至17亿美元[1] - 此轮融资由Felicis和加州大学投资公司领投，Andreessen Horowitz、The House Fund等机构跟投[3] 公司起源与背景 - 公司前身是Chatbot Arena，最初由来自UC伯克利、斯坦福等顶尖高校的成员组成的开源组织LMSYS创建[5][6] - 团队曾开发开源推理引擎SGLang，在96块H100上实现了媲美DeepSeek官方报告吞吐量的开源方案[7] - SGLang已被xAI、英伟达、AMD、谷歌云、阿里云、美团、腾讯云等企业和机构采用[8] - 团队核心为90后华人，占比达99%[4] 核心业务与产品 - 公司核心业务是提供第三方大模型评估平台，主要产品为LMArena（原Chatbot Arena）[9][16][18] - 平台采用匿名对战、Elo式评分和人机协同框架进行评估[20] - 用户输入问题后，系统随机匹配两个模型进行匿名回答，用户投票选择更优答案后揭晓模型身份[21][22] - 基于Bradley–Terry模型的Elo评分机制，模型根据对战胜负增减分数，形成实时排行榜[22] - 平台通过算法平衡模型的出场次数、任务类型和样本分布，以确保评估公平[22] 市场地位与影响力 - 平台已成为全球大模型“出道”时的必测榜单，是模型测评首选的排行榜[14][23] - 截至报告时，平台累计获得5000万张跨模态投票，完成了400余种开放及专有模型的评估，并产出了14.5万个开源战斗数据点[25] - 在平台实时排行榜中，Gemini 3 Pro以1490分位居榜首[23][24] 发展历程与资金用途 - 平台最初因团队为评估自研的Vicuna模型而创建，后因影响力扩大而独立成为商业公司[10][11][15][16] - 2025年5月，公司获得1亿美元种子轮融资，估值达6亿美元[17] - 新一轮融资将用于平台运营以保障稳定高效运行，并扩大技术团队[25]

做 AI 评测种子轮拿了 1 亿美金，以及一传统人力服务转型 AI 的典型案例

投资实习所· 2025-05-22 13:44

OpenAI的战略扩张与行业影响 - OpenAI的ChatGPT日活跃用户在过去一年增长超过4倍，每日消息发送量也显著增加[1] - OpenAI以30亿美元收购AI编程产品Windsurf，并以65亿美元收购前苹果首席设计官Jony Ive创立的公司io，强化其在AI硬件和设计领域的能力[1] - OpenAI计划开发新一代人工智能设备，可能包括无屏幕“手机”等创新交互设备，由Jony Ive团队负责工业设计，OpenAI提供AI技术支持[2] - OpenAI的战略方向是打造具备T型技能的超级助手（智能实体），并将苹果视为最大威胁，其收购消息公布后苹果股价下跌约2%[2] AI模型评估平台LM Arena的兴起 - AI模型评测平台LM Arena在种子轮融资1亿美元，估值达6亿美元，领投方包括a16z和加州大学，跟投方包括Lightspeed、Felicis和KP[3] - LM Arena的核心产品Chatbot Arena允许用户对比AI模型回答并通过投票构建排行榜，平台每月访问量超过100万次[2] - 该平台已与OpenAI、Google、Anthropic和Meta等公司合作，评估其旗舰甚至未发布的模型，采用众包方式进行真实世界评估[3] - a16z认为LM Arena正在解决AI领域最紧迫的问题之一，即大规模解决人工智能的可靠性问题，提供了一个中立、开放、社区驱动的基准测试平台[4] AI驱动服务行业的转型案例 - 服务行业被视为AI最大的机会，因其能取代人类劳动力而非仅提供工具，但传统服务公司向AI驱动转型存在挑战[4] - 一个案例显示，一个原本80多人的团队用4年时间将年收入做到500万美元，业务严重依赖人力难以规模化[4] - 在ChatGPT推出后，该公司将人力服务转型为AI产品，在8个月内实现了900万美元的年度经常性收入，成功转变为AI驱动的产品公司[4]

速递｜不站队的AI裁判要赚钱了？Chatbot Arena转型公司化运营且计划融资

Z Potentials· 2025-04-21 14:03

公司转型与定位 - 原为加州大学伯克利分校的学术研究项目Chatbot Arena，现正转型为独立公司LMArena（注册名Arena Intelligence）[2] - 核心团队包括学术界与产业界领袖，如Databricks/Anyscale联合创始人Ion Stoica，目标是在保持平台开放中立的前提下加速扩张[2][5] - 项目负责人表示，愿景是让平台成为互联网上每个人都能尝试聊天、使用AI、比较不同供应商的场所[3][4] 平台运营与影响力 - 平台允许用户将一系列尖端AI模型进行直接对决测试，并为偏好的模型投票，其排行榜深受科技界关注[3] - 聊天机器人竞技场创建于2023年初，迅速成为早期采用者的热门聚集地，在AI基准测试领域是领先指标，每月吸引百万访客[4][5] - 顶尖AI公司与开源新秀利用该网站测试新模型，部分企业甚至在正式发布前就将模型上传至平台，例如OpenAI对其GPT-4o模型的做法[5] 发展规划与商业模式 - 公司发布了新网站的早期版本，但尚未确定商业模式，一种可能性是向希望通过该网站测试其AI模型的公司收费[6] - LMArena计划筹集资金以支持公司发展，但拒绝透露具体计划细节[6] - 三人团队及其他成员正联合创立LMArena，但各自在新公司的具体职责尚未最终确定[5]

Artificial Intelligence

Chatbot Arena

GPT - 4o

Artificial Intelligence

Chatbot Arena

GPT - 4o

速递｜不站队的AI裁判要赚钱了？Chatbot Arena转型公司化运营且计划融资

Z Potentials· 2025-04-21 14:03

公司概况与战略定位 - 原加州大学伯克利分校的学术研究项目Chatbot Arena正转型为独立公司LMArena（注册名Arena Intelligence）[1] - 核心团队由学术界与产业界领袖组成，包括Databricks/Anyscale联合创始人Ion Stoica等[1][3] - 公司目标是在保持平台开放中立的前提下加速扩张[1] 平台业务模式与运营 - 平台允许用户将尖端AI模型进行直接对决测试，并为偏好模型投票，其排行榜深受科技界关注[2] - 该平台已成为AI基准测试领域的领先指标，每月吸引百万访客[3] - 顶尖AI公司与开源项目均利用该网站测试新模型，部分企业甚至在正式发布前就上传模型，例如OpenAI曾测试其GPT-4o模型[3] - 公司尚未确定商业模式，一种可能性是向希望通过该网站测试AI模型的公司收费[3] 发展历程与未来规划 - 聊天机器人竞技场创建于2023年初，由加州大学伯克利分校的天空计算实验室作为研究项目构建[2] - 公司计划筹集资金以支持发展，但拒绝透露具体计划细节[4] - 公司愿景是成为互联网上每个人都能尝试聊天、使用AI、比较不同供应商的场所[2]

Artificial Intelligence

Chatbot Arena

GPT - 4o

Artificial Intelligence

Chatbot Arena

GPT - 4o