Aquila(天鹰)自动化平台
搜索文档
OpenAI、Claude背后的非洲「AI数据军团」,成立两年,营收数亿|产品观察
36氪· 2026-03-22 17:36
行业背景与核心矛盾 - AI行业竞争焦点已从算力转向数据质量与垂直稀缺性,互联网高质量公开数据预计在2026-2028年间耗尽[5] - 全球AI训练数据集市场规模预计从2025年的207亿美元增长至2032年的390亿美元,年复合增长率为9.6%[8] - 行业正处于从量到质、从通用到垂直、从人力到自动化的转型期,核心矛盾是高质量、高合规、高稀缺的垂直数据供给严重不足[8] - 全球市场中可直接用于训练的高价值数据占比不足5%,如代码、医疗、小语种等领域,专家级标注、思维链、RLHF对齐数据严重不足[7] 公司定位与商业模式 - Eaglepoint AI是一家依托纳斯达克上市公司Global Mofy AI资本背景的数据公司,致力于将美国技术标准与非洲规模化专家团队深度融合[5] - 公司旨在解决AI大模型训练中高质量、高专业度、高稀缺性垂直数据供给不足的行业痛点[8] - 其商业模式并非单纯的人力外包或软件工具,而是通过专家级数据生产与全链路自动化,为大模型提供“米其林级”训练数据底座[5][8] - 公司核心解决低价标注质量不可靠(20-25美元/小时)与高价专家标注难以规模化的成本与交付效率矛盾[7] 业务聚焦与解决方案 - 公司主要聚焦三大高价值垂直赛道:代码编程、医疗健康、小语种数据[8] - 在代码编程领域,全栈工程师团队提供代码评审、函数生成、调试轨迹、思维链标注,以解决大模型代码能力弱、Bug多、工程化不足的问题[8] - 医疗AI数据部门与当地私立医院授权合作,由执业医师团队生产病历标注、医学影像解读、临床决策路径、RLHF对齐数据,解决医疗AI误诊、合规性及临床实用性问题[9] - 小语种数据部门采用“后殖民时代”策略,与吉布提、加纳、赤道几内亚以及纳米比亚合作,为模型公司提供西班牙语、阿拉伯语、德语和法语的数据标注服务[9] 技术平台:Aquila(天鹰) - 公司自研了Aquila(天鹰)自动化平台,旨在实现端到端闭环,以在保证专家级数据质量的同时,打破成本与规模的不可能三角[5] - 该平台整合了从数据预处理、自动化标注到质量管控的全流程工具链,覆盖提示词工程、测试用例生成到结果分析[11] - 平台实现了数据资产沉淀全流程无断点、无人工重复操作,并内置思维链标注、RLHF对齐、代码评审、医学决策路径等专家级生产模板[11] 人才与运营模式 - 公司建立了“美国标准 + 非洲规模化交付”的全球化模式,团队总人数约1200多人,核心管理团队200多人,数据集及工具研发团队占比90%[12] - 在非洲直接落地成立AI数据实验室,每个实验室负责人与客户数据负责人直接对接并采用轮班制,以实现根据客户时区的无时差交付[16] - 公司认为全球AI产业链分工已从“中心-边缘”发展为“全球分布式协同”,上游(如美、中)掌控模型、算力与标准,中下游(如印度、非洲、东南亚)提供AI基础设施建设服务[16] - 埃塞俄比亚是公司重要基地,该国60%人口年龄低于25岁,英语普及率高、数字化意愿强,且当地拥有服务美国公司的技术服务公司20多家以上,各行业高级人才池超过5000人[13][14] - 对比美国、印度、东南亚,东非国家人才成本具备相对优势,显著降低了单位数据集成本[14] 公司发展历程与客户 - 公司前身WeData Lab于2024年在埃塞俄比亚亚的斯亚贝巴创立,迅速扩张至200人规模[7] - 2025年,WeData Lab合并至美股上市公司Global Mofy AI,并正式在美国成立Eaglepoint AI Inc[7] - 公司客户包括OpenAI、Claude、Google Deepmind、Turing以及Mercor AI等[16] - WeData Lab在2024年至2025年的累计营收达3000万美元,合资成立Eaglepoint AI Inc后的2026年营收目标是6000万美元[16]