公司概况与战略定位 - 创始人杨红霞在阿里和字节拥有近7年大模型研发经验,曾带领团队开发通义千问前身M6大模型[1] - 新AI公司InfiX.ai于2024年7月成立,选择香港作为总部,快速组建40人团队[1][3] - 公司获得香港理工大学支持,通过RAISe+计划获得政府100亿元资助,并在算力上获得90%减免折扣[73][74][76] 核心技术:低资源训练与去中心化 - 开源全球首个FP8训练"全家桶",在模型性能几乎无损下,最高提升训练速度22%,节省显存14%[6][7][9] - 提出模型融合技术InfiFusion,可将不同尺寸和结构的领域专家模型融合,避免重复训练造成的资源浪费[6][10] - 专注于异构模型融合,突破同构模型限制,在18个推理基准测试中平均得分从77分提升至79分,最新方法逼近88分[50][51][60][61][63][64] 技术应用与领域突破 - 推出医疗多模态大模型训练框架InfiMed,基于36K RLV小规模数据训练的3B模型在七大医疗基准测试中平均准确率达59.2%,超越谷歌MedGemma-4B-IT[11][12] - 多智能体系统InfiAgent在需要多步推理的复杂任务DROP上领先最佳基线3.6%[13][14] - 选择癌症领域作为技术验证场景,因其数据多模态特性复杂,能更好区分模型能力[39][41] 行业趋势与融资进展 - "去中心化"训练范式获市场认可,前OpenAI CTO新公司Thinking Machines Lab种子轮融资20亿美元,估值120亿美元[15][34] - InfiX.ai第二轮Pre-A融资仅用两周完成,目前处于超募状态,估值达数亿美元[15][37][38] - 小语言模型被MIT Tech Review列为2025年十大突破性技术,验证公司技术方向正确性[27] 研发理念与团队建设 - 公司坚持技术驱动,认为技术断崖式领先是商业化基础,不急于追求短期商业化成果[86][88][89] - 团队规模约40人,强调成员代码能力、好奇心和合作态度,实行端到端研发模式[79][80][81] - 研发节奏聚焦三大顶级AI会议,但对重大成果会立即发布,如医疗模型7B参数规模超过GPT-5的成果[67][68]
前阿里、字节大模型带头人杨红霞创业:大模型预训练,不是少数顶尖玩家的算力竞赛|智能涌现独家