Venture-前阿里、字节大模型带头人杨红霞创业：大模型预训练，不是少数顶尖玩家的算力竞赛｜智能涌现独家

公司概况与战略定位 - 创始人杨红霞在阿里和字节拥有近7年大模型研发经验，曾带领团队开发通义千问前身M6大模型[1] - 新AI公司InfiX.ai于2024年7月成立，选择香港作为总部，快速组建40人团队[1][3] - 公司获得香港理工大学支持，通过RAISe+计划获得政府100亿元资助，并在算力上获得90%减免折扣[73][74][76] 核心技术：低资源训练与去中心化 - 开源全球首个FP8训练"全家桶"，在模型性能几乎无损下，最高提升训练速度22%，节省显存14%[6][7][9] - 提出模型融合技术InfiFusion，可将不同尺寸和结构的领域专家模型融合，避免重复训练造成的资源浪费[6][10] - 专注于异构模型融合，突破同构模型限制，在18个推理基准测试中平均得分从77分提升至79分，最新方法逼近88分[50][51][60][61][63][64] 技术应用与领域突破 - 推出医疗多模态大模型训练框架InfiMed，基于36K RLV小规模数据训练的3B模型在七大医疗基准测试中平均准确率达59.2%，超越谷歌MedGemma-4B-IT[11][12] - 多智能体系统InfiAgent在需要多步推理的复杂任务DROP上领先最佳基线3.6%[13][14] - 选择癌症领域作为技术验证场景，因其数据多模态特性复杂，能更好区分模型能力[39][41] 行业趋势与融资进展 - "去中心化"训练范式获市场认可，前OpenAI CTO新公司Thinking Machines Lab种子轮融资20亿美元，估值120亿美元[15][34] - InfiX.ai第二轮Pre-A融资仅用两周完成，目前处于超募状态，估值达数亿美元[15][37][38] - 小语言模型被MIT Tech Review列为2025年十大突破性技术，验证公司技术方向正确性[27] 研发理念与团队建设 - 公司坚持技术驱动，认为技术断崖式领先是商业化基础，不急于追求短期商业化成果[86][88][89] - 团队规模约40人，强调成员代码能力、好奇心和合作态度，实行端到端研发模式[79][80][81] - 研发节奏聚焦三大顶级AI会议，但对重大成果会立即发布，如医疗模型7B参数规模超过GPT-5的成果[67][68]