Workflow
fact-aware的强化学习
icon
搜索文档
王小川:30亿现金在手,明年IPO,toC产品马上就发
量子位· 2026-01-13 19:36
公司战略与定位 - 公司明确深耕医疗AI单一主线,不涉足金融、娱乐等其他领域[1] - 公司自成立起便确立长期目标:未来二十年致力于生命科学与医学发展,核心路径是构建生命健康数学模型[4] - 公司账上约有30亿元人民币资金,足以支持其在选定赛道持续投入[3] - 公司预计在2027年启动IPO上市[6] 产品与技术路线图 - 公司计划于今年上半年陆续发布两款面向消费者(to C)的医疗产品,初期免费,后续按模块引入付费能力,重点服务于患者辅助决策与居家健康看护场景[10] - 产品理念覆盖全病种,但明确将儿科和肿瘤作为第一步重点领域[31] - 公司已与北京儿童医院和中国医学科学院肿瘤医院合作,推进真实场景验证[32] - 公司强调其产品是“严肃医疗”,聚焦“院外需求”,不会越界提供诊断或处方,主要功能是帮助用户理解信息、整理症状并明确下一步行动[29] 新一代医疗大模型Baichuan-M3的核心能力 - 在OpenAI医疗AI评测HealthBench上,Baichuan-M3以65.1分位列第一[2] - 在不依赖工具或检索增强的纯模型设置下,其医疗幻觉率降至3.5%,达到当前世界最低水平[2] - 模型具备突出的端到端问诊能力,能保持问诊过程的连续性[9][22] - 公司强调其能力是“原生的、端到端的严肃问诊能力”,与通过提示词(prompt)让通用大模型扮演医生有本质区别[23] Baichuan-M3的关键技术创新 - 公司约80%的算力投入到强化学习相关训练,M3是该训练策略下的成果[8][12] - 训练核心采用“fact-aware的强化学习”,在训练阶段解决幻觉问题,而非依赖后期工具链兜底[13][14] - 重新定义训练中的“错误”:对看似合理但缺乏事实依据的医疗判断进行明确惩罚,同时不压缩模型在推理中的探索空间[15] - 实现三项关键算法调整:1) 使强化学习中的“医生评价模型”能随主模型迭代,避免能力天花板[20];2) 在模型内部完成幻觉压制,无需依赖外部工具打断问诊[22];3) 改造算法结构以适配医疗长对话,保持多轮对话中的目标一致性[23] 对行业与市场的判断 - 公司认为近期备受关注的AI大模型企业上市主要基于通用模型技术红利和政策支持,而医疗AI的成熟会晚一点,预计还有一两年时间[5] - 公司指出国内医疗存在四个结构性不足:医生数量与需求不匹配、医患信息高度不对等、缺乏家庭医生体系导致病人涌向三甲医院、医学本身存在认知盲区[25] - 公司相信未来真正的医疗增量不在医院内,医院更多承担执行功能,而影响患者路径的关键决策往往发生在更早的院外阶段[28][29] - 公司产品定位与市面上众多的泛健康医疗AI产品不同[11]