Workflow
讯飞星火 X1升级,幻觉治理领先业界主流模型

开放式内容生成功能目前饱受诟病,最核心的问题在于,人工智能所生成的内容并非百分之百准确。 "一本正经地胡说八道",是许多人对当前开放式内容生成功能的观感和评价。而这一状况将彻底改变,7月25日,科 大讯飞宣布基于全国产算力训练的深度推理大模型讯飞星火X1再次升级。 星火X1取得显著突破,无论是对自身生成内容真实性的把控(事实性幻觉治理),还是在参考外部资料时对原文的忠 实程度(忠实性幻觉治理),都有显著改善,大大提升了大模型在行业应用中的可靠性。 整体来看,新版本综合能力大幅提升,在翻译、推理、文本生成、数学等核心能力上,已能对标OpenAI o3等国际一 流大模型最新版本效果;多语言能力更是扩展至130余种。与此同时,基于星火X1的语音同传大模型也迎来全面升 级,教育、医疗、企业应用、代码、科研等行业大模型和智能体均取得新突破,在复杂行业场景任务上进一步满足用 户核心需求。 既要也要 全国产大模型 讯飞星火X1此次全面跃升,背后是一系列原创性技术突破的集成。 面对大模型容易"胡说八道"的通病,科大讯飞提出基于多路径采样验证及事实性约束强化学习的幻觉治理技术,在大 模型思考过程及回复生成阶段,实现客观问题与标 ...