Workflow
夸克发布首个高考志愿大模型
北京商报·2025-06-12 13:34

高考志愿大模型发布 - 公司发布国内首个为高考志愿填报场景开发的高考志愿大模型,具备专家级决策能力,能够为每位考生提供精准、个性化的志愿填报服务 [1] - 同步上线"高考深度搜索"、"志愿报告"、"智能选志愿"三大核心功能 [1] 模型运行机制 - 高考志愿大模型驱动的"志愿报告"以Agent方式运行,基于"任务规划—执行—检查—反思"的链式推理流程,自动输出涵盖冲稳保策略、志愿表、院校专业推荐等内容的完整报告 [4] - 每轮执行结果模型经过自动检查,会判断是否存在逻辑冲突、数据缺漏、排序异常等问题,并将结果反馈至"反思"模块,通过评估结果与需求的差异不断优化后续策略 [4] - 当考生倾向选择省内且要求985院校时,模型在执行任务后,面对省内985院校较少的情况,会尝试推荐适合的外省985高校 [4] 模型训练与优化 - 以通义千问为基座,基于领域数据优势,通过专项训练具备对复杂规则与用户需求的理解与推理能力 [4] - 通过一个多阶段、高复杂度的训练范式构建流程,融合了自监督语义建模、监督式对齐调优、由专家判别价值引导的策略精化机制 [4] - 在指令微调阶段,将数百名资深高考志愿规划师的沟通、决策过程进行结构化,提取出完整分析路径与语言风格 [5] - 通过将上万条真实专家"推理链"转化为高质量监督数据,深度学习人类专家的分析过程 [5] 模型性能提升 - 在复杂推理任务中生成了中间可验证结构,显著降低幻觉率、增强跨模态演绎能力,并实现分布外泛化鲁棒性 [5] - 通过基于人类偏好强化学习(RLHF)精化策略层,构建闭环优化机制,将"模拟填报 → 专家反馈 → 策略评分"引入到模型迭代过程中 [5] - 已完成对数千份志愿报告的专家标注与打分,通过"人类挑刺 + 模型修正"的方式,使模型输出在专业度与匹配度上持续逼近专家的真实判断标准 [5]