新华财经北京6月12日电 6月12日,夸克发布国内首个为高考志愿填报场景开发的高考志愿大模型,并同步上线“高考深度搜索”、“志愿报告”、“智能选志愿”三大核心功能。该模型具备专家级决策能力,能够为每位考生提供精准、个性化的志愿填报服务。
夸克发布首个可生成完整志愿报告的Agent
高考志愿大模型驱动的夸克“志愿报告”以Agent方式运行,目前已开放试用。它能像经验丰富的志愿填报专家一样,为考生提供个性化的规划建议。基于“任务规划—执行—检查—反思”的链式推理流程,夸克志愿报告会自动输出涵盖冲稳保策略、志愿表、院校专业推荐等内容的完整报告。
“志愿报告”Agent以考生的成绩、兴趣偏好、家庭背景和地域倾向等为基础,会首先制定个性化任务规划(如定位成绩段、筛选专业方向、制定填报策略等);随后将任务转化为指令,基于高质量数据完成任务执行。
每轮执行结果模型经过自动检查,会判断是否存在逻辑冲突、数据缺漏、排序异常等问题,并将结果反馈至“反思”模块。通过评估结果与需求的差异不断优化后续策略,从而实现动态修正与智能迭代。
夸克高考志愿大模型支撑的另一个功能是“高考深度搜索”,为提升回答的准确性与专业性,模型会将考生的真实需求精细化拆解,每一类需求都对应定制化的回答范式与要点,确保回复兼具针对性与深度。
训练机制揭秘:多阶段、高复杂度训练实现像专家一样思考与决策
以通义千问为基座,夸克高考志愿大模型基于领域数据优势,通过专项训练具备对复杂规则与用户需求的理解与推理能力,让模型真正“像志愿专家一样思考与决策”。
夸克高考志愿大模型通过一个多阶段、高复杂度的训练范式构建流程,融合了自监督语义建模、监督式对齐调优、由专家判别价值引导的策略精化机制。
在指令微调阶段,夸克高考志愿大模型将数百名资深高考志愿规划师的沟通、决策过程进行结构化。围绕他们与考生或家长的多轮真实对话,提取出完整分析路径与语言风格。通过将上万条真实专家“推理链”转化为高质量监督数据,夸克高考志愿大模型得以深度学习人类专家的分析过程。
夸克高考志愿大模型还在复杂推理任务中生成了中间可验证结构,显著降低幻觉率、增强跨模态演绎能力,并实现分布外泛化鲁棒性,解决各种需要专业知识的复杂问题。
最后通过基于人类偏好强化学习(RLHF)精化策略层,夸克高考志愿大模型构建了一个闭环优化机制,将“模拟填报 → 专家反馈 → 策略评分”引入到模型迭代过程中。
模型会基于模拟的考生档案生成志愿填报方案,随后这些方案将被提交给多位高考志愿专家进行评估。评估标准包括:专业建议是否准确易懂、排序逻辑是否贴合考生特征、是否兼顾分数与兴趣、是否充分提示风险并给出可行应对策略等。
夸克团队已完成对数千份志愿报告的专家标注与打分,通过“人类挑刺 + 模型修正”的方式,使模型输出在专业度与匹配度上持续逼近专家的真实判断标准。
夸克算法负责人蒋冠军表示:“高考志愿填报是一个信息密集、决策复杂的场景。我们希望通过高考志愿大模型在信息处理和需求理解方面的专业优势,让每一个考生、每一个家庭都能够获得全面的参考。”