
2026年高考志愿智能填报辅助系统http://gkzy.yescollege.cn能够帮助你选择志愿这里有三年23-25年的录取数据加上智能算法输入全省的位次高考分数选科组合就可以生成冲稳保的志愿省却了很多麻烦。同时还可以详细查看志愿中的院校的详细的关键介绍让你有更好的决策。以下为可靠的智能算法实现高考志愿智能匹配系统 V12.1【版本说明】V12.1 是最终完整版本综合了此前所有版本的实践经验与用户反馈。本规范包含完整的决策链路、算法公式、参数配置、输出字段定义及异常处理策略可直接作为开发团队的技术实现依据。核心改进相比V12.01. 异常数据过滤机制合理范围检查 波动率惩罚2. 稳健分类基准波动大时使用中位数替代最小值3. 招生计划历史数据从enrollment_history表读取三年计划4. 补位后重新排序确保各组内部排序规则一致5. 输出字段完整化包含专业代码、各维度评分、历史数据、预测数据等一、系统目标为山东省或其他新高考省份考生提供96个“学校专业”的精准推荐按“冲刺”“稳妥”“保底”三组展示每组内部按不同策略排序确保推荐结果既安全又优质。二、系统输入输入参数来自用户请求┌─────────────────────────────────────────────────────────────────┐│ 参数名 │ 类型 │ 必填 │ 说明 │├─────────────────────────────────────────────────────────────────┤│ R │ int │ 是 │ 考生全省位次 ││ score │ int │ 否 │ 考生高考总分 ││ subjects │ ListString │ 是 │ 选科组合 ││ batch │ String │ 是 │ 本科批/专科批等 ││ collegeLevel │ String │ 否 │ 985/211/双一流/不限││ nature │ String │ 否 │ 公办/民办/不限 ││ provincePreference │ ListString │ 否 │ 省份偏好 ││ majorPreferences │ ListString │ 否 │ 专业偏好 ││ tuitionMin │ Integer │ 否 │ 最低学费 ││ tuitionMax │ Integer │ 否 │ 最高学费 ││ includeCooperation │ Boolean │ 否 │ 是否包含中外合作 │└─────────────────────────────────────────────────────────────────┘三、数据源系统依赖以下数据表┌─────────────────────────────────────────────────────────────────┐│ 表名 │ 用途 │├─────────────────────────────────────────────────────────────────┤│ college │ 院校基本信息名称、代码、省份、城市、 ││ │ 层次、性质、标签等 │├─────────────────────────────────────────────────────────────────┤│ major │ 专业基本信息名称、代码、所属院校、 ││ │ 选科要求、学制、学费、招生计划、 ││ │ 三年录取位次等 │├─────────────────────────────────────────────────────────────────┤│ enrollment_history │ 各专业历年招生计划数2023/2024/2025 │├─────────────────────────────────────────────────────────────────┤│ college_value │ 院校价值评分总评分及各维度分数 │├─────────────────────────────────────────────────────────────────┤│ professional_value │ 专业价值评分总评分及各维度分数 │├─────────────────────────────────────────────────────────────────┤│ major_hotness │ 专业热度数据热度指数、就业率、薪资等 │└─────────────────────────────────────────────────────────────────┘四、完整决策Pipeline12步┌─────────────────────────────────────────────────────────────────────────────┐│ V12.1 完整决策Pipeline │├─────────────────────────────────────────────────────────────────────────────┤│ Step 1: 硬条件筛选 ││ ├── 选科匹配支持不限 ││ ├── 批次匹配BATCH_MAPPING ││ ├── 院校层次过滤 ││ ├── 办学性质过滤 ││ ├── 地域偏好过滤 ││ ├── 专业意向过滤 ││ ├── 学费区间过滤 ││ └── 中外合作办学过滤 │├─────────────────────────────────────────────────────────────────────────────┤│ Step 2: 历史数据提取与清洗核心异常处理 ││ ├── 提取三年录取位次rank2023/2024/2025 ││ ├── 提取三年招生计划plan2023/2024/2025 ││ ├── 有效性检查有效年份 2 ││ ├── 合理范围检查minRank ∈ [R×0.3, R×3.0] ││ ├── 波动率检查varianceRate 0.8 ││ └── 标记是否使用中位数varianceRate 0.4 时使用 │├─────────────────────────────────────────────────────────────────────────────┤│ Step 3: 计算统计量 ││ ├── minRank, maxRank, medianRank, meanRank ││ ├── stdRank, varianceRate ││ └── stabilityScore exp(-varianceRate) │├─────────────────────────────────────────────────────────────────────────────┤│ Step 4: 计算可行性feasibility ││ ├── baseRank varianceRate0.4 ? minRank : medianRank ││ ├── distance baseRank - R ││ ├── scale 5000 (R/720000)*20000, 钳位[3000,30000] ││ ├── feasibility_raw 1/(1exp(distance/scale)) ││ └── feasibility 0.75*feasibility_raw 0.25*stabilityScore │├─────────────────────────────────────────────────────────────────────────────┤│ Step 5: 计算价值评分 ││ ├── 院校价值CollegeValueScore (0-100) ││ ├── 专业价值MajorValueScore (0-100) ││ ├── 就业价值EmploymentValue (0-100) ││ └── 综合质量分QualityScore 0.5*院校 0.35*专业 0.15*就业 │├─────────────────────────────────────────────────────────────────────────────┤│ Step 6: 冲稳保分类基于位次比 ││ ├── percentile R / 720000 ││ ├── rushRatio 0.85 - 0.15*percentile, 钳位[0.65,0.90] ││ ├── stableRatio 1.15 0.10*percentile, 钳位[1.10,1.35] ││ ├── ratio classificationRank / R ││ ├── ratio rushRatio → 冲刺 ││ ├── rushRatio ratio stableRatio → 稳妥 ││ └── ratio stableRatio → 保底 │├─────────────────────────────────────────────────────────────────────────────┤│ Step 7: 计算安全指数 ││ └── safetyIndex (R - baseRank) / (maxRank - minRank 1) ││ 钳位[-1, 1]负值表示考生优于历史最好更安全 │├─────────────────────────────────────────────────────────────────────────────┤│ Step 8: 计算风险等级与可信度 ││ ├── 风险等级基于分类可行性波动率综合判定 ││ └── 可信度有效年份(25/年) 波动惩罚 计划完整性(10/20/30) │├─────────────────────────────────────────────────────────────────────────────┤│ Step 9: 计算预测位次仅展示 ││ └── predictRank 时间衰减加权(2023:0.2, 2024:0.3, 2025:0.5) │├─────────────────────────────────────────────────────────────────────────────┤│ Step 10: 动态配额分配 ││ └── 根据percentile查表分配冲/稳/保数量总计96个 │├─────────────────────────────────────────────────────────────────────────────┤│ Step 11: 组内排序 ││ ├── 冲刺组按可行性feasibility降序 ││ ├── 稳妥组按综合质量分QualityScore降序 ││ └── 保底组按院校价值CollegeValueScore降序 │├─────────────────────────────────────────────────────────────────────────────┤│ Step 12: 拼接输出 ││ ├── 冲刺组 → 稳妥组 → 保底组 ││ ├── 不足96时补位 ││ └── 填充所有输出字段 │└─────────────────────────────────────────────────────────────────────────────┘五、详细算法规范5.1 硬条件筛选----------------------------------------------------5.1.1 选科匹配支持不限IF subject_requirement IS NULL OR subject_requirement OR subject_requirement 不限:匹配ELSE:必须包含所有考生选科AND逻辑例如考生选 [物理, 化学]要求 物理化学 匹配物理化学生物 不匹配5.1.2 批次匹配使用 BATCH_MAPPING 映射BATCH_MAPPING {本科批: [本科批, 一段线, 特殊类型批],专科批: [专科批, 二段线],提前批: [提前批, 本科提前批],专科提前批: [专科提前批]}5.1.3 其他筛选中外合作办学cooperation 0 OR cooperation IS NULL学费区间tuition BETWEEN [tuitionMin, tuitionMax]5.2 数据清洗与验证核心----------------------------------------------------对每个学校专业组合执行以下检查5.2.1 有效年份检查validYears COUNT(rank2023 0, rank2024 0, rank2025 0)IF validYears 2: DROP数据不足5.2.2 合理范围检查minRank MIN(rank2023, rank2024, rank2025)IF minRank R * 0.3 OR minRank R * 3.0: DROP超出合理范围原理若历史最低位次与考生位次相差超过3倍或小于0.3倍说明两者不匹配推荐无意义5.2.3 波动率检查varianceRate STD(rank2023, rank2024, rank2025) / MEAN(rank2023, rank2024, rank2025)IF varianceRate 0.8: DROP波动过大无法可靠预测IF varianceRate 0.4: useMedianForClassification true使用中位数分类ELSE: useMedianForClassification false使用最小值分类5.2.4 计算统计量minRank MIN(有效位次)maxRank MAX(有效位次)medianRank MEDIAN(有效位次)meanRank MEAN(有效位次)stdRank STD(有效位次)varianceRate stdRank / (meanRank 1)stabilityScore EXP(-varianceRate)5.3 可行性模型----------------------------------------------------目的量化考生被该专业录取的可能性值域 [0, 1]5.3.1 确定基准位次IF varianceRate 0.4:baseRank minRank历史最好成绩ELSE:baseRank medianRank中位数抗异常5.3.2 计算位次差distance baseRank - Rdistance 0 表示考生位次优于历史最好更安全5.3.3 自适应尺度scale 5000 (R / 720000) * 20000scale CLAMP(scale, 3000, 30000)5.3.4 Sigmoid转换feasibility_raw 1 / (1 EXP(distance / scale))5.3.5 稳定性平滑feasibility 0.75 * feasibility_raw 0.25 * stabilityScore5.4 价值评分体系----------------------------------------------------5.4.1 院校价值CollegeValueScore, 0-100优先从 college_value 表读取 totalScore。若无数据静态评分规则- C9联盟100- 985工程90- 211工程 或 双一流80- 省重点70- 其他505.4.2 专业价值MajorValueScore, 0-100优先从 professional_value 表读取 totalScore。若无数据基于院校层次和专业名称估算- 985院校 热门专业计算机/临床医学等85~90- 211院校 热门专业75~80- 其他50~655.4.3 就业价值EmploymentValue, 0-100优先从 major_hotness 表读取 employmentRate。若无数据基于专业名称估算- 计算机/软件/人工智能85- 临床医学/口腔医学80- 电子信息/自动化75- 经管类70- 土木/建筑55- 人文类505.4.4 综合质量分QualityScore, 0-100QualityScore 0.50 * CollegeValueScore 0.35 * MajorValueScore 0.15 * EmploymentValue5.5 冲稳保分类----------------------------------------------------目的将每个志愿归入冲刺稳妥保底三类5.5.1 计算考生百分位percentile R / 720000percentile CLAMP(percentile, 0.0001, 0.9999)5.5.2 自适应阈值rushRatio 0.85 - 0.15 * percentile // 0.70 ~ 0.85stableRatio 1.15 0.10 * percentile // 1.15 ~ 1.25// 确保区间宽度至少0.20IF stableRatio - rushRatio 0.20:stableRatio rushRatio 0.20// 钳位rushRatio CLAMP(rushRatio, 0.65, 0.90)stableRatio CLAMP(stableRatio, 1.10, 1.35)5.5.3 计算位次比classificationRank varianceRate 0.4 ? minRank : medianRankratio classificationRank / R5.5.4 分类规则IF ratio rushRatio: bucket 冲刺ELSE IF ratio stableRatio: bucket 稳妥ELSE: bucket 保底5.5.5 安全指数safetyIndex (R - classificationRank) / (maxRank - minRank 1)safetyIndex CLAMP(safetyIndex, -1.0, 1.0)负值表示考生位次优于历史最好越负越安全5.6 风险等级与可信度----------------------------------------------------5.6.1 风险等级- 保底志愿feasibility 0.8 → LOW0.6 feasibility 0.8 → MEDIUMfeasibility 0.6 → HIGH- 稳妥志愿feasibility 0.7 AND varianceRate 0.2 → LOWfeasibility 0.4 → MEDIUMELSE → HIGH- 冲刺志愿feasibility 0.6 AND varianceRate 0.2 → MEDIUMELSE → HIGH5.6.2 可信度0-100credibility validYears * 25 // 3年752年50// 波动惩罚IF varianceRate 0.6: credibility - 30ELSE IF varianceRate 0.4: credibility - 20ELSE IF varianceRate 0.2: credibility - 10// 招生计划完整性加分planCount COUNT(plan2023 0, plan2024 0, plan2025 0)IF planCount 3: credibility 30ELSE IF planCount 2: credibility 20ELSE IF planCount 1: credibility 10credibility CLAMP(credibility, 0, 100)5.7 预测位次仅展示----------------------------------------------------目的为前端提供预测位次展示字段不参与决策predictRank 时间衰减加权 (rank2023 * 0.20 rank2024 * 0.30 rank2025 * 0.50)/ (0.20 0.30 0.50)仅使用有效年份的数据缺少年份不参与加权gap R - predictRank5.8 录取概率仅展示----------------------------------------------------目的为前端提供录取概率展示字段不参与决策admitProbability 1 / (1 EXP(-gap / 5000))gap 0 表示考生优于预测位次概率 50%5.9 动态配额分配----------------------------------------------------根据百分位查表分配各组数量┌─────────────────────────────────────────────────────────────────┐│ 百分位范围 │ 冲刺 │ 稳妥 │ 保底 │ 合计 │├─────────────────────────────────────────────────────────────────┤│ percentile 0.05 │ 50 │ 30 │ 16 │ 96 ││ 0.05 ≤ p 0.30 │ 35 │ 40 │ 21 │ 96 ││ 0.30 ≤ p 0.70 │ 24 │ 48 │ 24 │ 96 ││ 0.70 ≤ p 0.90 │ 15 │ 45 │ 36 │ 96 ││ 0.90 ≤ p 1.00 │ 8 │ 32 │ 56 │ 96 │└─────────────────────────────────────────────────────────────────┘5.10 组内排序----------------------------------------------------目的确保每组内部按最优策略排序┌─────────────────────────────────────────────────────────────────┐│ 分组 │ 排序键 │ 排序方向 │ 理由 │├─────────────────────────────────────────────────────────────────┤│ 冲刺 │ feasibility │ 降序 │ 最可能录取的冲刺优先 ││ 稳妥 │ QualityScore │ 降序 │ 质量最高的稳妥优先 ││ 保底 │ CollegeValueScore │ 降序 │ 院校最好的保底优先 │└─────────────────────────────────────────────────────────────────┘5.11 补位策略----------------------------------------------------若某组实际候选数量不足配额1. 从下一组按该组排序规则补足如冲刺不足从稳妥取可行性最高的2. 补位后重新对该组按排序键排序确保顺序正确3. 补位志愿标记 bucket bucket -补位若总候选不足96个1. 放宽合理范围至 [R×0.2, R×4.0]2. 从剩余候选中按可行性降序补足至96个3. 标记为补位5.12 最终拼接顺序----------------------------------------------------最终推荐列表顺序固定为冲刺组含补位 → 稳妥组含补位 → 保底组含补位每组内部按各自排序规则排列。六、输出字段清单每个推荐志愿必须包含以下字段按模块分组【基本标识】┌─────────────────────────────────────────────────────────────────┐│ 字段名 │ 类型 │ 说明 │├─────────────────────────────────────────────────────────────────┤│ rank │ int │ 序号1~96 ││ school │ String │ 院校名称 ││ schoolCode │ String │ 院校代码 ││ major │ String │ 专业名称 ││ majorCode │ String │ 专业代码必须 ││ subjectRequirement│ String │ 选科要求 ││ schoolType │ String │ 院校类型综合/理工等 ││ city │ String │ 所在城市 ││ province │ String │ 所在省份 ││ level │ String │ 院校层次985/211/双一流等 ││ nature │ String │ 办学性质公办/民办 ││ tags │ String │ 院校标签 ││ batch │ String │ 批次 ││ tuition │ Integer │ 学费元/年 ││ schoolLength │ Integer │ 学制年 ││ majorClass │ String │ 专业类 │└─────────────────────────────────────────────────────────────────┘【分类标签】┌─────────────────────────────────────────────────────────────────┐│ 字段名 │ 类型 │ 说明 │├─────────────────────────────────────────────────────────────────┤│ bucket │ String │ 冲刺/稳妥/保底 ││ subType │ String │ 细分类型如冲-高风险/稳-标准等 │└─────────────────────────────────────────────────────────────────┘【评分值】┌─────────────────────────────────────────────────────────────────┐│ 字段名 │ 类型 │ 说明 │├─────────────────────────────────────────────────────────────────┤│ collegeValueScore │ int │ 院校价值评分0-100 ││ majorValueScore │ int │ 专业价值评分0-100 ││ employmentValue │ int │ 就业价值评分0-100 ││ qualityScore │ int │ 综合质量分0-100 │└─────────────────────────────────────────────────────────────────┘【录取概率与风险】┌─────────────────────────────────────────────────────────────────┐│ 字段名 │ 类型 │ 说明 │├─────────────────────────────────────────────────────────────────┤│ feasibility │ double │ 可行性0-1乘100显示百分比 ││ admitProbability │ double │ 录取概率0-1乘100显示百分比 ││ safetyIndex │ double │ 安全指数-1~1乘100显示百分比 ││ riskLevel │ String │ 风险等级高/中/低 ││ credibility │ double │ 可信度0-100 │└─────────────────────────────────────────────────────────────────┘【历史与预测数据】┌─────────────────────────────────────────────────────────────────┐│ 字段名 │ 类型 │ 说明 │├─────────────────────────────────────────────────────────────────┤│ rank2023 │ Integer │ 2023年最低录取位次 ││ rank2024 │ Integer │ 2024年最低录取位次 ││ rank2025 │ Integer │ 2025年最低录取位次 ││ plan2023 │ Integer │ 2023年招生计划 ││ plan2024 │ Integer │ 2024年招生计划 ││ plan2025 │ Integer │ 2025年招生计划 ││ predictRank │ Integer │ 预测位次展示用 ││ gap │ Integer │ 考生位次 - 预测位次 ││ varianceRate │ double │ 波动率展示用 │└─────────────────────────────────────────────────────────────────┘【推荐理由】┌─────────────────────────────────────────────────────────────────┐│ 字段名 │ 类型 │ 说明 │├─────────────────────────────────────────────────────────────────┤│ matchReason │ String │ 匹配理由简短文字 │└─────────────────────────────────────────────────────────────────┘七、异常处理与兜底策略7.1 数据不足兜底----------------------------------------------------若经过所有过滤后候选专业少于96个1. 放宽合理范围限制R×0.2 ~ R×4.02. 放宽波动率限制varianceRate 0.93. 放宽有效年份限制有效年份 14. 从放宽后的候选中按可行性降序补足至96个5. 标记所有放宽补入的志愿为补位7.2 某组为空兜底----------------------------------------------------若某组如冲刺为01. 从下一组稳妥按可行性降序取配额数量补入2. 补入后重新对该组按排序键排序3. 标记为补位7.3 评分缺失兜底----------------------------------------------------若某项评分无法获取使用默认值- 院校价值50- 专业价值50- 就业价值507.4 位次缺失兜底----------------------------------------------------若某专业三年位次均缺失但有效年份2不可能使用- minRank R * 1.5- maxRank R * 2.0- medianRank R * 1.7八、参数配置表可调参数┌─────────────────────────────────────────────────────────────────┐│ 参数名 │ 默认值 │ 说明 │├─────────────────────────────────────────────────────────────────┤│ TOTAL_CANDIDATES │ 720000 │ 山东省总考生数 ││ WEIGHT_2023 │ 0.20 │ 2023年时间衰减权重 ││ WEIGHT_2024 │ 0.30 │ 2024年时间衰减权重 ││ WEIGHT_2025 │ 0.50 │ 2025年时间衰减权重 ││ RANGE_LOWER_BOUND │ 0.3 │ 合理范围下限 ││ RANGE_UPPER_BOUND │ 3.0 │ 合理范围上限 ││ HIGH_VOLATILITY_THRESHOLD │ 0.8 │ 高波动丢弃阈值 ││ MEDIUM_VOLATILITY_THRESHOLD │ 0.4 │ 中位数切换阈值 ││ SCALE_BASE │ 5000 │ 可行性尺度基准 ││ SCALE_MULTIPLIER │ 20000 │ 可行性尺度乘数 ││ SCALE_MIN │ 3000 │ 可行性尺度最小值 ││ SCALE_MAX │ 30000 │ 可行性尺度最大值 ││ RUSH_RATIO_BASE │ 0.85 │ 冲刺比例基准 ││ RUSH_RATIO_ADJUST │ 0.15 │ 冲刺比例调整系数 ││ STABLE_RATIO_BASE │ 1.15 │ 稳妥比例基准 ││ STABLE_RATIO_ADJUST │ 0.10 │ 稳妥比例调整系数 ││ MIN_BUCKET_WIDTH │ 0.20 │ 最小分类区间宽度 ││ COLLEGE_VALUE_WEIGHT │ 0.50 │ 院校价值在质量分中权重 ││ MAJOR_VALUE_WEIGHT │ 0.35 │ 专业价值在质量分中权重 ││ EMPLOYMENT_VALUE_WEIGHT │ 0.15 │ 就业价值在质量分中权重 │└─────────────────────────────────────────────────────────────────┘九、输出示例JSON结构{total: 96,recommendations: [{rank: 1,school: 清华大学,schoolCode: A003,major: 计算机科学与技术,majorCode: 080901,subjectRequirement: 物理化学,schoolType: 理工,city: 北京,province: 北京,level: 985,211,双一流,nature: 公办,tags: C9 985 211 双一流,batch: 本科批,tuition: 5000,schoolLength: 4,majorClass: 计算机类,bucket: 冲刺,subType: 冲-高风险,collegeValueScore: 100,majorValueScore: 100,employmentValue: 95,qualityScore: 98,feasibility: 0.35,admitProbability: 0.30,safetyIndex: -23.5,riskLevel: 高,credibility: 85.0,rank2023: 48,rank2024: 52,rank2025: 50,plan2023: 100,plan2024: 100,plan2025: 100,predictRank: 50,gap: 18,varianceRate: 0.04,matchReason: 历史录取位次优于考生位次有冲刺机会}// ... 更多推荐]}十、设计原则总结┌─────────────────────────────────────────────────────────────────┐│ V12.1 七大核心设计原则 │├─────────────────────────────────────────────────────────────────┤│ 1. 数据清洗优先异常数据过滤比复杂模型更重要 ││ 2. 稳健分类基准波动大时使用中位数避免异常值误导 ││ 3. 排序策略分离冲刺看可能性稳妥看质量保底看院校 ││ 4. 输出信息完整所有决策依据透明可查 ││ 5. 固定输出数量96个满足用户期望 ││ 6. 自适应配额根据考生百分位动态分配各组数量 ││ 7. 多重兜底机制确保任何情况都能输出96个有效志愿 │└─────────────────────────────────────────────────────────────────┘规范结束