= 卡方检验(适合度检验) 卡方检验是在一个时期对模型所有等级的检验,即检验模型的所有等级及违约概率是否合适,检验的步骤如下: == 准备建模时确定的各个等级对应的违约概率表 该表同 <> 二项检验准备建模时确定的各个等级对应的违约概率表 == 统计并计算出用于卡方检验的各个指标,生成以下数据表 image::chapter-correctness-of-estimating/002.png[] link:resources/files/chapter-correctness-of-estimating/chi-square_test.xlsx[卡方检验指标 Excel 模板] 其字段意义说明如下: |=== |字段中文名称 | 字段名称 | 字段类型 | 字段约束 | 备注 |模型标识 | FD_MODEL_ID | varchar(32) | 不能为空 | |模型名称 | FD_MODEL_NAME | varchar(100) | 不能为空 | |等级 | FD_LEVEL | varchar(10) | 不能为空 | |建模时确定的违约概率 | FD_PD | 小数(精度 6) | 不能为空 | |评级客户个数 | FD_COUNT | 整数 | 不能为空 | |事实违约客户个数 | FD_DEFAULT_COUNT | 整数 | 不能为空 | |卡方值 | FD_CHI_SQUARE | 小数(精度 6) | 不能为空 | |=== == 汇总一个模型所有级别的卡方值,参照“卡方分布临界值常量表”进行对比 将上述指标表按照模型对所有级别的卡方值求和,得到模型的卡方检验值,和“卡方分布临界值常量表”中对应的值进行比较, 如果模型的卡方检验值小于等于“卡方分布临界值常量表”中的值,表示该模型通过卡方检验,否则表示没有通过卡方检验。 对于上述示例来说,模型1的卡方检验值为 21.36777057,由于该模型包含3个等级,从 <> 中查找“自由度”为 3 对应的那行数据, ---- 显著水平 0.1 0.05 0.01 ------------------------------ 1 2.706 3.841 6.635 2 4.605 5.991 9.21 3 6.251 7.815 11.345(自由度为3,选择此行最为参照数据) ---- 通过比较,发现模型1的卡方检验值 21.36777057 不满足卡方分布临界值,所以该模型没有通过卡方检验。