You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
39 lines
2.1 KiB
39 lines
2.1 KiB
= 卡方检验(适合度检验)
|
|
卡方检验是在一个时期对模型所有等级的检验,即检验模型的所有等级及违约概率是否合适,检验的步骤如下:
|
|
== 准备建模时确定的各个等级对应的违约概率表
|
|
该表同 <<binomial_test_data_repared>> 二项检验准备建模时确定的各个等级对应的违约概率表
|
|
|
|
== 统计并计算出用于卡方检验的各个指标,生成以下数据表
|
|
|
|
image::chapter-correctness-of-estimating/002.png[]
|
|
|
|
link:resources/files/chapter-correctness-of-estimating/chi-square_test.xlsx[卡方检验指标 Excel 模板]
|
|
|
|
其字段意义说明如下:
|
|
|
|
|===
|
|
|字段中文名称 | 字段名称 | 字段类型 | 字段约束 | 备注
|
|
|模型标识 | FD_MODEL_ID | varchar(32) | 不能为空 |
|
|
|模型名称 | FD_MODEL_NAME | varchar(100) | 不能为空 |
|
|
|等级 | FD_LEVEL | varchar(10) | 不能为空 |
|
|
|建模时确定的违约概率 | FD_PD | 小数(精度 6) | 不能为空 |
|
|
|评级客户个数 | FD_COUNT | 整数 | 不能为空 |
|
|
|事实违约客户个数 | FD_DEFAULT_COUNT | 整数 | 不能为空 |
|
|
|卡方值 | FD_CHI_SQUARE | 小数(精度 6) | 不能为空 |
|
|
|===
|
|
|
|
== 汇总一个模型所有级别的卡方值,参照“卡方分布临界值常量表”进行对比
|
|
将上述指标表按照模型对所有级别的卡方值求和,得到模型的卡方检验值,和“卡方分布临界值常量表”中对应的值进行比较,
|
|
如果模型的卡方检验值小于等于“卡方分布临界值常量表”中的值,表示该模型通过卡方检验,否则表示没有通过卡方检验。
|
|
|
|
对于上述示例来说,模型1的卡方检验值为 21.36777057,由于该模型包含3个等级,从 <<square_test_const_table>> 中查找“自由度”为 3 对应的那行数据,
|
|
|
|
----
|
|
显著水平 0.1 0.05 0.01
|
|
------------------------------
|
|
1 2.706 3.841 6.635
|
|
2 4.605 5.991 9.21
|
|
3 6.251 7.815 11.345(自由度为3,选择此行最为参照数据)
|
|
----
|
|
|
|
通过比较,发现模型1的卡方检验值 21.36777057 不满足卡方分布临界值,所以该模型没有通过卡方检验。
|
|
|