You can not select more than 25 topics
			Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
		
		
		
		
			
				
					40 lines
				
				2.1 KiB
			
		
		
			
		
	
	
					40 lines
				
				2.1 KiB
			| 
											1 year ago
										 | = 卡方检验(适合度检验) | ||
|  | 卡方检验是在一个时期对模型所有等级的检验,即检验模型的所有等级及违约概率是否合适,检验的步骤如下: | ||
|  | == 准备建模时确定的各个等级对应的违约概率表 | ||
|  | 该表同 <<binomial_test_data_repared>> 二项检验准备建模时确定的各个等级对应的违约概率表 | ||
|  | 
 | ||
|  | == 统计并计算出用于卡方检验的各个指标,生成以下数据表 | ||
|  | 
 | ||
|  | image::chapter-correctness-of-estimating/002.png[] | ||
|  | 		 | ||
|  | link:resources/files/chapter-correctness-of-estimating/chi-square_test.xlsx[卡方检验指标 Excel 模板] | ||
|  | 
 | ||
|  | 其字段意义说明如下: | ||
|  | 
 | ||
|  | |=== | ||
|  | |字段中文名称 | 字段名称 | 字段类型 | 字段约束 | 备注 | ||
|  | |模型标识 | FD_MODEL_ID | varchar(32) | 不能为空 |  | ||
|  | |模型名称 | FD_MODEL_NAME | varchar(100) | 不能为空 |  | ||
|  | |等级 | FD_LEVEL | varchar(10) | 不能为空 |  | ||
|  | |建模时确定的违约概率 | FD_PD | 小数(精度 6) | 不能为空 |  | ||
|  | |评级客户个数 | FD_COUNT | 整数 | 不能为空 |  | ||
|  | |事实违约客户个数 | FD_DEFAULT_COUNT | 整数 | 不能为空 |  | ||
|  | |卡方值 | FD_CHI_SQUARE | 小数(精度 6) | 不能为空 | | ||
|  | |===  | ||
|  | 
 | ||
|  | == 汇总一个模型所有级别的卡方值,参照“卡方分布临界值常量表”进行对比 | ||
|  | 将上述指标表按照模型对所有级别的卡方值求和,得到模型的卡方检验值,和“卡方分布临界值常量表”中对应的值进行比较, | ||
|  | 如果模型的卡方检验值小于等于“卡方分布临界值常量表”中的值,表示该模型通过卡方检验,否则表示没有通过卡方检验。 | ||
|  | 
 | ||
|  | 对于上述示例来说,模型1的卡方检验值为 21.36777057,由于该模型包含3个等级,从 <<square_test_const_table>> 中查找“自由度”为 3 对应的那行数据, | ||
|  | 
 | ||
|  | ---- | ||
|  | 显著水平    0.1    0.05    0.01 | ||
|  | ------------------------------ | ||
|  | 1         2.706  3.841	 6.635 | ||
|  | 2         4.605  5.991   9.21 | ||
|  | 3         6.251  7.815   11.345(自由度为3,选择此行最为参照数据) | ||
|  | ---- | ||
|  | 
 | ||
|  | 通过比较,发现模型1的卡方检验值 21.36777057 不满足卡方分布临界值,所以该模型没有通过卡方检验。 |