> **来源:[研报客](https://pc.yanbaoke.cn)** # 长账龄衰减模型的构建与实证研究——基于KNN算法 ## 核心内容 本文探讨了不良贷款估值业务中长账龄衰减模型的构建问题,针对传统模型在资产池与静态池特征差异导致的估值偏差,提出了一种基于K-近邻(KNN)算法的改进方法。该方法通过计算资产池特征数据的质心,筛选出与目标资产池特征相似的静态池样本,从而提高模型的预测准确性。 ## 主要观点 - **问题背景**:不良贷款估值中,长账龄衰减模型用于估算回收价值衰减速率。然而,若静态池与待估值资产池特征分布差异较大,模型预测结果将不准确。 - **改进思路**:引入基于特征相似性的样本选择机制,通过KNN算法筛选出与资产池特征相近的静态池样本,以提升模型代表性。 - **模型构建**:传统模型以全量静态池数据为基础,通过幂函数拟合回收率与期数的关系,得出衰减速率。改进方法则通过筛选静态池样本,使模型更贴近资产池实际表现。 - **实证结果**:筛选后静态池的衰减速率更接近资产池的衰减速率,表明该方法能有效提升模型的准确性。 ## 关键信息 ### 1. 数据概况 - 资产池共包含47,431笔贷款,未偿本息费总额为211,861.73万元。 - 资产池未偿本息费的平均值为 **44,667.35元**。 ### 2. 特征选取 - 本文仅选取“未偿本息费余额”作为特征,因其在原报告中披露较为有限。 - 根据该特征,将资产池数据划分为不同区间,统计其回收率分布。 ### 3. 静态池数据统计 - 静态池分为一般账户和协商还款账户两类。 - 一般账户的未偿本息费平均占比为 **66.85%**,协商还款账户为 **33.15%**。 - 静态池未偿本息费分布如下: - **一般账户**: - **<=20000元**:13.14%(占全部账户的13.14%) - **(20000,30000]元**:9.49% - **(30000,100000]元**:25.50% - **>100000元**:1.87% - **协商还款账户**: - **<=30000元**:24.00% - **(30000,100000]元**:44.28% - **>100000元**:31.72% ### 4. KNN方法应用 - 由于数据可得性限制,本文采用“未偿本息费距离资产池平均值较近”且“未偿本息费占比为50%”的静态池数据进行建模。 - 筛选后静态池的未偿本息费分布如表5所示,其衰减速率为 **-0.646**,比全量静态池的 **-0.37** 更接近资产池的 **-1.081**。 ### 5. 实证结果 - 通过对比多个案例的衰减速率,发现使用KNN筛选后的静态池数据能更准确地反映资产池的回收规律。 - 表6显示: - 资产包A:全量静态池为 **-0.521**,筛选后为 **-0.474**,资产池为 **-0.432** - 资产包B:全量静态池为 **-0.806**,筛选后为 **-0.622**,资产池为 **-0.557** - 结果表明,筛选后的静态池数据对长账龄衰减模型的构建具有显著提升作用。 ## 研究结论与不足 ### 1. 研究结论 - KNN方法在长账龄衰减模型中的应用,有助于提高模型对资产池特征的匹配度,从而提升估值的准确性。 - 该方法为不良贷款估值业务提供了一种新的思路,具有一定的推广价值。 ### 2. 研究不足 - 原报告中资产池已剔除全额回收的债权,导致短期回收率偏低、长期回收率偏高,影响模型拟合效果。 - 静态池数据披露有限,关键数据缺失,需在后续研究中使用更全面的数据进行验证。 ## 案例推广 - 本文方法已在多个ABS不良资产包中进行实证分析,结果表明筛选后的静态池数据能够显著改善模型预测效果。 - 该方法适用于资产池与静态池特征异质化的场景,有助于提升长账龄衰减模型的适用性与准确性。