论文题目:机器学习方法及其可解释性技术在车险定价中的应用 ——基于XGBoost模型
摘要:目前机器学习方法在诸多领域得到了广泛的应用,并取得巨大进展,但由于存在不可解释、不透明的缺点,制约了其在非寿险精算领域的实际应用。与此同时,我国商业车险市场化改革放大了保险公司的自主定价权,从而对其定价能力提出了更高的要求。因此可解释的人工智能技术在机器学习精算模型中的应用研究,将有助于机器学习方法在非寿险精算领域的推广,为保险公司提供了一种新的定价思路。本文主要是通过可解释的人工智能技术,研究机器学习精算模型的车险费率厘定过程,并以传统的广义线性模型为基准,说明机器学习精算模型的车险费率厘定过程及其预测结果具有合理性。首先,基于法国第三方责任险的车险保单数据freMTPL2freq和freMTPL2sev,对被保险人在一个保险年度的车险累积索赔额进行建模,并通过均方根误差来评价损失预测模型的预测精确度。然后,使用置换特征重要性方法、importance方法、interaction方法等可解释的人工智能技术,对损失预测模型中的“黑盒子”过程进行可视化、透明化,阐述损失预测模型的具体工作原理。最后,将XGBoost模型与广义线性模型进行对比,说明XGBoost模型的预测过程是合理的。基于车险费率厘定的国内外研究现状,本文提出以下两个创新点:第一,运用机器学习方法中的XGBoost模型,直接对车险累积索赔额进行预测。近年来,机器学习方法逐渐被应用于非寿险精算领域,其中的XGBoost模型更是在各大赛事中崭露头角,目前XGBoost模型主要应用于车险索赔频率及索赔强度的预测问题中,而较少有学者将其用于车险累积索赔额的预测中。因此本文在不考虑索赔是否发生的情况下,运用XGBoost模型中的线性回归对车险累积索赔额进行预测,并将其预测结果与广义线性模型进行比较。第二,运用importance、interaction、waterfall等可解释性方法,综合分析XGBoost模型在车险定价中的“黑盒子”过程。本文在对损失预测模型的可视化过程研究中,使用了 XGBoost模型特有的可解释性方法,与一般的可解释人工智能技术相比,importance方法、interaction方法以及waterfall方法,不仅涉及了车险费率厘定因子的重要性和边际效应分析,还详细且直观的阐述了车险费率厘定因子间交互效应的重要性。损失预测模型的实证结果表明:(1)当以均方根误差作为模型性能的评价指标时,XGBoost模型的预测精确度高于广义线性模型;(2)在可视化损失预测模型的“黑盒子”过程中,以广义线性模型为基准,车险费率厘定因子的重要性分析及边际效应分析结果表明,XGBoost模型的车险费率厘定过程及其结果具有合理性;(3)通过置换特征重要性方法对车险费率厘定因子的重要性分析,可以得出结论,XGBoost模型与广义线性模型中的车险费率厘定因子重要性排序基本一致,其中最重要的车险费率厘定因子是驾驶员风险因子,其次是车辆风险因子,最后是环境风险因子。
关键词:XGBoost模型;广义线性模型;可解释的人工智能技术;车险定价
学科专业:保险学
摘要
ABSTRACT
1 引言
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 文献综述
1.2.1 国内研究现状
1.2.2 国外研究现状
1.2.3 文献评述
1.3 研究内容及框架
1.3.1 研究内容
1.3.2 研究框架
1.4 本文创新点和不足
1.4.1 本文的创新点
1.4.2 本文的不足
2 车险费率厘定模型
2.1 车险费率厘定因子
2.1.1 驾驶员风险因子
2.1.2 车辆风险因子
2.1.3 环境风险因子
2.2 基于广义线性模型的车险费率厘定
2.2.1 广义线性模型的定义
2.2.2 广义线性模型的参数估计
2.3 基于XGBoost模型的车险费率厘定
2.3.1 集成学习方法的概述
2.3.2 XGBoost模型的定义
3 机器学习精算模型的可解释性技术
3.1 可解释的人工智能技术综述
3.2 全局可解释性方法
3.2.1 置换特征重要性方法
3.2.2 部分依赖图
3.2.3 累积局部效应图
3.2.4 Importance方法和Interaction方法
3.3 局部可解释性方法
3.3.1 Breakdown图
3.3.2 Waterfall方法
4 车险费率厘定模型的拟合及其可解释性实证分析
4.1 数据说明与变量分析
4.1.1 数据说明
4.1.2 变量分析
4.2 车险费率厘定模型的拟合与评估
4.2.1 广义线性模型拟合
4.2.2 XGBoost模型拟合
4.2.3 车险费率厘定模型评估
4.3 车险费率厘定模型的可解释性分析
4.3.1 车险费率厘定因子的重要性分析
4.3.2 车险费率厘定因子间交互效应重要性分析
4.3.3 车险费率厘定因子的边际效应分析
4.3.4 基于个体保单的车险费率厘定因子重要性分析
5 结论与展望
5.1 主要结论
5.2 展望
参考文献