基于GA--BP神经网络模型车险索赔频率预测方法研究.pdf
摘要
摘要
车险行业是我国保险市场的重要组成部分。随着汽车保有量的增加和保
险意识的提高,车险行业正逐渐成为一个快速发展的领域,规模不断扩大,
市场竞争愈发激烈,产品不断创新,这些因素推动着车险行业的进步。车险
定价在这一过程中变得愈发重要,车险索赔频率预测成为保险公司首要考虑
的问题。随着大数据技术的快速发展,将机器学习方法应用于车险索赔频率
预测是必然趋势。
本文选取法国某保险公司车险客户数据,包含客户和车辆特征,例如客
户年龄、居住区域、车辆年龄等,针对此数据集,建立传统的广义线性模型
(GLM)和广义可加模型(GAM),以及基于反向传播神经网络(BPNN)
和Boosting算法的机器学习模型对车险索赔频率进行预测并对比,来探究预
测效果较好的模型。首先对车险客户数据进行描述性统计分析,进一步发掘
数据特点,并对数据进行特征预处理,按照9:1的比例划分训练集和测试集
并进行建模;其次建立传统的GLM和GAM精算模型,并将P样条和三次样
条两种不同的光滑函数引入GAM模型,对比得出使用三次样条光滑函数的
GAM模型效果最好;之后选择BP神经网络构建车险索赔频率模型,并使用
遗传算法优化BP神经网络的全局寻优能力,发现GA-BP神经网络达到优化
权值和阈值的效果,预测效果较好;最后使用基于Boosting算法的XGBoost
和LightGBM来构建车险索赔频率预测模型,为了提高模型的准确性将
XGBoost-LightGBM组合模型加入比较,其相较于单一模型提高模型准确率,
但较GA-BP神经网络相比仍存在差距。
将传统模型和机器学习模型对比发现:GA-BP神经网络明显增强了全局
寻优的能力,达到优化权值和阈值的效果,使用该模型预测车险索赔频率时,
样本内损失为151.742,样本外损失为152.946,相比于传统精算模型中最优
的广义可加模型,样本内损失降低4.947,样本外损失降低4.649。相比于
XGBoost-LightGBM组合模型,样本内损失降低0.97,样本外损失降低0.708。
这说明GA-BP神经网络对车险索赔频率预测是有效的,可为车险行业的定价
问题提供一定指导,具有较高的研究价值。
关键词:索赔频率;广义可加模型;BP神经网络;遗传算法;Boosting算法
I
目录
目录
第1章引言1
1.1研究背景及意义1
1.2国内外研究现状及发展趋势2
1.2.1国内研究现状2
1.2.2国外研究现状3
1.3研究内容与创新点4
1.3.1研究内容4
1.3.2创新点5
第2章预备知识6
2.1车险索赔频率及其分布6
2.2回归分析与回归算法7
2.3随机梯度下降算法8
第3章模型介绍9
3.1传统索赔频率预测模型9
3.1.1广义线性模型9
3.1.2广义可加模型12
3.2BP神经网络15
3.2.1人工神经网络简介15
3.2.2BP神经网络简介16
3.3遗传算法18
3.3.1遗传算法概述18
3.3.2遗传算法特点19
3.3.3遗传算法运算过程20
3.3.4遗传算法优化BP神经网络21
3.4Boosting算法22
3.4.1XGBoost模型22
3.4.2LightGBM模型24
3.2.3XGBoost-LightGBM组合模型25
第4章实证分析26
IV