《数据挖掘与机器学习》 课件9.3 构建电信运营商用户流失预测模型.pptx
8南宁职业技术学
院
NCVTNANNINGCOLLEGEFORVOCATIONALTECHNOLOGY
厨
数据挖掘与机器学习
DATAMININGA°NDMACHINELEARNING
构建电信运营商用户流失预测模型
电信运营商用户分析
任务描述构建电信运营商用户流失预测模型
电信企业为了最大程度地控制客户流失、挽留现存在网用户,分析不同群体用户的使用规
律,识别各群体客户流失的重要特征。
为了系统地描述电信运营商用户流失的规律,引入数学模型对电信运营商用户数据进行分
析。运营商要实现控制客户流失、挽留现存在网用户,必须深入贯彻以人民为中心的发展
思想。
本任务的具体目标是基于电信运营商用户分群模型建立逻辑回归模型、决策树模型和朴素
贝叶斯模型,选取最优的用户流失模型。
构建电信运营商用户流失预测模型
任务要求
分析不同群体用户的使用规律,识别各群体客户流失的重要特征。
建立不同群体用户流失模型,建立逻辑回归模型、决策树模型和朴
素贝叶斯模型,判断模型建立的效果。
选取最优的用户流失模型。
构建电信运营商用户流失预测模型
相关知识
所有与消费者挂钩行业都会关注客户流失。
由于发展一个新客户是需要一定成本的,如果客户流失,不仅浪费了拉新成本,
还需要花费更多的用户召回成本。
因此,基于电信行业在竞争日益激烈的情况,如何挽留更多用户成为一项关键
业务指标。
为了更好运营用户,这就要求要了解流失用户的特征,分析流失原因,预测用
户流失,确定挽留目标用户并制定有效方案,提升企业核心竞争力。
Part2任务实施
·特征值提取
·构建电信商用户流失预测模型
构建电信运营商用户流失预测模型
特征值提取
基于树的特1.导入开发
特征变量选取
征选择库
基于树的特征选择构建电信运营商用户流失预测模型
特征抽取是数据挖掘任务最为重要的一个环节,一般而言,它对最终结果的影响要高
过数据挖掘算法本身。
只有先把现实用特征表示出来,才能借助数据挖掘的力量找到问题的答案。
特征选择的另一个优点在于:降低真实世界的复杂度,模型比现实更容易操纵。
特征选择能够降低复杂度、降低噪音和增加模型可读性。
基于树的特征选择构建电信运营商用户流失预测模型
单个特征和某一类别之间相关性的计算方法有很多,比较有效的有卡方检验(chi2)以
及互信息和信息熵,本文选择基于信息熵的方法来选取特征变量。
信息熵是在决策树中广泛使用的一个变量,用以获取最优划分的节点。
基于树的预测模型能够用来计算特征的重要程度,能用来去除不相关的特征。因此选择
基于树的特征选择(Tree-basedfeatureselection)来获取特征变量。
构建电信运营商用户流失预测模型
导入开发库
使用from和import导入sklearn.ensemble