文档详情

Python金融数据分析与应用课件 第4章 金融数据描述性分析与可视化.pptx

发布:2025-04-19约4.27千字共27页下载文档
文本预览下载声明

公众号:陈西设计之家。微信搜索即可。更多免费原创PPT模板以及教程设计作品源文件可以在公众号内无条件获取。金融数据描述性分析与可视化Python金融数据分析与应用(微课版)第四章

公众号:陈西设计之家。微信搜索即可。更多免费原创PPT模板以及教程设计作品源文件可以在公众号内无条件获取。目录CONTENTS统计量和描述性分析4.1双变量的描述性分析4.2金融技术分析工具4.3

公众号:陈西设计之家。微信搜索即可。更多免费原创PPT模板以及教程设计作品源文件可以在公众号内无条件获取。4.1统计量和描述性分析

4.1统计量和描述性分析4.1.1定性变量的描述性分析(1)频数分布频数是指特定数值在数据集中出现的次数,而频率是指该数值在数据集中出现的次数占数据集总样本量的比例。众数是数据集中出现次数最多的数值。频数分布表将数据集中的每个不同数值及其频数以表格形式列出。表4-1 行业分类频数分布表行业分类频数频率汽车119.2%房地产2319.2%银行4638.3%交通运输4033.3%

公众号:陈西设计之家。微信搜索即可。更多免费原创PPT模板以及教程设计作品源文件可以在公众号内无条件获取。4.1统计量和描述性分析(2)定性变量的描述性分析Python应用举例【案例4-1】金融贷款审批金融贷款审批是金融机构在向客户提供贷款之前,对客户的信用状况、还款能力等方面进行评估的过程,这一过程对金融机构的风险管理和资产质量控制至关重要。在金融贷款审批过程中,金融机构会收集并分析客户的财务状况、工作背景等数据。本案例收集了客户的性别、婚姻状况、受教育程度、收入(元/月)、贷款金额(万元)、城市、贷款状态等信息,具体数据见文件“金融贷款审批.xlsx”。4.1.1定性变量的描述性分析

4.1统计量和描述性分析4.1.1定性变量的描述性分析以【案例4-1】金融贷款审批数据集中的定性变量“受教育程度”为例,使用pandas来进行定性变量的频数分析。步骤1使用pandas的value_counts()函数计算受教育程度的频数分布。步骤2使用pandas和Matplotlib来绘制频数分布柱形图。Python演示

4.1统计量和描述性分析4.1.2定量变量的描述性分析常用的基本描述统计量主要可以分为表示集中趋势的统计量、表示离散程度的统计量、表示分布形态的统计量。Python演示

公众号:陈西设计之家。微信搜索即可。更多免费原创PPT模板以及教程设计作品源文件可以在公众号内无条件获取。4.2双变量的描述性分析

4.2双变量的描述性分析4.2.1定性变量与定性变量(1)列联表列联表,又称交互分类表,是一种用于分析两个或多个变量之间关系的方法。列联表通常是一个二维表格,其中的行表示一个变量的不同取值,列表示另一个变量的不同取值。表格中的每个单元格记录了两个变量同时具有某个取值的频数或频率。表 列联表常规格式ABB1B2A1n11n12A2n21n22A3n31n32

4.2双变量的描述性分析4.2.1定性变量与定性变量(2)双定性变量的关系分析Python应用举例本节以【案例4-1】金融贷款审批数据中的定性变量“贷款状态”和“城市”为例,进行双定性变量的关系分析。步骤1使用pd.crosstab()函数创建频数列联表,其中行索引为数据集中的“城市”列,列索引为“贷款状态”列,列联表将展示每个城市贷款状态的频数。步骤2计算每个元素占该行总和的比例。步骤?3为了更直观地展示数据分布情况,绘制百分比堆积柱形图。百分比堆积柱形图直条高度表示各类别的占比情况,总百分比为100%。Python演示

4.2双变量的描述性分析4.2.2定量变量与定量变量(1)双定量变量的相关性分析相关性分析是统计学中用来研究两个或多个变量之间相互依赖关系的工具。在现实生活中,许多现象都不是孤立存在的,它们之间往往存在一定的联系。例如,商品的价格和需求量、个人的收入和消费水平、疾病的发病率与环境因素等,这些“变量”之间都可能存在某种程度的相关性。

4.2双变量的描述性分析4.2.2定量变量与定量变量相关性分析通过计算相关系数来衡量两个变量的关系的强度和方向。相关系数是衡量两个变量的线性关系强度的数值。相关系数的取值范围在-1到1之间,接近1或-1表示强烈的正相关或负相关,而趋近0则表示没有线性关系。? 常见的相关程度划分标准相关程度划分标准强相关相关系数绝对值在0.7到1之间,表示两个变量具有较强的线性关系中等程度相关相关系数绝对值在0.3到0.7之间,表示两个变量存在一定的线性关系,但强度不如强相关弱相关相关系数绝对值在0.1到0.3之

显示全部
相似文档