文档详情

数据挖掘技术在审计中的应用的研究.pdf

发布:2016-03-20约7.26万字共74页下载文档
文本预览下载声明
摘要 随着审计事业步入计算机审计的时代,审计的思维方式发生了革命性的变 化。审计分析的思路正确与否、先进与否,在审计工作中至关重要。总的趋势是 要求审计人员运用系统论的思维,用全局的观点、联系的观点,把握事物的总体 和各部分之间的联系,从而发现其中的规律。“盲人摸象”、“瞎猫碰上死耗子” 的狭隘判断已经成为过去。当前我们在审计工作中所运用的审计分析思路,其形 成的来源主要是法律法规的规定、被审计单位的业务处理逻辑、数据间的钩稽关 系、被审计数据与外部相关数据的映射、过去审计中积累的审计经验等。然而审 计思路的形成还可以有另一种途径。有一种数据分析工具,能够帮助审计人员从 海量数据当中,发现数据背后潜在的联系和规律,这就是数据挖掘技术。 目前我国商业银行贷款风险分类采取五级分类法,即正常、关注、次级、可 疑和损失,前两级属于正常贷款,后三级属于不良贷款。而由于种种原因,某些 事实上的不良贷款会被商业银行划归正常贷款的等级之中,从而掩盖了信贷风险 的真实状况。为此,审计人员在对某商业银行信贷风险情况进行审计时,需要从 该行五级分类属于正常和关注等级的贷款中选择一些重点借款单位进行延伸审 计,以便核实其真实的风险状况。 本文运用Clementine的两种决策树的方法对某商业银行信贷风险情况分别 建立了模型。我们采用均值分析、频率分析、描述统计等基础统计分析方法对样 本数据进行数据探索。经过分析之后,我们选择贷款性质分类、贷款期限分类、 借款用途、还款方式保证形式、担保方式、贷款类别、领导素质、技术素质、管 理素质、信贷对象、行业分类、管理特征、经营规模、经济类型、产业政策,经 营组织形式、经营状况、改制状况为输入变量,贷款五级分类为目标变量,通过 对数据的训练发现了其中的规律。在该试验中,通过对模型评估表的正确率比较, 基于C5.0算法的模型正确率为77.79%,而基于cART算法的模型正确率为 76.90%。两种模型效果较好,均可应用于商业银行贷款风险预测分析。 【关键词】数据挖掘,决策树,C5.0,CART,贷款五级分类 【论文类型】应用基础 ABSTRACT Withthe of in modelof applicationcomputertechnologyauditing,thethinking vitalin whether has is work themethodof auditingchangedlargely.It auditing is orMvanced.11maintrandisthat tomaster analysisright auditors眦requested the betweenthewholeandthe andthe relationship partbyusingsystematicthinking overallOr hasbecomea ofthe perspectivepo.mt,fornarrowjudgmentthing past. method in workisfromthe oflawsand Today,the provision ofanalysisauditing ofaudited ofthe rules,business institution,relationdata, processinglogic
显示全部
相似文档