文档详情

第三届泰迪杯全国大学生数据挖掘竞赛.PDF

发布:2017-04-18约2.47万字共20页下载文档
文本预览下载声明
第三届“泰迪杯” 全国大学生数据挖掘竞赛 优 秀 作 品 作品名称:城市供水处理混凝投药过程的建模与控制 荣获奖项:二等奖 作品单位:湖北工程学院 作品成员:贾园园 万爽 裴幸智 指导教师:张学新 泰迪杯大学生数据挖掘竞赛论文报告 基于 BP 神经网络的最佳投药量预测 摘 要: 混凝投药通过投加混凝剂除去原水中的杂质及其他有害物质,是城市供水过程中的 重要环节之一,这一过程效果的好坏将直接影响后续处理工艺及出水水质的好坏。该过程具有影响 因素多、大滞后性和非线性等特征,实际控??难度较大。本文基于广州南沙水厂提供的 9397 个投药 控制数据,尝试构建一种基于 BP 神经网络混凝投药控制模型,来预测混凝剂的最佳投药量。 对于原数据集有缺失值情况,本文做基本预处理,用三次样条插值法对出水浊度进行插值估算, 并剔除 5 外的极端异常值,按照出水浊度小于 1.10NTU 的标准,筛选出投药合格的 6143 个数据, 以此作为样本数据。 针对第(1)问,本文运用平流沉淀理论,求得原水混凝沉淀到出水结束的滞后时间,约为 80 分钟,在实际范围 70min--120min 内。 针对第(2)问,本文以原水浊度、原水流速、原水 PH 值三个因素作为 BP 神经网络模型的输入 神经元参数,对混凝剂投加量的训练样本和测试样本进行分析,得到预测的最佳投药量; 针对第(3)问,在第二问之上,增加出水浊度做为输入参数再次建立 BP 神经网络模型,并与 第(2)问的模型进行比较。为了比较模型性能,我们又建立多元线性回归模型,找出四个变量与投 药量的回归方程,通过在训练样本与测试样本上的预测效果,对 BP 神经网络模型和多元回归模型进 行比较,分析绝对误差等指标,发现 BP 神经网络具有更强的非线性逼近能力,能够对投药量进行很 好的仿真和预测效果。 针对第(4)问,本文查找文献[8],引入温度数据,验证文献[9]的理论模型,通过对数变换化 为线性模型,并对模型的整体显著性和温度系数的显著性作检验,但是最后结果表明系数的显著性 并不强,即温度对投药量的影响并不大,并从有关化学理论角度对此结果进行解释。 关键词: 混凝投药;平流沉淀理论;BP 神经网络;多元线性回归;最佳投药量 第 1 页 泰迪杯大学生数据挖掘竞赛论文报告 The optimal dosage prediction based on BP neural network Abstract: Coagulation Dosing remove impurities by adding coagulant
显示全部
相似文档