第三届泰迪杯全国大学生数据挖掘竞赛.PDF
文本预览下载声明
第三届“泰迪杯”
全国大学生数据挖掘竞赛
优
秀
作
品
作品名称:城市供水处理混凝投药过程的建模与控制
荣获奖项:二等奖
作品单位:湖北工程学院
作品成员:贾园园 万爽 裴幸智
指导教师:张学新
泰迪杯大学生数据挖掘竞赛论文报告
基于 BP 神经网络的最佳投药量预测
摘 要: 混凝投药通过投加混凝剂除去原水中的杂质及其他有害物质,是城市供水过程中的
重要环节之一,这一过程效果的好坏将直接影响后续处理工艺及出水水质的好坏。该过程具有影响
因素多、大滞后性和非线性等特征,实际控??难度较大。本文基于广州南沙水厂提供的 9397 个投药
控制数据,尝试构建一种基于 BP 神经网络混凝投药控制模型,来预测混凝剂的最佳投药量。
对于原数据集有缺失值情况,本文做基本预处理,用三次样条插值法对出水浊度进行插值估算,
并剔除 5 外的极端异常值,按照出水浊度小于 1.10NTU 的标准,筛选出投药合格的 6143 个数据,
以此作为样本数据。
针对第(1)问,本文运用平流沉淀理论,求得原水混凝沉淀到出水结束的滞后时间,约为 80
分钟,在实际范围 70min--120min 内。
针对第(2)问,本文以原水浊度、原水流速、原水 PH 值三个因素作为 BP 神经网络模型的输入
神经元参数,对混凝剂投加量的训练样本和测试样本进行分析,得到预测的最佳投药量;
针对第(3)问,在第二问之上,增加出水浊度做为输入参数再次建立 BP 神经网络模型,并与
第(2)问的模型进行比较。为了比较模型性能,我们又建立多元线性回归模型,找出四个变量与投
药量的回归方程,通过在训练样本与测试样本上的预测效果,对 BP 神经网络模型和多元回归模型进
行比较,分析绝对误差等指标,发现 BP 神经网络具有更强的非线性逼近能力,能够对投药量进行很
好的仿真和预测效果。
针对第(4)问,本文查找文献[8],引入温度数据,验证文献[9]的理论模型,通过对数变换化
为线性模型,并对模型的整体显著性和温度系数的显著性作检验,但是最后结果表明系数的显著性
并不强,即温度对投药量的影响并不大,并从有关化学理论角度对此结果进行解释。
关键词: 混凝投药;平流沉淀理论;BP 神经网络;多元线性回归;最佳投药量
第 1 页
泰迪杯大学生数据挖掘竞赛论文报告
The optimal dosage prediction based on
BP neural network
Abstract: Coagulation Dosing remove impurities by adding coagulant
显示全部