输入量考虑历史出水COD变化趋势的网络,其仿真效果要优于不考虑变化趋势的网络;
运用基于BP网络和RBF网络的造纸废水处理模型能够准确的预测出水COD,为实现废水处理的自动控制提供可行途径。关键词:造纸;
废水处理;
BP神经网络;
RBF神经网络;
仿真研究
在造纸废水处理过程中,进水流量、进水COD以及加药量等影响因素直接关系到出水水质的好坏;
另外由于目前大多造纸厂采用人工操作控制,操作误差、测量滞后等原因,亦造成出水水质不稳定、故障频发等问题,而智能控制可以解决这一问题。但废水处理过程具有复杂性、非线性、时变性、不确定性等特点。人工神经网络以其具有自学习、自组织、自适应以及良好的非线性映射等能力,特别适合复杂非线性系统的建模与控制,其中目前广泛应用的BP网络和RBF网络以其各自的优点,成为废水处理的研究热点[1]。本文在造纸废水处理一体化系统取得表征废水处理指标的基础上,通过实现对BP网络和RBF网络的设计、建立、仿真和运行,考察这两种网络对造纸废水处理的适应性,为更好的有效实现造纸废水处理的自动控制提供可行途径。
1 人工神经网络废水处理建模原理 人工神经网络(Artificial Neural Network,简称ANN)对废水处理系统的建模原理如图1所示,首先根据废水处理系统的输入输出数据建立样本集。在学习过程中把样本集中的数据输入神经网络;
根据样本的输入值计算出网络的输出值;
计算样本输出与网络输出的差值;
根据计算的差值由梯度下降法调整网络的权矩阵;
重复上述过程,直到整个样本集的误差不超过规定范围,学习即结束。图1 造纸废水处理系统ANN建模原理示意图 经过训练后的网络模型相当于实际废水处理系统的近似模型,如果通过采集模块采集实际系统的进水各水质指标并输入网络,得到的网络输出应该近似等于对应于各水质指标的实际系统的出水COD。基于这样的原理,针对滞后性的废水处理系统,本研究采用ANN模型对未来时刻的出水COD进行预测,其中网络输入为与未来时刻出水COD有关的因素,网络输出为未来时刻的出水COD,以期通过预测得到当前时刻的加药量。 2 造纸废水处理实验系统设计2.1 废水来源 废水取自东莞某造纸厂(主要原料为OCC),废水CODcr为500-1600mg/L,pH5.5-6.8。
2.2 造纸废水处理实验系统 实验室废水处理工艺流程如图2所示。调节池中的废水与絮凝剂PAC(5%聚合氯化铝)混合后经进水泵打入高效一体化反应器[2],在里面发生反应、沉淀、过滤和澄清等作用完成泥水分离,处理水从反应器顶流出,污泥通过反应器底部排泥阀排出。
图 2 造纸废水处理工艺
本实验采用自动检测控制方法代替手工操作,完成水质的在线检测以及加药量的自动控制,其监测系统如图3所示。COD仪自动检测原水和出水COD值,检测频率通过PLC控制电磁阀实现,COD值经ADAM4017+模块转换成数字信号,显示在安装于IPC的MCGS(Monitor and Control Generated System)组态软件中;
进水量和加药量通过ADAM4024模块输出电压控制蠕动泵和直流泵的工作电压以改变流量来实现;
高效反应器中的污泥通过泥位计实时监测,再结合PLC控制电磁阀保证反应器中的泥位保持在一定高度。
图3 造纸废水处理系统监控系统框图
2.3 网络样本数据的选取 考虑进水量、进水COD和加药量三个因素,每个因素取4个水平,具体取值如表1所示,通过正交实验L16(45),以自动监控系统完成各个水质指标的采集和加药量的自动加入,剔除MCGS数据库中奇异数据后,用于网络训练和测试的部分数据如表1所示。其中x(t)、u(t)、v(t)和y(t)分别表示t时刻的进水COD(mg/L)、加药量(mL/s)、进水量(mL/s)和出水COD(mg/L),y(t-2△t)和y(t-△t)分别表示t-2△t和t-△t时刻的出水COD(mg/L),此处△t取2h;
y’和y”分别表示出水COD在t-△t时刻的一阶和二阶导数,y’= y(t)-y(t-△t),y”= y(t)-2 y(t-△t) +y(t-2△t)。 表1 用于网络训练和测试的实验数据
序号 | x(t) | u(t) | v(t) | y(t-2△t) | y(t-△t) | y(t) | y’ | y” | 期望输出 |
1 | 1400 | 0.2 | 12 | 515 | 489 | 461 | -28 | -2 | 454 |
2 | 1400 | 0.2 | 12 | 489 | 461 | 454 | -7 | -107 | 491 |
3 | 1400 | 0.4 | 14 | 499 | 525 | 484 | -41 | -67 | 471 |
4 | 1400 | 0.4 | 14 | 525 | 484 | 471 | -13 | 28 | 512 |
5 | 1400 | 0.5 | 16 | 504 | 478 | 495 | 17 | 43 | 483 |
6 | 1400 | 0.5 | 16 | 478 | 495 | 483 | -12 | -29 | 465 |
7 | 1400 | 0.7 | 18 | 419 | 458 | 434 | -24 | -63 | 425 |
8 | 1400 | 0.7 | 18 | 458 | 434 | 425 | -9 | 15 | 449 |
9 | 1244 | 0.2 | 14 | 429 | 441 | 437 | -4 | -16 | 418 |
10 | 1244 | 0.2 | 14 | 441 | 437 | 418 | -19 | -15 | 424 |
11 | 1244 | 0.4 | 12 | 374 | 368 | 399 | 31 | 37 | 382 |
12 | 1244 | 0.4 | 12 | 368 | 399 | 382 | -17 | -48 | 377 |
13 | 1244 | 0.5 | 18 | 335 | 342 | 321 | -21 | -28 | 336 |
14 | 1244 | 0.5 | 18 | 342 | 321 | 336 | 15 | 36 | 327 |
15 | 1244 | 0.7 | 16 | 298 | 306 | 314 | 8 | 0 | 320 |
16 | 1244 | 0.7 | 16 | 306 | 314 | 320 | 6 | -2 | 323 |
17 | 979 | 0.2 | 16 | 344 | 354 | 350 | -4 | -14 | 338 |
18 | 979 | 0.2 | 16 | 354 | 350 | 338 | -12 | -8 | 340 |
19 | 979 | 0.4 | 18 | 281 | 298 | 284 | -14 | -31 | 279 |
20 | 979 | 0.4 | 18 | 298 | 284 | 279 | -5 | 9 | 268 |
21 | 979 | 0.5 | 12 | 245 | 222 | 237 | 15 | 38 | 215 |
22 | 979 | 0.5 | 12 | 222 | 237 | 215 | -22 | -37 | 208 |
23 | 979 | 0.7 | 14 | 311 | 334 | 323 | -11 | -34 | 328 |
24 | 979 | 0.7 | 14 | 334 | 323 | 328 | 5 | 16 | 319 |
25 | 648 | 0.2 | 18 | 302 | 316 | 296 | -20 | -34 | 279 |
26 | 648 | 0.2 | 18 | 316 | 296 | 279 | -17 | 3 | 287 |
27 | 648 | 0.4 | 16 | 275 | 294 | 288 | -6 | -25 | 281 |
28 | 648 | 0.4 | 16 | 294 | 288 | 281 | -7 | -1 | 273 |
29 | 648 | 0.5 | 14 | 237 | 258 | 245 | -13 | -34 | 250 |
30 | 648 | 0.5 | 14 | 258 | 245 | 250 | 5 | 18 | 240 |
31 | 648 | 0.7 | 12 | 197 | 215 | 209 | -6 | -24 | 201 |
32 | 648 | 0.7 | 12 | 215 | 209 | 201 | -8 | -2 | 193 |
3 基于神经网络的仿真比较研究3.1 神经网络结构的建立 网络预测能力可以从优化网络本身来加以改善,亦可从提高学习样本的质量和对学习样本的处理方面加以考虑[3-4]。时滞系统的未来响应特性与系统当前时刻的状态有关,与当前及过去时刻系统的状态变化趋势有关[5]。由于本实验系统水力停留时间约为2h,对该时滞系统将出水COD在t-△t时刻的一阶和二阶导数亦作为网络的输入量。 理论与实验表明,含有足够多节点的单隐含层的BP网络可以逼近任意非线性函数,故本文采用三层网络结构,输入层为8个节点,分别代表x(t)、u(t)、v(t)、y(t-2△t)、y(t-△t)、y(t)、 y’、y”,隐含层采用试凑法确定为15个节点,输出层为一个节点,代表t+△t时刻的预测出水COD。 RBF网络输入层为8个节点,分别代表x(t)、u(t)、v(t)、y(t-2△t)、y(t-△t)、y(t)、 y’、y”,隐含层节点个数采用从0个神经元开始训练,通过检查输出误差使网络自动增加神经元的方法确定,输出层为一个节点,代表t+△t时刻的预测出水COD。3.2 仿真比较研究 在确定了BP网络和RBF网络结构后,对2个网络进行训练[6]。首先将样本数据归一化到区间[0,1]之间以消除各指标的数量级差别,防止部分神经元达到过饱和状态,并把第5、10、15、20、25和30组数据作为测试数据,以检验训练后的网络预测效果,其余组数据作为训练数据,用于训练网络。最后得到的各训练仿真曲线绘于图4-6中。 图4 不同仿真输出和实际输出曲线
图4为经过训练后的网络仿真输出曲线, BP模型和RBF模型计算输出能贴近期望出水COD。特别指出的是,仿真输出曲线分为两部分,第5、10、15、20、25和30次采样为第一部分,其余的采样为第二部分。可以看出,第二部分的仿真输出曲线几乎和实际输出曲线重合。这是因为该部分样本数据曾用来训练网络模型,网络模型很好的“记住”了样本包含的信息,表明模型的学习能力很强;
而第一部分的曲线偏离实际输出曲线,是因为这些样本是网络没有“见过”的,因此误差相对较大,相应的相对误差((网络模型计算输出-期望输出COD)/ 期望输出COD)如图5所示。BP网络模型最大误差为-6.26%,RBF网络模型最大误差为8.5%,在造纸废水处理过程中,上述网络输出误差在可以接受的范围内,说明网络模型具有很好的泛化能力。
图5 考虑出水COD变化趋势的仿真误差曲线 另外,考虑BP网络和RBF网络输入量不包含y’和y”的仿真情况,网络结构同上,仿真数据仍用表1数据,与上述的模型进行对比,得到的网络输出误差见图6。可以看出,在这种情况下BP网络模型最大误差为11.9%,RBF网络模型最大误差为-24.30%。我们知道,废水处理出水COD除了与进水量、进水COD、加药量和历史出水COD有关外,还与出水COD的变化趋势有一定关系,图5中的网络输出误差相对于图6中的网络输出误差要小,就是因为它考虑了出水COD的变化趋势这个不可忽略的因素。
图6 未考虑出水COD变化趋势的仿真误差曲线
值得提出的是,32组样本数据是分批次实验得到的,因此各批次间在时间上是不连续的,但在仿真上没有表现出明显的差异,表明神经网络具有很好的抗干扰能力;
同时5组测试数据并未参加网络训练,仍能得到较好的输出,说明网络具有较好的泛化能力。另外,在测试数据仿真误差较大点,观察可以看出其相对于训练样本空间的分布较稀疏,即训练样本空间未能完全的包含各种可能的系统信息,网络在其周围未能得到充分的训练。因此,如何得到足够的训练样本以及如何选择训练样本,避免欠拟和问题和过拟和问题,是需要值得注意的重要问题[7]。
4 结论4.1 针对废水处理过程具有复杂性、非线性、时变性、不确定性等特点,结合人工神经网络以其具有自学习、自组织、自适应以及良好的非线性映射等能力,建立了基于BP网络和RBF网络的废纸造纸废水处理系统模型。
4.2 对于BP网络或者RBF网络,输入量包含出水COD在t-△t时刻的一阶和二阶导数的网络比不含一阶和二阶导数的网络,训练和测试仿真效果更好,表明其泛化能力更优。4.3 网络结构确定后,样本数据的广泛性及准确性是影响泛化能力的主要因素,如何得到足够的训练样本及如何选择训练样本,避免欠拟和问题和过拟和问题,是值得研究的重要问题。4.4 基于BP网络和RBF网络的废纸造纸废水处理系统模型能够准确的描述出水COD与进水水质及历史出水COD的相互关系。