应用背景分析
智能发电
2018 年,国家能源局提出了信息和能源的相互融合,“智能发电”的概念正是在这样的背景下应运而生。风机作为火电厂中重要的辅机设备,在日常连续地运行中将产生大量的数据,一方面这些数据提高了使用传统方法处理数据的难度,另一方面,这些数据则为各种智能建模方法提供了基础。
智能建模
将现有的智能建模方法和风机的故障诊断预警结合起来是实现风机故障诊断与预警的有效手段,也是实现“智能发电”的重要一环。
故障分析
风机的故障诊断与预警即了解设备在运行过程中的实际状态,根据运行状态评价设备的可靠性,并且预报故障的发展趋势。对风机进行故障诊断实际上是在风机的运行过程中,使用一些技术手段来记录监测风机运行的特征参数,通过观察这些参数的变化趋势,结合该风机的故障历史以及运行人员的经验来判断风机故障的性质和类别,这样可以有效防止事故并且减少非计划停机。
整体研究流程
原始数据
数据清洗
数据探索
在17个变量中
• 10个变量之间存在高度相关关系;
• 另外6个变量之间存在高度相关关系;
• 剩余1个变量与其他变量之间不存在高度相关关系。
相关系数大于0.8(即高度相关)的变量组——引风机总操
除去时间外,共17个变量,引风机总操与其中9个变量呈现高度相关关系,其中:
引风机总操与#4机组负荷、A引风机电流、A引风机动叶开度、B引风机电流、B引风机动叶开度5个变量呈正相关关系
引风机总操与B引风机入口烟压、A引风机入口烟压、A引风机喘振压力、B引风机喘振压力4个变量呈负相关关系
剩余7个变量。
相关系数大于0.8(即高度相关)的变量组—— A引风机电机侧支承轴承温度1
剩余7个变量中,6个变量之间存在高度相关关系
A引风机电机侧支承轴承温度1与A引风机风机侧支承轴承温度1、A引风机推力轴承温度1、
B引风机电机侧支承轴承温度1、B引风机风机侧支承轴承温度1、B引风机推力轴承温度1
5个变量呈正相关关系。剩余炉膛负压1个变量不与其他变量呈高度相关关系。
根据上述的探索分析,我们主要将数据分为以下4个部分
模型建立
相关性分析
从相关性分析表中可以看出,变量之间存在着高度的相关关系,并不利于我们去发现其中的重要变量。对此,主要通过主成分分析进行处理。
异常检测
数据文件中只含有‘时间’,‘#4机组负荷’,‘A引风机电流’等设备参数数据,这些数据均不能直接判断出引风机是否出现故障。因此需要自行建立模型分析引风机出现故障的数据,从而可以根据引风机正常工作的数据和出现故障的数据建立引风机故障诊断模型。引风机故障数据分析思路如下:
1、用主成分分析法对数据进行降维;
2、对数据进行聚类;
3、分析聚类结果;
1.数据层面分析
2.业务层面分析
4、分析聚类结果得出的故障数据的时间分布,为故障数据划分故障标签。
主成分分析
计算所有变量的累积贡献率,其结果如下图所示:
提取3个主成分的时候,累积贡献率已达到93.05%,故提取3个主成分即可,通过主成分提取将数据维度从17维降为3维。
KMeans聚类判别异常值-聚类数目的选择
通过计算Calinski-Harabaz值来决定聚类数目
Calinski-Harabaz指标通过计算类中各点与类中心的距离的平方和来度量类内的紧密度,通过计算各类中心点与数据集中心点距离平方和来度量数据集的分离度。Calinski-Harabaz值越大,表示聚类效果更好。所以从该图可以得到最佳聚类数目为6或7类。
通过计算SSE值来决定聚类数目
随着k值的继续增大而趋于平缓,也就是说SSE和k的关系图是一个手肘的形状,而这个肘部对应的k值就是数据的真实聚类数。此时最佳聚类的类别数为6。
综合两种方法:选取最终聚类数为6。
KMeans聚类判别异常值
KMeans聚类判别异常值-数据层面
通过绘制各个分类的均值占比分布图可以看出,聚类1,3,5与其余分类有明显区别,聚类3,5为小众分类,可能成为异常值。聚类1占比较大,不考虑其为异常数据,但是聚类1分布与聚类3,5较为接近,故聚类1可能为疑似异常数据。
KMeans聚类判别异常值-业务层面
在将聚类3,聚类5作为异常数据,聚类1作为疑似异常数据情况下,各个日期下的异常数据点数目如下表所示:
得到的异常数据主要集中在13号这一天,少数在14号,这也与电厂引风机出现问题的时间一致, 故将聚类3,5作为数据中的异常值进行标记。 而得到的疑似异常数据都在12到15号,也就是故障发生时间的前后,而且主要分布在故障发生前一天。 故将聚类1作为疑似异常数据进行标记。
故障原因分析
在B引风机风机侧支承轴承温度低,A引风机动叶开度低的情况下,引风机有96.8%的可能已经出现故障。即设备可能处于停机检修阶段,而非正常运行。工作人员应当更加注重维护引风机出现故障时相关性更高的部件。
故障原因追寻
B引风机风机侧支承轴承温度1 重要性占比79.8%
A引风机动叶开度 重要性占比5.5%
A引风机电机侧支承轴承温度1 重要性占比3.7%
#4机组负荷 重要性占比3.0%
B引风机入口烟压 重要性占比2.5%
B引风机动叶开度 重要性占比2.1%
B引风机电机侧支承轴承温度1 重要性占比1.4%
其他 重要性占比2.0%
效益分析
研究火电厂风机故障诊断与预警,在降低维修费用的前提下,还可以增加机组运行的安全性。具体体现为:
落地实施
基于大数据的状态预测故障预警方法包括神经网络方法(BP),决策树模型(CART)以及支持向量机(SVM)等方法。这些方法从大数据角度出发进行系统信息挖掘,其预警原理是使用大量历史数据进行建模,通过模型对设备的运行状态进行预测,进而实现故障预警,其流程如下图所示: