使用基于LSTM编码-解码的无监督健康指数多传感器预测
Multi-Sensor Prognostics using an Unsupervised Health Index based on LSTM Encoder - Decoder
1. Introduction
工业互联网使得各个领域的传感器数据都很容易获得。传感器的数据表明了系统的健康状态。这就导致了越来越多的企业想要根据机器的健康状态进行维护而不是根据时间来维护(例如每隔3个月维护一次)。实验表明根据机器的条件状况进行维护能节省大量的资金,通过建模去预测剩余使用寿命能达到这一目标。
传统的剩余使用寿命基于一个假设:健康退化曲线遵循一些特定的形状,比如:指数型或者线性的。在这一假设下,我们能建立健康指数的预测模型。健康指数的推测能被用来剩余使用寿命的预测。但是,我们发现这种假设在真实世界的数据集不成立,要解决这一问题变得更加困难。解决这一预测问题的一些困难挑战如下:
- 健康退化曲线可能不是一个固定的形状;
- 相同规格的机器达到相同退化水平的时间是不一样的;
- 每一个样本的最初健康状态可能有微小的差别;
- 读取的传感器数据可能含有噪声(有误差);
- 直到生命结束的传感器的数据不容易获得,因为会进行周期性的维护。
除了上述基于健康指数的方法外,基础物理系统的数学模型、故障传播模型和常规可靠性模型也被用于RUL(剩余使用寿命)预测。数据驱动建模利用携带退化和磨损信息的传感器读数(轴承的振动)已经有效的用来建立RUL估计模型。一般来说,一个系统从开始到出现错误的运行的整个生命周期的传感器读数被用来获取一般的退化行为趋势,或者通过HI估计健康来建立一个系统如何退化的模型。
LSTM网络是循环神经网络模型,它被成功的运用在了序列学习,和时间建模任务中,例如:情感分析,手写数字识别,语音识别,情感分析和顾客行为分析。一个LSTM网络的变体,LSTM编码-解码模型已经被成功运用在了序列到序列的学习任务中,比如,机器翻译,自然语言的生成和重建,解析,和图像字幕。LSTM-ED的工作流程如下:一个基于LSTM的编码器用于将多元变量输入序列映射到固定维数的向量表示,解码器是另一个LSTM网络,它使用这一向量表示来产生一个目标序列。在4.1和4.2我们提供更详细的LSTM-ED的描述。
LSTM-ED使用的方法在异常检测中被提出来。这些方法学习了一个模型,去重构正常的数据(例如当机器在非常健康的状态下),以便这一学习模型能够重构出属于正常行为下的子序列。这个学习模型导致了高的重构错误率,对于一些异常的和新的子序列,因为他在训练期间没有见过这种数据。基于同样的想法,我们使用长短期编码解码做RUL预测。在本论文中,我们提出了一种无监督的技术去获取健康指数,对于一个系统使用多个传感器时间序列数据,它在退化的曲线上没有做出任何假设。我们使用LSTM-ED去学习一个系统正常行为的模型,该模型被训练重构与正常行为相对应的多远时间序列。时间序列中的某一点的重构误差被用来计算那一点的HI。在这篇论文中,我们表明:
- 基于HI的LSTM-ED,在无监督行为下学习,能够捕捉到一个系统的退化:HI降低伴随着系统的退化。
- 基于HI的LSTM-ED能被用来学习一个模型,进行RUL预测而不需要依赖任何领域知识,或者指数型/线性退化假设,还能达到可观的性能。