的主要承诺之一IIoT(工业物联网)是先进的数据分析。我研究什么,这意味着,寻找用例,经常出现的一件事是异常检测。乍一看,这个问题,在我看来,“但是等等,这我们已经没有?”
当我说“我们”,像你们中的很多人一样,我来自一个工业自动化背景OT(操作技术),因为它有时被称为今天。这是相对于IT(信息技术)方面,很多今天的分析工具在哪里扎根。
回到我的问题。只要我们有人机界面和SCADA系统,我们也有能力为当一个变量设置事件或警报或模拟I / O点的正常范围内。所以并不是一个异常值的范围?
我挖了一点,我意识到有更多的异常检测。我也意识到,除非你是一个数据科学家,统计学家,或者数学家,它可以相当沉重的非常快。所以我想分享我所学到的基础知识通俗的说。
IIoT应用开始增殖并不能和这世界合并(或碰撞?),我认为重要的是要理解分析的异常检测方面,它能做些什么来提高传统工业过程令人担忧。
异常检测是什么?
异常检测是用来识别异常数据中的模式,不符合预期的行为。这是机器学习的一个分支,是一种人工智能(AI)。在这一点上,大多数异常检测用例被发现在网络系统等领域安全、欺诈检测(银行),和医疗应用程序。
异常一般分为三类:
- 点异常——单点数据,太遥远。
- 上下文的异常——实例数据异常的一个特定的上下文(如一天的时间),但没有否则。
- 集体异常——收集的数据实例异常与整个数据集。
你可能熟悉或高斯分布标准偏差这是典型的数据。下图显示了它:
这个模型非常简单,它不能准确地代表许多类型的数据。
例如,认为可能是多通道的数据,或季节性。季节性(不是指今年赛季)意味着有不同国家的正常。过程控制的一个例子可能是一个机器或系统运行的四个“正常”国家,关闭,维护模式,启动。
三种主要类型的异常检测监督,无监督,混合(或semi-supervised)。
监督异常检测当我们有训练数据。数据被标记为正常或异常。训练数据,可以从一组异常点和添加正常数据。还有其他更复杂的方法来开发训练分类器。
监督异常检测可以带来挑战,如异常不是定义良好的情况下,正常和异常的定义经常变化(季节性),或者数据包含噪声可能类似于异常行为。
当没有训练数据是可用的,无监督异常检测技术可用于在无标号数据发现异常。这种类型的异常检测是保证机器学习能够带来的好处工业或操作技术的应用程序。
一些流行的无监督异常检测技术密度,集群,支持向量机(SVM)。建立了许多算法申请专利,但学术标准在实际使用。
异常检测与事件和警报
回到我们的问题。当比较异常检测传统人机界面或SCADA阈值的事件,一个区别是学习能力而不显式地编程。
另外重要的一点是,即使配置事件和警报的人机界面系统可以非常复杂的结合使用时(尤其是硬件控制器)的编程环境,我们通常是单独处理每个指标。
单独看,单一指标可能没有透露太多。但在一起,他们可以告诉一个更完整的故事,不同的模式可以共存和可能是相互交织在一起的。
在异常检测多元,许多信号输入作为一个数据集。有一些挑战,比如规模,以及困难当输入信号并非都是同质的行为。也就是说,许多异常算法使用单变量和多变量,利用每个方法。
也试图代码季节性模式正常选点类型的报警会变得复杂而导致假阳性和假阴性。除了理解季节性模式、过程和机器应用程序也可以体验“新法线”,条件改变一生的机器或过程。异常检测可能提供更多的自适应方法,或控制器报警或补充传统的人机界面。
异常检测工具
那么商用现货(COTS)工具是在异常检测的市场吗?
许多大型IT公司物联网平台与数据分析,包括异常检测。例子是IBM华生物联网,亚马逊网络服务(AWS)和微软Azure。(我们的视频显示了如何获取真实数据到IBM Watson)。
此外,许多小型企业专门从事数据分析包括异常检测工业、过程或机器数据。一个例子是Sayantek,异常检测和其他分析边缘(意义上相同的网络机器或过程,而不是在云)。
这会带来的问题是否应该进行异常检测的边缘或在云中。很多有关这个话题,共识似乎是由于很多物联网应用程序的数据量,一些预处理确实应该做过移动数据到云上。这一概念是由努力像Linux基金会的支持EdgeX铸造(最初由戴尔开始)。
所以异常检测可能有一个与我们传统的人机界面,在制造业和流程企业SCADA选点阈值。异常可能不仅指出问题,但实际上提供机会来提高我们的操作。