異常檢測(cè),指在一個(gè)數(shù)據(jù)集中尋找與預(yù)期不符合的數(shù)據(jù)。這些數(shù)據(jù)可能在統(tǒng)計(jì)分布上非常罕見,也可能是在大多數(shù)情況下都看起來正常,但在某種特殊情況下出現(xiàn)異常。異常檢測(cè)可以應(yīng)用于各種領(lǐng)域,如金融、醫(yī)學(xué)、安全等,并且已經(jīng)成為機(jī)器學(xué)習(xí)和人工智能的重要分支之一。
1.異常檢測(cè)的應(yīng)用場(chǎng)景
異常檢測(cè)被廣泛用于各種應(yīng)用程序中,以幫助檢測(cè)任何不符合規(guī)則的異常情況,包括金融欺詐檢測(cè)、醫(yī)療診斷、網(wǎng)絡(luò)安全、故障檢測(cè)等。它還可以用于監(jiān)視設(shè)備或傳感器狀態(tài),以及識(shí)別從系統(tǒng)中收集的未標(biāo)記數(shù)據(jù)中的無效值。
2.異常檢測(cè)與誤用檢測(cè)的區(qū)別
異常檢測(cè)(Anomaly Detection)與誤用檢測(cè)(Misuse Detection)是兩種不同的概念。異常檢測(cè)的目標(biāo)是尋找一個(gè)數(shù)據(jù)集中與預(yù)期不符合的數(shù)據(jù),而誤用檢測(cè)則旨在檢測(cè)違反了特定規(guī)則和預(yù)定義規(guī)范的非法行為。異常檢測(cè)需要訓(xùn)練數(shù)據(jù)中有少量的異常,在未見過的輸入中能夠識(shí)別這些異常情況,而誤用檢測(cè)則需要已知的規(guī)則去識(shí)別那些不符合規(guī)則的操作。
3.異常檢測(cè)的技術(shù)方法
異常檢測(cè)可以使用各種技術(shù)方法,例如:基于統(tǒng)計(jì)方法的方法包括均值和方差、離群值(outlier)檢測(cè)等;機(jī)器學(xué)習(xí)方法包括支持向量機(jī)、聚類、隨機(jī)森林等。其中,深度學(xué)習(xí)模型如自編碼器(autoencoder)也被廣泛應(yīng)用于異常檢測(cè)任務(wù)中。