本發(fā)明屬于時間序列分析與異常檢測,特別涉及一種融合特征相關(guān)性與時序依賴性的多變量時序異常檢測方法及設(shè)備。
背景技術(shù):
1、多變量時間序列異常檢測其核心目標是從多變量時間序列數(shù)據(jù)中識別出與正常模式顯著偏離的異常點或異常片段,從而為系統(tǒng)監(jiān)控、故障預(yù)警和決策支持提供依據(jù)。傳統(tǒng)方法主要分為基于統(tǒng)計的方法、基于機器學(xué)習(xí)的方法和基于深度學(xué)習(xí)的方法?;诮y(tǒng)計的方法通過建立統(tǒng)計模型描述時間序列的正常行為,但難以捕捉多變量之間的復(fù)雜相關(guān)性和非線性時序依賴性?;跈C器學(xué)習(xí)的方法利用分類器或回歸模型識別異常,但依賴人工特征工程且對時序動態(tài)變化的建模能力不足。深度學(xué)習(xí)方法通過神經(jīng)網(wǎng)絡(luò)自動學(xué)習(xí)時序特征,但通常忽略多變量之間的相關(guān)性,且對異常樣本稀少的情況適應(yīng)性較差。
2、綜上所述,現(xiàn)有方法在多變量時間序列異常檢測中存在以下主要局限性:
3、(1)多變量時間序列數(shù)據(jù)通常由多個特征組成,這些特征之間往往存在復(fù)雜的相關(guān)性。特征之間的關(guān)系可能是直接的(如物理位置的接近或測量的相似性),也可能是間接的(如反映同一物理過程的不同角度)。然而,傳統(tǒng)的異常檢測方法通常將各特征視為獨立個體,缺乏對它們之間相關(guān)性的建模。這種忽視可能導(dǎo)致無法準確識別某些依賴關(guān)系較強的異常行為。例如,某些異??赡苤皇悄承┨卣鹘M合的結(jié)果,而不是單獨一個特征的偏離。有效捕捉這些特征間的縱向依賴關(guān)系,有助于提高檢測的準確性和穩(wěn)定性。
4、(2)時序數(shù)據(jù)具有顯著的時間依賴性,即前一個時間步的值可能會影響當前時刻的值。在多變量時序數(shù)據(jù)中,某一特征的讀數(shù)不僅受其歷史值的影響,還可能受其他特征在同一時刻及其歷史值的影響。傳統(tǒng)的異常檢測方法通常將數(shù)據(jù)視為獨立的時間點,忽視了時間維度上的動態(tài)變化和依賴性。因此,很多方法未能充分利用時序數(shù)據(jù)中長期和短期的變化模式,從而導(dǎo)致在識別依賴性較強的異常行為時表現(xiàn)不佳。有效捕捉這種橫向的時序依賴性,是提高異常檢測精度的關(guān)鍵。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供一種融合特征相關(guān)性與時序依賴性的多變量時序異常檢測方法及設(shè)備,同時捕捉多變量之間的非線性依賴關(guān)系和時間序列的動態(tài)變化規(guī)律,顯著提升了異常檢測的準確性和魯棒性;
2、為達到上述目的,本發(fā)明采用的技術(shù)方案是:
3、一種融合特征相關(guān)性與時序依賴性的多變量時序異常檢測方法,包括以下步驟:
4、獲取多變量時間序列數(shù)據(jù),得到時序特征;
5、計算當前時刻任意兩個時序特征之間的互信息系數(shù);
6、根據(jù)多變量時間序列數(shù)據(jù)中的歷史數(shù)據(jù),預(yù)測當前時刻的時序特征,得到預(yù)測特征;
7、構(gòu)建圖神經(jīng)網(wǎng)絡(luò),將預(yù)測特征作為圖神經(jīng)網(wǎng)絡(luò)的節(jié)點,通過互信息系數(shù)得到相鄰節(jié)點的關(guān)系系數(shù),將圖神經(jīng)網(wǎng)絡(luò)進行信息聚合,得到當前時刻預(yù)測特征的預(yù)測值;
8、計算預(yù)測值與當前時刻時序特征之間的偏差,并根據(jù)偏差大小進行異常評分。
9、優(yōu)選地,所述互信息系數(shù)表示為:
10、
11、其中,p(si(t),sj(t))表示第i和第j個特征在時間步t處的聯(lián)合概率分布,p(si(t))和p(sj(t))分別是第i和第j個特征的邊緣概率分布。
12、優(yōu)選地,所述當前時刻的預(yù)測特征,是采用過去ω個時間步的時序特征進行預(yù)測:
13、x(t)=[s(t-ω),s(t-ω+1),...,s(t-1)]
14、其中,s(t)表示時序特征在時刻t的值。
15、優(yōu)選地,所述預(yù)測特征在時間t的聚合表示為:
16、
17、其中,xi(t)是節(jié)點i在時刻t的輸入特征,w∈rn*ω是可訓(xùn)練的權(quán)重矩陣,n(i)是節(jié)點i的鄰居節(jié)點集合,αi,j表示節(jié)點i和鄰居節(jié)點j之間關(guān)系系數(shù)。
18、優(yōu)選地,所述當前時刻預(yù)測特征的預(yù)測值通過圖神經(jīng)網(wǎng)絡(luò)的聚合操作得到:
19、
20、優(yōu)選地,還包括以下步驟:
21、對圖神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,其中訓(xùn)練圖神經(jīng)網(wǎng)絡(luò)的損失函數(shù)為:
22、
23、優(yōu)選地,所述損失函數(shù)為:
24、
25、其中,ε為閾值。
26、優(yōu)選地,所述預(yù)測值與當前時刻時序特征之間的偏差表示為:
27、
28、當偏差δs(t)超過預(yù)設(shè)閾值θ時,表示該時刻的預(yù)測存在異常。
29、本發(fā)明還提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時執(zhí)行上述所述的融合特征相關(guān)性與時序依賴性的多變量時序異常檢測方法中的步驟。
30、本發(fā)明還提供一種融合特征相關(guān)性與時序依賴性的多變量時序異常檢測設(shè)備,包括:
31、存儲器,用于存儲軟件應(yīng)用程序,
32、處理器,用于執(zhí)行所述軟件應(yīng)用程序,所述軟件應(yīng)用程序的各程序相對應(yīng)地執(zhí)行上述所述的融合特征相關(guān)性與時序依賴性的多變量時序異常檢測方法中的步驟。
33、本發(fā)明利用互信息系數(shù)(mic)建模多變量時間序列中特征之間的非線性依賴關(guān)系,傳統(tǒng)的相關(guān)性度量方法(如皮爾遜相關(guān)系數(shù))僅能捕捉線性關(guān)系,而mic能夠有效識別和量化非線性依賴關(guān)系,通過構(gòu)建互信息矩陣,能夠精確捕捉多變量之間的復(fù)雜關(guān)聯(lián),為后續(xù)的時序建模和異常檢測提供支持,動態(tài)捕捉特征間的時變關(guān)系,顯著提高了模型對復(fù)雜多變量系統(tǒng)的適應(yīng)性。
34、本發(fā)明提出了基于圖神經(jīng)網(wǎng)絡(luò)(gnn)的時序預(yù)測方法,用于捕捉時間序列中的動態(tài)依賴性,通過構(gòu)建圖結(jié)構(gòu)表示多變量之間的依賴關(guān)系,gnn能夠結(jié)合歷史數(shù)據(jù)和鄰居節(jié)點的信息進行時序預(yù)測,不僅能夠捕捉時間序列的長期和短期依賴關(guān)系,還能夠通過動態(tài)調(diào)整圖結(jié)構(gòu)適應(yīng)多變量之間的實時變化。通過引入獎勵機制,模型在訓(xùn)練過程中能夠根據(jù)預(yù)測誤差動態(tài)調(diào)整學(xué)習(xí)過程,進一步提高了預(yù)測精度和訓(xùn)練效率。
35、本發(fā)明通過計算模型預(yù)測值與實際值之間的偏差進行異常評分,通過設(shè)定閾值,偏差檢測模塊能夠有效區(qū)分正常行為和異常行為,顯著降低了誤報率和漏檢率。該模塊不僅能夠檢測單一特征的異常,還能夠識別多變量組合的異常行為,提高了異常檢測的全面性和準確性。
36、本發(fā)明通過輕量化設(shè)計和并行計算優(yōu)化,顯著提高了模型的計算效率,使其能夠適用于大規(guī)模實時監(jiān)控場景。實驗結(jié)果表明,該框架在多個公開數(shù)據(jù)集上均表現(xiàn)出色,優(yōu)于現(xiàn)有的主流方法。
37、本發(fā)明在模型訓(xùn)練過程中引入了動態(tài)獎勵機制,通過比較預(yù)測誤差與預(yù)設(shè)閾值,動態(tài)調(diào)整損失函數(shù)。當預(yù)測誤差較小時,給予模型正向獎勵,加速模型收斂;當預(yù)測誤差較大時,不給予獎勵,避免過度調(diào)整。這一機制顯著提高了模型的訓(xùn)練效率和預(yù)測精度,為異常檢測提供了更穩(wěn)定的性能保障。
38、綜上所述,本發(fā)明通過融合特征相關(guān)性與時序依賴性,提出了一種高效、魯棒的多變量時序異常檢測方法,解決了現(xiàn)有方法在建模復(fù)雜多變量關(guān)系和時間維度變化方面的局限性。
1.一種融合特征相關(guān)性與時序依賴性的多變量時序異常檢測方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的融合特征相關(guān)性與時序依賴性的多變量時序異常檢測方法,其特征在于,所述互信息系數(shù)表示為:
3.根據(jù)權(quán)利要求1所述的融合特征相關(guān)性與時序依賴性的多變量時序異常檢測方法,其特征在于,所述當前時刻的預(yù)測特征,是采用過去ω個時間步的時序特征進行預(yù)測:
4.根據(jù)權(quán)利要求1所述的融合特征相關(guān)性與時序依賴性的多變量時序異常檢測方法,其特征在于,所述預(yù)測特征在時間t的聚合表示為:
5.根據(jù)權(quán)利要求1或4所述的融合特征相關(guān)性與時序依賴性的多變量時序異常檢測方法,其特征在于,所述當前時刻預(yù)測特征的預(yù)測值通過圖神經(jīng)網(wǎng)絡(luò)的聚合操作得到:
6.根據(jù)權(quán)利要求1所述的融合特征相關(guān)性與時序依賴性的多變量時序異常檢測方法,其特征在于,還包括以下步驟:
7.根據(jù)權(quán)利要求6所述的融合特征相關(guān)性與時序依賴性的多變量時序異常檢測方法,其特征在于,所述損失函數(shù)為:
8.根據(jù)權(quán)利要求1所述的融合特征相關(guān)性與時序依賴性的多變量時序異常檢測方法,其特征在于,所述預(yù)測值與當前時刻時序特征之間的偏差表示為:
9.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時執(zhí)行權(quán)利要求1至8中任一所述的融合特征相關(guān)性與時序依賴性的多變量時序異常檢測方法中的步驟。
10.一種融合特征相關(guān)性與時序依賴性的多變量時序異常檢測設(shè)備,其特征在于,包括: