国产真实乱全部视频,黄色片视频在线免费观看,密臀av一区二区三区,av黄色一级,中文字幕.com,日本a级网站,在线视频观看91

一種基于去噪表示學(xué)習(xí)的混淆流量分類方法及其系統(tǒng)

文檔序號(hào):42327025發(fā)布日期:2025-07-01 19:46閱讀:12來源:國知局

本技術(shù)涉及到網(wǎng)絡(luò)安全技術(shù),具體涉及一種基于去噪表示學(xué)習(xí)的混淆流量分類方法。


背景技術(shù):

1、網(wǎng)絡(luò)流量分類因其在流量?jī)?yōu)化、主機(jī)行為分析和網(wǎng)絡(luò)安全監(jiān)控等多個(gè)網(wǎng)絡(luò)領(lǐng)域應(yīng)用中的重要性,受到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。為了增強(qiáng)流量數(shù)據(jù)隱私保護(hù)和提升網(wǎng)絡(luò)安全性,各種流量混淆技術(shù)已經(jīng)被應(yīng)用于實(shí)際的網(wǎng)絡(luò)應(yīng)用和服務(wù)中。經(jīng)過不同混淆技術(shù)處理的流量稱為混淆流量,即流量的固有特征可以通過多種混淆操作(如加密、偽裝和隨機(jī)化等)來掩蓋,這給流量識(shí)別和分類帶來了巨大挑戰(zhàn)。由于這一難點(diǎn),流量混淆技術(shù)被廣泛應(yīng)用于tor(洋蔥路由)等匿名網(wǎng)絡(luò)中,使混淆流量能夠規(guī)避網(wǎng)絡(luò)監(jiān)控、行為分析和審查。此外,這些技術(shù)也可能被用于掩蓋網(wǎng)絡(luò)犯罪分子的非法活動(dòng)。因此,對(duì)混淆流量進(jìn)行分類顯得尤為重要。

2、到目前為止,對(duì)混淆流量分類的研究可以系統(tǒng)地歸納為三類:深度包檢測(cè)(dpi)、基于特征工程的方法和基于深度學(xué)習(xí)的方法。深度包檢測(cè)(dpi)依賴于網(wǎng)絡(luò)包的內(nèi)容和頭部信息,采用特征匹配或序列匹配的方式來識(shí)別和分類網(wǎng)絡(luò)流量。盡管這類方法在識(shí)別混淆流量方面取得了一定的成效,但它需要大量的人工分析和特征提取。此外,基于特征工程的流量分類方法,如支持向量機(jī)(svm)、決策樹和卷積神經(jīng)網(wǎng)絡(luò)(cnn),在分類過程中也依賴于人工提取的特征。為了解決這一局限性,研究人員開發(fā)了多種基于深度學(xué)習(xí)的分類方法,包括序列指定、字節(jié)指定和圖指定的方法。這些深度學(xué)習(xí)模型能夠自動(dòng)從輸入的網(wǎng)絡(luò)包或流中提取特征,從而有效減少了人工特征提取可能帶來的錯(cuò)誤。

3、傳統(tǒng)的流量混淆技術(shù)允許每個(gè)用戶或應(yīng)用程序根據(jù)需求選擇混淆方式。然而,它也會(huì)在混淆后的流量中引入新的特征,這些特征的差異取決于具體的混淆機(jī)制,即混淆方法是否一致。由于現(xiàn)有方法利用這些新生成的特征來執(zhí)行流量分類任務(wù),因此能夠?qū)崿F(xiàn)較高的分類準(zhǔn)確率。

4、為了增加隱私保護(hù)的力度,現(xiàn)有的一些新的流量混淆架構(gòu)已被提出并被廣泛采用。該架構(gòu)配備了經(jīng)典的編碼器和解碼器組件。編碼器旨在利用統(tǒng)一的混淆策略為不同的流量生成相似的特征,而解碼器旨在恢復(fù)混淆流量的原始形式以確保正常的網(wǎng)絡(luò)功能。如圖1所示,編碼器-解碼器組件的組合不僅保留了常規(guī)流量功能,而且還禁用了混淆流量的識(shí)別。對(duì)于這種新架構(gòu)生成的混淆流量,最新方法的分類準(zhǔn)確率下降了約20%-60%。目前,新架構(gòu)為混淆流量分類帶來了三個(gè)變化:i)特征混淆?;煜呗栽诓煌膽?yīng)用程序和服務(wù)中產(chǎn)生統(tǒng)一且相同的流量模式,這種對(duì)不同特征的混淆使得混淆流量難以區(qū)分;ii)分類復(fù)雜性。流量分類的目標(biāo)變得更加復(fù)雜,而不是之前簡(jiǎn)單的混淆流量和非混淆流量之間的二元分類。當(dāng)今的分類任務(wù)是識(shí)別具有混淆狀態(tài)的特定服務(wù)或應(yīng)用程序;iii)添加噪音。新的混淆策略需要引入字節(jié)序列,也就是說,將噪音添加到流量中,這將修改原始流量的語義內(nèi)容并影響分類方法;iv)不考慮時(shí)間特征。加入干擾包會(huì)改變流量數(shù)據(jù)的時(shí)間特征,目前的方法并非針對(duì)這一點(diǎn)而設(shè)計(jì)的,導(dǎo)致對(duì)此類數(shù)據(jù)包進(jìn)行分類的性能一般。

5、目前現(xiàn)有的混淆流量分類研究,已有的混淆流量分類技術(shù)對(duì)新架構(gòu)生成的混淆流量分類準(zhǔn)確率下降了約20%-60%,分類效果差,產(chǎn)生該情況的原因是由于混淆策略使不同網(wǎng)絡(luò)應(yīng)用和服務(wù)的流量模式同質(zhì)化,消除了每種流量固有的獨(dú)特特征;在流量混淆過程中引入的字節(jié)序列會(huì)修改原始語義,從而給分類任務(wù)帶來大量噪音。以上兩個(gè)原因?qū)е庐?dāng)前的分類方法效果差。

6、綜上,上述新的流量混淆架構(gòu)不僅導(dǎo)致了混淆流量分類準(zhǔn)確率下降及數(shù)據(jù)包進(jìn)行分類的性能不高的問題。亟需引入一種注意力機(jī)制,并提出了一個(gè)高效的混淆流量分類模型,能夠有效地減少在流量混淆過程中添加的字節(jié)序列所引入的噪聲影響。


技術(shù)實(shí)現(xiàn)思路

1、為解決上述現(xiàn)有技術(shù)中的新型混淆框架帶來的流量分類挑戰(zhàn),提出了一種基于去噪表示學(xué)習(xí)的混淆流量分類方法。

2、第一方面,本技術(shù)實(shí)施例提供了一種基于去噪表示學(xué)習(xí)的混淆流量分類方法,方法包括:

3、數(shù)據(jù)包嵌入轉(zhuǎn)換步驟:將待分類的混淆流量輸入預(yù)訓(xùn)練的數(shù)據(jù)包嵌入轉(zhuǎn)換模型,在流量的每個(gè)數(shù)據(jù)包的標(biāo)頭和有效負(fù)載中,生成標(biāo)頭嵌入和有效負(fù)載嵌入;

4、混淆去除步驟:基于標(biāo)頭嵌入和有效負(fù)載嵌入,通過去噪表示學(xué)習(xí),去除有效負(fù)載內(nèi)的混淆噪聲,其中,混淆噪聲包括:由填充引入的噪聲及由干擾包引入的噪聲;

5、數(shù)據(jù)包特征融合步驟:針對(duì)標(biāo)頭嵌入及混淆去除的有效負(fù)載嵌入,采用跨門融合機(jī)制,合并數(shù)據(jù)包的標(biāo)頭和負(fù)載嵌入,將標(biāo)頭嵌入和過濾后的負(fù)載嵌入進(jìn)行拼接,得到最終的組合嵌入,實(shí)現(xiàn)混淆流量的分類。

6、本技術(shù)實(shí)施例,上述數(shù)據(jù)包嵌入轉(zhuǎn)換步驟包括:

7、使用基于bert的預(yù)訓(xùn)練模型分別進(jìn)行每個(gè)數(shù)據(jù)包的頭部和負(fù)載的嵌入轉(zhuǎn)換,生成對(duì)應(yīng)的頭部和有效負(fù)載嵌入表示。

8、本技術(shù)實(shí)施例,上述混淆去除步驟包括:

9、特征提取注意力步驟:通過特征提取注意力機(jī)制,提取有效負(fù)載內(nèi)有助于分類的信息;

10、去混淆注意力步驟:通過去混淆注意力機(jī)制,消除有效負(fù)載內(nèi)的混淆噪聲。

11、本技術(shù)實(shí)施例,上述數(shù)據(jù)包特征融合步驟包括:

12、對(duì)每個(gè)數(shù)據(jù)包的頭部和負(fù)載的嵌入采用線性變換操作,采用交叉門控特征融合,合并數(shù)據(jù)包的頭部和負(fù)載嵌入,生成融合后的去噪表示。

13、本技術(shù)實(shí)施例,上述特征提取注意力步驟包括:

14、初始化特征偏好矩陣,使用可學(xué)習(xí)的偏好矩陣及負(fù)載嵌入為輸入,計(jì)算注意力分?jǐn)?shù),并進(jìn)行注意力分?jǐn)?shù)歸一化,計(jì)算獲得令牌偏差矩陣;

15、將令牌偏差矩陣與負(fù)載嵌入相乘,計(jì)算得到特征偏差嵌入矩陣。

16、本技術(shù)實(shí)施例,上述去混淆注意力步驟包括:

17、引入一個(gè)額外的多頭注意力機(jī)制,使用總結(jié)了所有類別與嵌入之間的關(guān)系的新矩陣,表示負(fù)載嵌入;

18、將新特征偏好矩陣中的填充類別偏差向量替換為零向量;

19、使用修改后的注意力機(jī)制計(jì)算去混淆嵌入,混淆嵌入包含去除填充干擾后的類別特征。

20、本技術(shù)實(shí)施例,上述數(shù)據(jù)包特征融合步驟包括:

21、分別對(duì)頭部嵌入和去混淆后的負(fù)載嵌入應(yīng)用線性變換操作后,通過prelu激活函數(shù)進(jìn)行非線性變換;

22、通過sigmoid層生成門控向量,門控向量用于對(duì)原始嵌入向量進(jìn)行加權(quán);

23、使用頭部門控向量過濾負(fù)載嵌入,使用負(fù)載門控向量過濾頭部嵌入。

24、第二方面,本技術(shù)實(shí)施例提供了一種基于去噪表示學(xué)習(xí)的混淆流量分類系統(tǒng),采用如上述基于去噪表示學(xué)習(xí)的混淆流量分類方法,系統(tǒng)包括:

25、數(shù)據(jù)包嵌入轉(zhuǎn)換模塊:輸入待分類的混淆流量,基于預(yù)訓(xùn)練的數(shù)據(jù)包嵌入轉(zhuǎn)換模型,在流量的每個(gè)數(shù)據(jù)包的標(biāo)頭和有效負(fù)載中,生成標(biāo)頭嵌入和有效負(fù)載嵌入;

26、混淆去除模塊:基于標(biāo)頭嵌入和有效負(fù)載嵌入,通過去噪表示學(xué)習(xí),去除有效負(fù)載內(nèi)的混淆噪聲,其中,混淆噪聲包括:由填充引入的噪聲及由干擾包引入的噪聲;

27、數(shù)據(jù)包特征融合模塊:針對(duì)標(biāo)頭嵌入及混淆去除的有效負(fù)載嵌入,采用跨門融合機(jī)制,合并數(shù)據(jù)包的標(biāo)頭和負(fù)載嵌入,將過濾后的標(biāo)頭和負(fù)載嵌入進(jìn)行拼接,得到最終的組合嵌入,實(shí)現(xiàn)混淆流量的分類。

28、第三方面,本技術(shù)實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)所述的基于去噪表示學(xué)習(xí)的混淆流量分類方法的步驟。

29、第四方面,本技術(shù)實(shí)施例提供了一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如所述的基于去噪表示學(xué)習(xí)的混淆流量分類方法的步驟。

30、相比于相關(guān)現(xiàn)有技術(shù),具有以下突出的有益效果:

31、1)本發(fā)明方法針對(duì)網(wǎng)絡(luò)數(shù)據(jù)包流量的嵌入轉(zhuǎn)換;利用基于bert的預(yù)訓(xùn)練模型獨(dú)立處理每個(gè)數(shù)據(jù)包的標(biāo)頭和有效負(fù)載,并相應(yīng)地生成標(biāo)頭嵌入eheader和有效負(fù)載嵌入epayload。這些嵌入隨后用于去混淆和特征融合的過程,最終作為混淆流量分類的基礎(chǔ);

32、2)本發(fā)明方法針對(duì)網(wǎng)絡(luò)數(shù)據(jù)包流量嵌入的混淆去除;去混淆模塊通過定義偏置矩陣來學(xué)習(xí)潛在的不同特征,分別考慮了干擾數(shù)據(jù)包和混淆填充引入的兩種噪聲。針對(duì)epayload中的干擾數(shù)據(jù)包和混淆填充引起的噪聲問題,設(shè)計(jì)了一個(gè)去混淆注意組件來以更準(zhǔn)確的方式增強(qiáng)流量語義表示;

33、3)本發(fā)明方法針對(duì)網(wǎng)絡(luò)數(shù)據(jù)包數(shù)據(jù)包頭和有效負(fù)載嵌入的跨門特征融合,考慮了epayload和eheader之間的相關(guān)性,采用交叉門特征融合模塊來精確定位這種關(guān)系。在跨門特征融合后,有效載荷嵌入epayload和標(biāo)頭嵌入eheader被連接成一個(gè)單一表示,以充分促進(jìn)下游分類任務(wù)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1