本發(fā)明涉及機器學習,尤其涉及一種基于相似度的分類方法、設(shè)備、介質(zhì)。
背景技術(shù):
1、人臉識別技術(shù)已廣泛應(yīng)用于安全監(jiān)控、身份驗證、金融支付等領(lǐng)域?,F(xiàn)有技術(shù)多依賴于深度學習方法,特別是卷積神經(jīng)網(wǎng)絡(luò)(cnn),通過大規(guī)模標注數(shù)據(jù)進行訓練,從而提取人臉的特征。然而,數(shù)據(jù)標注的高成本和類別不平衡問題依然是制約這些技術(shù)發(fā)展的關(guān)鍵因素。特別是在多類別任務(wù)中,可用的訓練數(shù)據(jù)集過少導(dǎo)致模型在訓練時的學習效果受限,泛化能力不足,影響分類精度。
技術(shù)實現(xiàn)思路
1、根據(jù)本發(fā)明的一個方面,提供了一種基于相似度的分類方法及設(shè)備、介質(zhì),通過相似度訓練數(shù)據(jù)集訓練相似度分類模型,有效提升模型的學習效果,實現(xiàn)更精準的分類,提高模型的魯棒性和泛化能力。
2、為解決上述技術(shù)問題,本發(fā)明第一方面公開了一種基于相似度的分類方法,所述方法包括:
3、獲取待分類圖像;
4、將所述待分類圖像輸入相似度分類模型,得到分類結(jié)果;
5、其中,所述相似度分類模型為根據(jù)相似度訓練數(shù)據(jù)集訓練得到的,所述相似度訓練數(shù)據(jù)集包括訓練樣本對及標簽;所述訓練樣本對包括隨機選取的第一訓練圖像、第二訓練圖像;所述標簽表示所述第一訓練圖像與第二訓練圖像是否屬于同一類別。
6、在一些實施方式中,將所述待分類圖像輸入相似度分類模型,得到分類結(jié)果,包括:
7、將所述待分類圖像輸入相似度分類模型,確定待分類圖像與每個類別的相似度;
8、根據(jù)所述待分類圖像與每個類別的相似度,確定所述待分類圖像的分類結(jié)果。
9、在一些實施方式中,所述相似度分類模型通過以下步驟訓練得到:
10、提取所述第一訓練圖像的第一特征,提取所述第二訓練圖像的第二特征;
11、結(jié)合第一特征與第二特征,得到差值向量;以所述差值向量作為分類器的輸入,得到所述第一訓練圖像與所述第二訓練圖像的標簽;
12、利用目標損失函數(shù)訓練所述相似度分類模型,直至達到訓練終止條件。
13、在一些實施方式中,所述差值向量為第一特征與第二特征之間的絕對值差。
14、在一些實施方式中,在所述提取所述第一訓練圖像的第一特征,提取所述第二訓練圖像的第二特征之前,還包括:
15、從所述相似度訓練數(shù)據(jù)集中隨機選取任意兩張訓練圖像,構(gòu)成第一訓練圖像與第二訓練圖像,確定第一訓練圖像與第二訓練圖像的標簽;所述訓練圖像為已標注分類結(jié)果的人臉圖像。
16、在一些實施方式中,所述目標損失函數(shù)為adam優(yōu)化算法以及交叉熵損失函數(shù)。
17、在一些實施方式中,根據(jù)所述待分類圖像與每個類別的相似度,確定所述待分類圖像的分類結(jié)果,包括:
18、選擇相似度最高對應(yīng)的類別作為所述待分類圖像的分類結(jié)果。
19、在一些實施方式中,將所述待分類圖像輸入相似度分類模型,確定待分類圖像與每個類別的相似度,包括:
20、比較所述待分類圖像與相似度分類模型中每個類別的任一樣本圖像,得到待分類圖像與任一樣本圖像的標簽,所述標簽表示所述待分類圖像與任一樣本圖像是否屬于同一類別;
21、根據(jù)所述標簽計算所述待分類圖像與每個類別中所有樣本圖像的相似占比,得到待分類圖像與每個類別的相似度。
22、根據(jù)本發(fā)明的第二方面,公開了一種計算機設(shè)備,包括:處理器和存儲器;其中,所述存儲器存儲有計算機程序,所述計算機程序適于由處理器加載并執(zhí)行如上任意一項的一種基于相似度的分類方法的步驟。
23、根據(jù)本發(fā)明的第三方面,公開了一種計算機存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時,實現(xiàn)如上的一種基于相似度的分類方法的步驟。
24、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:
25、本發(fā)明提供了一種基于相似度的分類方法、設(shè)備、介質(zhì),通過相似度訓練數(shù)據(jù)集訓練模型并基于相似度進行分類,簡化了傳統(tǒng)五分類問題中的數(shù)據(jù)處理過程,提高模型的泛化能力和分類精度。通過相似度訓練數(shù)據(jù)集的訓練,有效提升模型的學習效果,使得相似度分類模型能夠準確判斷待分類圖像與類別之間的相似度,實現(xiàn)高效、精確的分類,提高模型的魯棒性和泛化能力。
1.一種基于相似度的分類方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的一種基于相似度的分類方法,其特征在于,將所述待分類圖像輸入相似度分類模型,得到分類結(jié)果,包括:
3.根據(jù)權(quán)利要求1所述的一種基于相似度的分類方法,其特征在于,所述相似度分類模型通過以下步驟訓練得到:
4.根據(jù)權(quán)利要求3所述的一種基于相似度的分類方法,其特征在于,所述差值向量為第一特征與第二特征之間的絕對值差。
5.根據(jù)權(quán)利要求3所述的一種基于相似度的分類方法,其特征在于,在所述提取所述第一訓練圖像的第一特征,提取所述第二訓練圖像的第二特征之前,還包括:
6.根據(jù)權(quán)利要求3所述的一種基于相似度的分類方法,其特征在于,所述目標損失函數(shù)為adam優(yōu)化算法以及交叉熵損失函數(shù)。
7.根據(jù)權(quán)利要求2所述的一種基于相似度的分類方法,其特征在于,根據(jù)所述待分類圖像與每個類別的相似度,確定所述待分類圖像的分類結(jié)果,包括:
8.根據(jù)權(quán)利要求2所述的一種基于相似度的分類方法,其特征在于,將所述待分類圖像輸入相似度分類模型,確定待分類圖像與每個類別的相似度,包括:
9.一種計算機設(shè)備,其特征在于,包括:處理器和存儲器;其中,所述存儲器存儲有計算機程序,所述計算機程序適于由處理器加載并執(zhí)行如權(quán)利要求1-8任意一項的一種基于相似度的分類方法的步驟。
10.一種計算機存儲介質(zhì),其特征在于,其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時,實現(xiàn)如權(quán)利要求1-8任意一項的一種基于相似度的分類方法的步驟。