本申請涉及集群管理,尤其涉及一種集群管理方法、目標(biāo)集群系統(tǒng)、電子設(shè)備以及存儲介質(zhì)。
背景技術(shù):
1、在大數(shù)據(jù)與云計算蓬勃發(fā)展的當(dāng)下,數(shù)據(jù)量呈爆發(fā)式增長,redis集群作為應(yīng)對海量數(shù)據(jù)與高并發(fā)請求的解決方案,redis集群中的各個redis節(jié)點之間依賴網(wǎng)絡(luò)套接字通信,數(shù)據(jù)傳輸需要多次在內(nèi)核態(tài)與用戶態(tài)之間進(jìn)行切換,這個過程會引入額外的開銷,導(dǎo)致傳輸延遲顯著增加。比如在數(shù)據(jù)遷移時,大量的數(shù)據(jù)需要在不同存儲節(jié)點間傳輸,這種低效的傳輸方式,會導(dǎo)致數(shù)據(jù)遷移時間大幅延長。
技術(shù)實現(xiàn)思路
1、本申請?zhí)峁┝艘环N集群管理方法、目標(biāo)集群系統(tǒng)、電子設(shè)備以及存儲介質(zhì),能夠提高各個存儲節(jié)點之間的數(shù)據(jù)遷移效率。所述技術(shù)方案如下:
2、根據(jù)本申請的一個方面,提供了一種集群管理方法,所述方法應(yīng)用于目標(biāo)集群系統(tǒng),所述目標(biāo)集群系統(tǒng)包括集群管理節(jié)點和多個存儲節(jié)點,每個所述存儲節(jié)點中配置有rdma網(wǎng)卡,所述方法包括:
3、在所述多個存儲節(jié)點中的源節(jié)點和目標(biāo)節(jié)點之間存在數(shù)據(jù)遷移需求的情況下,通過所述集群管理節(jié)點控制所述源節(jié)點與所述目標(biāo)節(jié)點基于rdma握手協(xié)議建立網(wǎng)絡(luò)連接;
4、通過所述源節(jié)點基于所述rdma網(wǎng)卡向所述目標(biāo)節(jié)點的內(nèi)存發(fā)送目標(biāo)遷移數(shù)據(jù);
5、通過所述目標(biāo)節(jié)點基于所述rdma網(wǎng)卡接收所述源節(jié)點發(fā)送的所述目標(biāo)遷移數(shù)據(jù);
6、在傳輸所述目標(biāo)遷移數(shù)據(jù)的過程中,通過所述集群管理節(jié)點接收所述源節(jié)點和所述目標(biāo)節(jié)點反饋的所述目標(biāo)遷移數(shù)據(jù)的已傳輸數(shù)據(jù)量和剩余數(shù)據(jù)量;
7、通過所述集群管理節(jié)點基于所述已傳輸數(shù)據(jù)量和所述剩余數(shù)據(jù)量,調(diào)整所述源節(jié)點和所述目標(biāo)節(jié)點之間的數(shù)據(jù)遷移策略。
8、根據(jù)本申請的另一方面,提供了一種目標(biāo)集群系統(tǒng),所述目標(biāo)集群系統(tǒng)包括集群管理節(jié)點和多個存儲節(jié)點,每個所述存儲節(jié)點中配置有rdma網(wǎng)卡:
9、所述集群管理節(jié)點,用于在所述多個存儲節(jié)點中的源節(jié)點和目標(biāo)節(jié)點之間存在數(shù)據(jù)遷移需求的情況下,控制所述源節(jié)點與所述目標(biāo)節(jié)點基于rdma握手協(xié)議建立網(wǎng)絡(luò)連接;
10、所述源節(jié)點,用于基于所述rdma網(wǎng)卡向所述目標(biāo)節(jié)點的內(nèi)存發(fā)送目標(biāo)遷移數(shù)據(jù);
11、所述目標(biāo)節(jié)點,用于基于所述rdma網(wǎng)卡接收所述源節(jié)點發(fā)送的所述目標(biāo)遷移數(shù)據(jù);
12、所述集群管理節(jié)點,還用于在傳輸所述目標(biāo)遷移數(shù)據(jù)的過程中,接收所述源節(jié)點和所述目標(biāo)節(jié)點反饋的所述目標(biāo)遷移數(shù)據(jù)的已傳輸數(shù)據(jù)量和剩余數(shù)據(jù)量;
13、所述集群管理節(jié)點,還用于基于所述已傳輸數(shù)據(jù)量和所述剩余數(shù)據(jù)量,調(diào)整所述源節(jié)點和所述目標(biāo)節(jié)點之間的目標(biāo)遷移策略。
14、根據(jù)本申請的一個方面,提供了一種電子設(shè)備,包括:處理器以及存儲程序的存儲器,所述程序包括指令,所述指令在由所述處理器執(zhí)行時使所述處理器執(zhí)行如上所述的集群管理方法。
15、根據(jù)本申請的另一方面,提供了一種存儲有計算機(jī)指令的非瞬時計算機(jī)可讀存儲介質(zhì),所述計算機(jī)指令用于使所述計算機(jī)執(zhí)行如上所述的集群管理方法。
16、根據(jù)本申請的另一個方面,提供了一種計算機(jī)程序產(chǎn)品,該計算機(jī)程序產(chǎn)品包括計算機(jī)指令,該計算機(jī)指令存儲在計算機(jī)可讀存儲介質(zhì)中。電子設(shè)備的處理器從計算機(jī)可讀存儲介質(zhì)讀取該計算機(jī)指令,處理器執(zhí)行該計算機(jī)指令,使得該計算機(jī)設(shè)備執(zhí)行上述集群管理方法。
17、本申請實施例提供的技術(shù)方案帶來的有益效果至少包括:
18、通過為目標(biāo)集群管理系統(tǒng)中的各個存儲節(jié)點配置rdma網(wǎng)卡,使得在存儲節(jié)點之間進(jìn)行數(shù)據(jù)傳輸或數(shù)據(jù)遷移時,源節(jié)點可以直接通過rdma網(wǎng)卡將目標(biāo)遷移數(shù)據(jù)傳輸至目標(biāo)節(jié)點的內(nèi)存,而無需源節(jié)點和目標(biāo)節(jié)點的操作系統(tǒng)參與,對應(yīng)不涉及用戶態(tài)和內(nèi)核態(tài)切換,可以提高存儲節(jié)點之間的數(shù)據(jù)遷移效率;而且,還增加有傳輸進(jìn)度監(jiān)控和反饋功能,使得可以將數(shù)據(jù)遷移過程中的已傳輸數(shù)據(jù)量和剩余數(shù)據(jù)量等信息反饋給集群管理節(jié)點,使得集群管理節(jié)點可以根據(jù)反饋信息及時調(diào)整數(shù)據(jù)遷移策略,保障存儲節(jié)點之間的數(shù)據(jù)遷移效率。
1.一種集群管理方法,其特征在于,所述方法應(yīng)用于目標(biāo)集群系統(tǒng),所述目標(biāo)集群系統(tǒng)包括集群管理節(jié)點和多個存儲節(jié)點,每個所述存儲節(jié)點中配置有rdma網(wǎng)卡,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述目標(biāo)集群系統(tǒng)還包括負(fù)載均衡節(jié)點,所述方法還包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述通過所述負(fù)載均衡節(jié)點基于所述多個關(guān)鍵負(fù)載指標(biāo),確定每個所述存儲節(jié)點的當(dāng)前負(fù)載值,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述通過所述負(fù)載均衡節(jié)點獲取所述多個關(guān)鍵負(fù)載指標(biāo)中每個所述關(guān)鍵負(fù)載指標(biāo)的指標(biāo)權(quán)重,包括:
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述方法還包括:
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求1至6任一所述的方法,其特征在于,所述方法還包括:
8.一種目標(biāo)集群系統(tǒng),其特征在于,所述目標(biāo)集群系統(tǒng)包括集群管理節(jié)點和多個存儲節(jié)點,每個所述存儲節(jié)點中配置有rdma網(wǎng)卡:
9.一種電子設(shè)備,包括:
10.一種存儲有計算機(jī)指令的非瞬時計算機(jī)可讀存儲介質(zhì),其中,所述計算機(jī)指令用于使所述計算機(jī)執(zhí)行根據(jù)權(quán)利要求1-7中任一項所述的集群管理方法。