|
高通量計算關(guān)鍵技術(shù)
針對高通量計算高吞吐、高利用率、低延遲的需求,我們需要把當前計算機體系結(jié)構(gòu)的設(shè)計從“速度導向”轉(zhuǎn)向“通量導向”,從而確保計算機系統(tǒng)在滿足高吞吐、低延遲的同時還能達到高利用率。針對上述目標,中國科學院計算技術(shù)研究所在高通量計算機研制過程中提出了一系列關(guān)鍵技術(shù),包括高通量眾核體系結(jié)構(gòu)、高通量片上數(shù)據(jù)通路、標簽化體系結(jié)構(gòu)等。
高通量眾核體系結(jié)構(gòu)
針對高通量應(yīng)用中的海量并發(fā)處理需求,我們提出了?Godson-T?眾核處理器體系結(jié)構(gòu),以實現(xiàn)任務(wù)的高吞吐。相比于傳統(tǒng)多核處理器,Godson-T?采用眾核架構(gòu)提供豐富的并發(fā)處理能力,并在片上網(wǎng)絡(luò)、片上存儲、同步模型和通信機制等方面采用創(chuàng)新性的設(shè)計方法,以實現(xiàn)任務(wù)的高吞吐和低延遲。
易擴展片上網(wǎng)絡(luò)。Godson-T?采用易擴展的二維網(wǎng)格片上網(wǎng)絡(luò),同時支持擁塞感知和能耗感知的動態(tài)路由算法以實現(xiàn)高并發(fā)場景下的片上網(wǎng)絡(luò)負載均衡,進而確保網(wǎng)絡(luò)通信的低延遲。
細粒度可配置片上存儲。Godson-T?的片上存儲支持細粒度可配置,從而更好地適配高通量場景下復雜的數(shù)據(jù)訪問模式,降低延遲。
快速同步機制。我們設(shè)計了片上同步管理結(jié)構(gòu),支持基于數(shù)據(jù)流的核間細粒度快速同步,相比傳統(tǒng)的基于內(nèi)存的同步機制,性能可獲得數(shù)量級的提升。
可編程數(shù)據(jù)通信機制。Godson-T?提出了可編程數(shù)據(jù)傳輸引擎結(jié)構(gòu),可以快速實現(xiàn)數(shù)據(jù)的水平(片上處理器核之間)和垂直(從內(nèi)存到片上存儲)搬運,實現(xiàn)了數(shù)據(jù)通信的低延遲。
Godson-T?眾核處理器結(jié)構(gòu)受到國際同行的廣泛關(guān)注,2011?年,處理器領(lǐng)域的知名期刊《微處理器報告》(Microprocessor Report)對?Godson-T?的研究成果進行了專門文章報道,并將其選入?2011?年全球十大服務(wù)器處理器之一。
高通量片上數(shù)據(jù)通路
“通量導向”的處理器數(shù)據(jù)通路設(shè)計也是確保“高吞吐、低延遲”的關(guān)鍵,我們借鑒城市交通管理的思路開展設(shè)計。高通量計算在結(jié)構(gòu)特征、資源管理、調(diào)度策略等方面都非常類似于城市交通管理,兩者的核心特征都是高通量,即在單位時間內(nèi)完成盡可能多的處理請求,并保證?QoS,表?2?給出了兩者的類比情況。
針對應(yīng)用的新特點,高通量數(shù)據(jù)通路重點在最基本的數(shù)據(jù)讀取、數(shù)據(jù)傳輸(訪存通路)和數(shù)據(jù)處理3個環(huán)節(jié)進行了創(chuàng)新。
數(shù)據(jù)讀取環(huán)節(jié)。針對應(yīng)用中的大量細粒度訪存需求,設(shè)計了基于硬件的訪存請求收集表,通過對大量細粒度訪存的收集并批量處理,同時通過時間敏感的收集窗口控制機制,避免長延遲導致的任務(wù)失效。
數(shù)據(jù)傳輸環(huán)節(jié)。針對大量細粒度訪存的需求,提出了高密度路網(wǎng)的設(shè)計,從而提高片上網(wǎng)絡(luò)的利用率和吞吐量。支持動態(tài)通路調(diào)整,能根據(jù)數(shù)據(jù)傳輸?shù)膲毫Γ瑒討B(tài)調(diào)整傳輸通路配置,提高通路利用率。此外,通過直連快速網(wǎng)絡(luò)保障關(guān)鍵數(shù)據(jù)通路的低延遲。
數(shù)據(jù)處理環(huán)節(jié)。提出了硬件支持的全局實時任務(wù)調(diào)度機制,將任務(wù)按照優(yōu)先級及剩余裕度時間進行調(diào)度,有效保障任務(wù)的?QoS;同時避免對時間裕度不足的失效任務(wù)進行調(diào)度,從而確保硬件資源的合理利用。