|
中國網/中國發展門戶網訊 2018年12月,中央經濟工作會議提出“加強人工智能、工業互聯網、物聯網等新型基礎設施建設”,“新型基礎設施建設”(以下簡稱“新基建”)這一概念首次出現在中央層面的會議中。隨后“加強新一代信息基礎設施建設”被列入2019年政府工作報告。“新基建”迅速成為從中央到地方廣泛關注的熱點話題。
何為“新基建”,以及“新基建”到底“新”在哪里?也是專家學者探討的焦點。2020年4月20日,國家發展和改革委員會在4月份新聞發布會中明確指出新型基礎設施主要包含3個方面的內容:信息基礎設施、融合基礎設施、創新基礎設施。信息基礎設施首當其沖成為新基建的重要基石之一。2021年5月24日,國家發展和改革委員會、中共中央網絡安全和信息化委員會辦公室、工業和信息化部、國家能源局四部門聯合印發的《全國一體化大數據中心協同創新體系算力樞紐實施方案》明確指出,在京津冀、長三角、粵港澳大灣區、成渝,以及貴州、內蒙古、甘肅、寧夏等地布局建設全國一體化算力網絡國家樞紐節點,這為信息基礎設施中算力基礎設施建設做了進一步規劃。
新基建是國家在面對國內外政治、經濟及科技新形勢下,面向第二個百年奮斗目標部署的一項國家級戰略,肩負著拉動國內經濟大循環、建成世界科技強國的雙重任務。新一代信息基礎設施建設更是引領了“新基建”的戰略規劃。無獨有偶,20世紀90年代,美國也是通過“信息高速公路”這一信息基礎設施建設計劃,拉動美國經濟迎來一波罕見的超長期繁榮發展,一舉奠定了美國在信息領域的絕對引領地位。
“信息高速公路”計劃奠定了美國信息技術方向的引領地位
20世紀90年代,時任美國總統克林頓提出一個影響后來20年的國家戰略——“信息高速公路”(Information Superhighway)計劃。該計劃對美國的信息基礎設施升級、互聯網產業的騰飛、經濟的持續性繁榮起到了關鍵支撐作用。在20世紀80年代末,整個美國網絡還不到1萬個節點,信息基礎設施相當陳舊。1991年美國政府頒布了《高性能計算法案》(High Performance Computing Act of 1991),啟動“國家信息基礎設施”(National Information Infrastructure)計劃。1992年,戈爾就任美國副總統,開始以“信息高速公路”計劃的名義推動和實施“國家信息基礎設施”計劃。1994年1月11日,戈爾在加州大學洛杉磯分校召開了第一次“信息高速公路”計劃峰會。此次峰會吸引了1800多名參會者,并向全美國進行直播——第一次將網絡制造商、計算機制造商、學術界融合在一起,進而引起全美范圍討論“信息高速公路”。盡管“信息高速公路”計劃提出之前的20年里,網絡TCP/IP、無線網絡、以太網、RISC處理器等技術都已發明,但尚未得到大規模應用。“信息高速公路”計劃不僅將這些20世紀70—80年代發明的信息技術有機地結合起來,而且還催生了一批滿足互聯網新興應用的新技術。例如,20世紀90年代出現了Cluster集群技術、RAID存儲技術等;其中,Cluster集群技術為構建大規模數據中心與計算中心提供了性價比更優的技術方案,而RAID存儲技術則為網絡視頻、網絡存儲等新興應用提供技術支持。
“信息高速公路”計劃的成功一舉奠定了美國在全球信息領域的絕對引領地位,孵化驗證了一批影響之后20年全球信息基礎設施基本格局的關鍵支撐技術。在經濟方面,美國的國內生產總值(GDP)的增長率也從1991年的負增長(-0.07%)不斷攀升至1999年的4.69%。從1994年戈爾第一次發表“信息高速公路”計劃到他2000年卸任的7年間,美國GDP年均增長率高達4.04%,遠超其他發達國家。
不僅如此,美國國家科學基金會(NSF)自2000年開始對美國高校和科研機構,持續性地資助建設信息基礎設施的科研試驗平臺,建設了多種信息基礎設施科研試驗平臺,支持科研人員自由探索包括網絡、分布式系統、云計算等方向的前沿顛覆性技術。例如,2002年建設的PlanetLab項目,支持科研人員自由地進行網絡協議、網絡服務等方向的學術創新工作,一躍成為美國網絡技術、分布式系統等領域早期最重要的實驗平臺,孕育出了云計算等領域的關鍵支撐技術。PlanetLab之后,美國NSF、學術界及民間機構持續搭建了多個試驗平臺(圖1),支持包括網絡技術、分布式系統、云計算、邊緣計算等在內多領域的科學研究與探索。Cloudlab項目是由美國猶他大學等于2014年聯合發起的云計算技術試驗設施,它為研究者提供了對大量計算、存儲和網絡資源的裸機訪問和控制——僅需幾分鐘就可配置整個云環境。Chameleon項目是一個大規模開放云計算研究實驗平臺,以支持計算機科學系統研究。其已支持了3000多個用戶參與的500多個項目,項目范圍從新操作系統的研究和開發、虛擬化策略研究、性能可變性研究、電源管理研究到軟件定義網絡、人工智能。EdgeNet是2018年發起的聯合項目,是一個跨域分布式邊緣云實驗平臺;該平臺允許用戶將應用程序部署分散到互聯網上的數百個節點上,目前其在美國和歐洲分布有50多個站點。2019年,美國肯塔基大學等聯合提出FABRIC項目——可編程式網絡測試基礎設施,目標是建設一個開放的、分布式、全球性、融合通信、計算、存儲、人工智能等領域的綜合試驗設施,以提供高質量的、協同創新的試驗平臺。
與美國相比,中國信息領域的科研試驗場建設起步較晚。距筆者所知,目前國內信息通信領域知名的重大科技基礎設施,只有由江蘇省未來網絡創新研究院牽頭建設的未來網絡試驗設施(CENI),其建設目標是面向未來網絡前沿科學問題,建設一個開放、易使用、可持續發展的大規模通用未來網絡試驗設施。該設施主要側重于網絡方向前沿研究需求,而中國在異構算力、分布式系統、云計算、邊緣計算等領域的前沿開放科研試驗平臺方面依舊處于相對空白的狀態,并且與美國長期在基礎設施試驗平臺方面的投入有不小的差距。筆者認為,這也是國家將信息基礎設施建設作為新基建的三大方向之一重點推進的一個重要因素:通過建設一批新一代信息基礎設施,孵化出能夠引領下一代信息技術浪潮的顛覆性技術,助力我國在新中國成立100周年時躋身世界科技強國之列。
人-機-物三元融合的智能時代使信息基礎設施面臨諸多新挑戰
從信息技術的發展趨勢上來看,全球正在從早期的機-機一元互聯的信息技術(IT)1.0時代,走過人-機二元互聯的IT 2.0時代,并正在逐漸邁入人-機-物三元融合的IT 3.0時代(即智能時代)。萬物互聯的智能時代下,物端④數量將會迎來爆發式的增長,包括智能無人車、“工業4.0”裝備、智能農機、智能硬件等領域在區域內將出現百億級別的物端設備,全球范圍內預計更會出現萬億量級的物端設備。萬億級規模的物端新設備帶來了洪流般信息流,對當前的信息基礎設施提出了諸多新的挑戰。
(1)高通量:信息通量可達到億級并行,可連接萬億級互聯物端。當前“信息高速公路”基礎設施,當載荷到了一個拐點,信息發生堵塞會使其出現性能大幅下降的現象。IT 3.0時代,信息基礎設施將面臨萬億級物端設備連接下所帶來的“重載荷”信息流,信息通量需要依舊能保持穩定。
(2)端到端延遲確保:端到端延遲可調、可測、可控,實現毫秒級延遲確保。當前“信息高速公路”基礎設施遵守“盡力而為”的基本原則,對于用戶端到端的服務質量沒有保障。而IT 3.0時代的諸多場景,如無人智能車、工業互聯網、智慧醫療等,必須提供端到端毫秒級延遲保障,用戶才放心敢用。而且,不僅要在整體低負載時能夠做到,還需要在重載荷下依舊提供毫秒級延遲保障。
(3)智能算力無處不在:在云網邊端,智能算力無處不在。IT 3.0時代,一方面,智能將作為廣泛存在的能力被賦予云網邊端各類設備上,為萬億級物端所產生的數據洪流隨時隨地提供智能算力服務,進而催動智能算法的大爆發;另一方面,信息基礎設施所提供的算力本身也應是智能的,可實現“算力-算法-數據”三元智能融合,從而實現信息基礎設施中算力資源的高效利用,最大化降低資源浪費。
在萬物互聯時代,物端設備將是物理世界與信息空間的關鍵入口,承載著與物理世界完美對應交互的數字世界的大量信息輸入;同時,萬億級規模的物端設備攜帶著洪流般的信息流,也對現有的信息基礎設施的架構及關鍵支撐技術形成巨大挑戰。因此,下一代信息基礎設施亟待核心技術的根本性突破,以滿足高通量、端到端延遲確保和無縫智能等人-機-物三元融合的智能時代的新需求。
“信息高鐵”計劃
為面向萬物互聯的IT 3.0時代,中國科學院計算技術研究所(以下簡稱“計算所”)提出了“信息高鐵”科技創新行動計劃,致力于打造基于新技術體系的、自主開放的信息基礎設施,從而為“新基建”這一國家戰略打造技術底座,讓IT 3.0時代真正成為由中國主導的信息時代。
“信息高鐵”的目標是要打造一套覆蓋云網邊端的一體化新型信息基礎設施。IT 1.0時代,信息基礎設施的目標是通過網格中間件實現超算資源互聯共享,為特定應用提供算力服務,即網格計算。因此,IT 1.0時代也可以看作算力網1.0(圖2)。到人-機互聯的IT 2.0時代,隨著人類社會的活動與數字世界之間交互不斷深度耦合,算力資源逐漸像水、電一樣成為日常必需資源,為每個人的日常活動提供服務;信息基礎設施支撐了人的日常生活與信息世界交互所產生全部信息傳輸和計算需求,即當前的算力網2.0。以云計算為代表,通過虛擬化等技術,以集中共享的方式,降低算力成本,實現普惠算力供給。
然而,集中式的算力網2.0,在面臨日益爆發式增長的數據與算力需求,也逐漸呈現出捉襟見肘的疲態。通過對我國互聯網行業的觀察可以發現,每年“春運”“雙十一”等大規模集中式人類活動所產生的極限信息洪流,都會對信息基礎設施產生嚴重的沖擊和影響。盡管各大公司通過多年的技術積累和錘煉,在近2年已經能夠基本應對這一短時的極限壓力,但這一技術突破的背后卻是多年來不計成本的大量資源和人力投入。即便如此,也僅僅能夠應對偶發式、確定性的短時信息洪流。當進入人-機-物三元融合的智能時代,萬億級規模的物端設備接入信息基礎設施,信息基礎設施中將會隨時隨地出現此起彼伏的信息洪流沖擊。因此,僅靠任何單一服務提供商都無法完全解決數據傳輸和算力需求,算力網亟待通過全新的頂層設計應對這一嚴峻挑戰。
因此,計算所提出了“信息高鐵”,即算力網3.0。按照“一橫一縱”的思路,我們重新定義下一代信息基礎設施的邊界:“一橫”是通過聯邦制的方式橫向聯通,最大化組織起所有愿意共享的大/小數據中心的各類異構算力資源,向上突破信息基礎設施所能提供的理論算力峰值,并為用戶提供統一封裝、抽象易用的算力資源;“一縱”是縱向打通云網邊端全鏈路基礎設施資源,通過全鏈路多級多維度測調、控域隔離等方式真正實現海量物端應用的端到端服務質量確保。
通過“一橫一縱”的延展,“信息高鐵”可成為一臺跨域的分布式大電腦。萬億級物端設備與端邊云各節點通過網,按照一定的結構和規則組成一臺協同工作的計算機,通過一套分布式系統軟件使得云網邊端資源像一臺計算機中的CPU、總線、外設等部件一樣協調緊密地配合,從而解決當前技術體系中由于各個環節間缺少有效協同而導致的低效、服務質量保障能力弱等突出問題。“信息高鐵”通過提供高通量、高品質和高安全的信息基礎設施服務,應對人-機-物三元融合的智能時代中無處不在的信息洪流和智能算力需求,形成“共建、共享、共受益”的算力命運共同體,從而讓信息技術創新的各個要素能夠更易獲取,人人都可以成為平等的創新主體。
“信息高鐵”綜合試驗場建設實踐與思考
“信息高鐵”綜合試驗場初步建設情況
目前,計算所已初步在中科南京信息高鐵研究院建設了一個微型“信息高鐵”;其由端、邊、云開放實驗室組成,是信息高鐵研發團隊的內部開發試驗平臺,用于將關鍵技術及系統在該試驗平臺上集成、測試、驗證和演示。同時,北京(計算所本部)、南京(中科南京信息高鐵研究院)、鹽城(中科高通量計算研究院)、鄭州(中科大數據研究院)等4地算力站已具備接入“信息高鐵”綜合試驗場內場的條件,已初步形成一個“信息高鐵”內場綜合試驗場。
“信息高鐵”綜合試驗場從邏輯上分為5層:物端層、接入層、網絡層、算力層和系統軟件層(圖3)。其中,物端層作為“信息高鐵”的神經末梢,是物理世界與數字世界的數據出入口;接入層為萬億級物端提供無縫的、天地一體化全域覆蓋的邊緣網絡接入服務;網絡層能夠支撐“信息高鐵”廣域互聯與數據可控傳輸;算力層是“信息高鐵”的處理中樞,為各類應用提供數據洪流下云端算力保障和服務能力;系統軟件層(英文名:OneStack;中文名:一棧)是實現云網邊端資源管理和一體化協同、面向用戶提供高品質高安全服務的核心系統。
“信息高鐵”建設的目標
近期目標。為我國科研院所提供服務支撐,為人-機-物三元融合的智能時代的關鍵顛覆性科研成果提供基礎設施級的研究、開發、實驗、驗證和演示平臺。
中期目標。打造面向產業互聯網的分布式算力基礎設施科技創新平臺,服務傳統行業應用,助力我國全面實現數字化社會轉型。
終極目標。建成覆蓋我國乃至“一帶一路”沿線國家的高通量、低熵、無縫智能的算力聯邦服務平臺,實現“共建、共享、共受益”的算力命運共同體。
實踐過程中的若干思考
在“信息高鐵”綜合試驗場的建設實踐過程中,形成了如下3點思考。
(1)突出應用需求導向。信息技術的發展特點是應用與技術雙輪驅動,新一代信息基礎設施的發展離不開應用需求的牽引。因此,“信息高鐵”綜合試驗場采用“邊建設、邊應用,快速迭代、滾動升級”的策略,在建設過程中應充分吸收行業智能化發展需求,并同步開展面向科技創新和行業應用的服務。為此,我們深入調研了氣象、巨災保險、農業、環保、醫療、教育等國家重大行業部門智能化發展對信息基礎設施的應用需求,規劃了2類行業應用服務:① 建“專列”。根據用戶需求在“信息高鐵”綜合試驗場上構建“專列”——提供云網邊端軟硬件資源,為用戶提供隔離的、可靠的應用開發、試驗和運行環境。② 建專網。為用戶提供信息基礎設施軟硬件整體技術方案與核心系統,基于聯邦制滾動接入全國各地參建單位資源,逐漸擴大規模。
(2)積極承接國家戰略。在頂層設計方面,“信息高鐵”的核心技術思想——“云網邊端一體化融合”與國家“新基建”、“全國一體化大數據中心”等發展戰略規劃的技術構想十分契合。在實踐基礎方面,計算所在“信息高鐵”的核心技術與系統研發方面有多年的積累和實踐經驗,具備承接國家戰略的能力。因此,應牢牢抓住戰略機遇,積極對接國家有關部門,針對行業需求“痛點”“堵點”,提供基于新技術體系的新一代信息基礎設施解決方案;并在政策的支持下,加快推進“信息高鐵”綜合試驗場建設,為國家發展積極貢獻力量。目前,“信息高鐵”綜合試驗場已經正式列入江蘇省“十四五”規劃,這標志著其在參與和承接政府發展規劃方面已邁出了重要一步。
(3)著力建設生態體系。“信息高鐵”綜合試驗場未來要依靠多方的力量、以聯邦制商業模式推動建設。為此,“信息高鐵”技術和產業生態的搭建至關重要,而開放的標準是前提。應加快推動建立“信息高鐵”綜合試驗場技術標準體系,梳理定義、標準、體系框架。在參考、引用現行相關標準規范的基礎上,結合“信息高鐵”的技術特色進行必要的創新。探索設立“信息高鐵”開放課題、產業基金等創新扶持計劃,鼓勵引導廣大科研人員和創新群體在“信息高鐵”綜合試驗場上開展技術創新和應用創新,加速培育技術和產業生態。
展望:“新基建”國家戰略下“信息高鐵”生逢其時
新中國成立初期,處在內憂外患的國際形勢下,中央以舉國之力提供算力支撐保障,最終實現了“兩彈一星”的偉大突破,使中國人民在世界舞臺上成功站了起來;十一屆三中全會之后我國全面開啟改革開放的新征程,算力服務我國全面建設鐵路、公路、電路、網路等基礎設施,助力我國經濟持續加速騰飛40余載,使中國人民真正富了起來;如今我國正在向人-機-物三元融合的智能時代邁進,人類社會、物理世界將通過萬億級物端入口全面進入數字世界,算力將會像石油資源一般,成為全面支撐數字時代的源動力。恰逢其時,我國領導人極具前瞻性地提出了“新基建”這一國家級戰略,新一代信息基礎設施建設作為其中的重要一環,肩負著建設數字時代“油田”的重要使命,必將為我國屹立于世界科技強國之列提供源源不斷的動力。
在如此背景之下,“信息高鐵”計劃正當其時,將肩負著構建“新基建”國家戰略的技術“底座”這一使命,為新中國在“站起來”“富起來”之后,真正實現“強起來”的歷史性飛躍提供強有力的支撐;并且,有望最終覆蓋我國并進一步輻射“一帶一路”沿線國家,實現“共建、共享、共受益”的算力命運共同體。
(作者:王曉虹,中國科學院計算技術研究所;王卅,中國科學院計算技術研究所;唐宏偉,中國科學院計算技術研究所;彭曉暉,中國科學院計算技術研究所。《中國科學院院刊》供稿)