|
中國網/中國發展門戶網訊 1998?年時任美國副總統戈爾提出數字地球概念——將數字地球看成是對地球的三維多分辨率表示,并能放入大量地理數據。自此,地球大數據概念和相關研究開始走進大眾視野。而在科學研究領域,地球大數據的研究及其應用其實早已開始。1954?年,基于系列海洋數據分析了熱比容偏差;1959?年,基于衛星數據對大氣進行分析;隨著美國陸地(Landsat)系列衛星的發射,1976?年起地球科學與大數據相關研究論文明顯增多,大多為基于衛星數據開展分析,主要應用于地質和礦產資源勘探、作物面積和土地利用分類估算、大氣成分和云層狀況研究、冰凍預報、衛星和遙感數據處理技術等。
隨著計算機互聯網、衛星定位系統、空間信息技術、高分辨率衛星影像、大數據處理與存儲技術、科學計算及可視化、虛擬現實技術等現代信息科技的迅猛發展,地球大數據的深入應用將對全球和各國的科技、經濟和社會生活產生巨大影響。因此,地球大數據相關理論與技術方法研究成為當前研究熱點領域。本文基于文獻計量方法,對地球大數據研究主題演化與影響力進行分析,以期為相關領域研究提供參考。
數據源與研究方法
利用“地球科學”和“大數據”主題組合檢索策略構建檢索詞和檢索式(廣義的),采集文獻覆蓋面廣與影響力大的科學引文索引(SCI)和社會科學引文索引(SSCI)數據庫的所有文獻數據(截至?2021?年?7?月?20?日)。經過對機構和關鍵詞等信息的清洗,并經專家識別排除不相關文獻后,利用多種可視化分析工具,定量分析地球大數據研究的現狀與研究主題變化情況。
地球大數據研究總體科研產出分析
全球地球大數據論文增長趨勢
地球大數據研究年發文量變化可以反映出其研究變遷與研究熱度。圖?1?展示了全球地球大數據相關研究年度發文量的變化趨勢。數據顯示,1990?年以前,地球大數據相關研究論文還非常少;1991—2000?年,論文數量開始保持小幅增長;2000?年以來,論文增長進入快車道;2017?年之后更呈現暴發式增長態勢。
地球大數據研究論文占全球論文比重可以更直觀地反映該領域受全球關注程度。圖?2?統計了?1954—2020?年地球大數據相關論文占?SCI/SSCI?年出版論文的比重,1990?年以后,地球大數據相關研究論文占全球論文比重呈現逐步增長的態勢;特別是?2012?年之后,增長更加迅猛;2020?年,地球大數據相關研究論文占全球比重已達到?0.25%。
全球國家與機構的科研影響力分析
地球大數據相關研究論文主要分布在全球近?200個國家/地區。表?1?基于論文總被引頻次列出論文影響力最高的?15?個國家/地區及其論文數、篇均被引頻次、論文數全球占比和近?10?年(2011—2021?年)美國科技信息研究所基本科學指標數據庫(ESI)前?1%?高被引論文全球占比。美國涉及地球科學的大數據研究(廣義領域)起步較早,在論文數、論文總體影響力、篇均被引頻次、高被引論文等指標上都表現較好。首次明確提出地球大數據與大數據科學的概念(具體領域)是中國的科學家。2015?年?6?月?17—18?日,在北京舉行的“空間地球大數據”科學與技術前沿論壇上,郭華東報告中首次探討了空間地球大數據理念、科學內涵、與數字地球關系,以及對推動地球系統科學及全球變化研究發展的潛力;2016?年,郭華東及其團隊在《科學通報》發表的《空間地球觀測數據成為地球科學新引擎》一文正式使用地球大數據概念;2017?年,郭華東牽頭創辦了全球地球科學領域的第一個大數據刊物?Big Earth Data,并在創刊號上發文,提出地球大數據科學的概念。目前,中國已成為地球科學大數據的研究大國,年相關論文產出超過美國,在國際地球大數據科學領域的研究已處于引領地位。
圖?3?可視化展示了地球大數據相關研究論文產出最多的?15?個國家/地區的年度論文數量變化,主要國家/地區相關論文產出均呈增長態勢。2000?年以前,美國發表的相關論文占全球至少一半以上;2010?年以后,中國相關論文增長很快,德國、澳大利亞、英國等國相關論文也有明顯增長;自?2018?年起,中國年相關論文年產出已超過美國。
表?2?分別統計了全球地球大數據領域發文最多和論文總被引頻次最高的?25?個機構。發文最多的?25?個機構分布在美國、中國、法國、俄羅斯、意大利、印度等國,其中美國?13?個,中國?8?個,法國、俄羅斯、意大利、印度各?1?個;論文總被引頻次最高的?25?個機構分布在美國、中國、法國、意大利、加拿大等國,其中美國?19?個,中國?3?個,法國、意大利、加拿大各?1?個。
中國在地球大數據領域發文從論文數量和論文總被引頻次來看,中國科學院、北京師范大學和武漢大學是國內?3?個最主要的研究機構。北京師范大學開展地球大數據研究的主要單元為中國科學院遙感與數字地球研究所和北京師范大學聯合建設的遙感科學國家重點實驗室;同時,北京師范大學地理科學學部設置了地理數據與應用分析中心,開展地理空間數據建設、計算平臺搭建,以及利用多源數據開展地理學過程分析,中心下設數據存儲與計算實驗室、地理數據服務研究所和地理大數據研究所。武漢大學遙感信息工程學院和測繪學院是該校開展地球大數據研究的主要研究單元。
地球大數據研究領域分布
論文所屬期刊情況
基于美國科學信息研究所《期刊引用報告》(JCR)期刊分類對地球大數據相關研究論文所屬期刊學科領域進行分析發現,地球大數據相關研究論文所屬期刊分布在?200?多個主題類目中,大部分為自然科學,也有少量為社會科學和人文科學,圖?4?為分布最多的?40?個主題類目。遙感、環境科學、影像科學與攝影技術、地球科學多學科、氣象與大氣科學為分布最多的?5?個主題領域。
根據統計,地球大數據相關論文分布在?SCI?收錄的?4?000?余種期刊、叢書、圖書中。其中,發文最多的?20?種期刊中發表的相關論文占全部相關論文一半以上(圖?5)。Remote Sensing、International Journal of Remote Sensing、Remote Sensing of Environment、Journal of Geophysical Research emdash Atmospheres、IEEE Transactions on Geoscience and Remote Sensing?是發表相關論文最多的?5?個期刊。
論文所屬研究主題情況
InCites開發了一種基于論文引用的分類算法。隨著已發表論文的相互引用,這些引用關系的強度將相關文獻匯聚到一起,形成離散的相關文獻集群。這些集群構成了引文主題(Citation Topics)的核心,獨立于單篇文獻的主題和內容,卻代表著作者相互積極引用對方論文的領域。Citation Topics?構建一個宏觀、中觀和微觀主題的?3?級層次結構,包含?10?個廣義集群、326?個中觀集群和?2?444?個微觀集群的層次結構。根據聚類內容對宏觀和中觀類別進行了標注,由于微觀Citation Topics數量較多,使用算法工具根據聚類文獻中最重要的關鍵詞給每個主題加標注,從而有助于對研究主題進行更精細的分析。基于?InCites?的?Citation Topics?分類,對地球大數據相關研究論文的主題分布進行分析。
基于?Citation Topics的宏觀領域分布。地球大數據相關研究論文主要分布在電氣工程、電子學與計算機科學,地球科學,農業、環境與生態三大領域。這表明信息技術是地球大數據研究最主要的研究基礎;而地球科學,農業、環境和生態領域是地球大數據的主要應用領域(圖?6)。
基于?Citation Topics?分類的地球大數據相關研究論文中觀領域分布。研究主題主要集中在遙感,海洋學、氣象與大氣科學,林業等領域(圖?7)。
基于?Citation Topics?分類的地球大數據相關研究論文微觀領域分布。研究主題主要集中在歸一化植被指數、蒸散發、氣溶膠、海洋顏色、自發地理信息、冰川、云、生態系統服務、厄爾尼諾與南方濤動、熱帶氣旋等(圖?8)。
專業期刊關鍵詞分布情況
SCI?數據庫目前僅收錄?2?種地球大數據領域專業期刊——Earth System Science Data?和?Geoscience Data Journal。Earth System Science Data?創刊于?2009?年,2012?年開始被?SCI?收錄,目前為?JCR?地球科學“多學科”領域?1?區期刊,“氣象與大氣科學”領域?1?區期刊;Geoscience Data Journal?創刊于?2014?年,2015?年被?SCI?收錄,目前該刊為?JCR?地球科學“多學科”領域?3?區期刊,“氣象與大氣科學”領域?4?區期刊(2020?版?JCR)。截至?2021?年?8?月,SCI?數據庫共收錄了以上?2?刊的?893?篇論文。
對?Earth System Science Data?和?Geoscience Data Journal?發表的?SCI?論文的主題分布進行分析,基于其所發表論文的“作者關鍵詞”,繪制了關鍵詞共現網絡。如圖?9?顯示,兩刊發表論文研究主題涉及氣候與天氣、氣候變化、大氣溫度、降雨、觀測、重構、水文模型、海面溫度等廣泛主題,熱點關鍵詞主要有數據救援/氣候數據救援(climate data rescue)、公民科學(citizen science)等。
地球大數據研究熱點演化
提取不同時期相關論文最多的?20?個主題,并用熱力色階表示各主題在不同時期相關論文多少,顏色越接近紅色表明文獻量越大,顏色越接近藍色表明文獻越少(表?3)。從表?3?可以看到,不同時期研究熱點有較多不同。2000?年以前,更關注歸一化植被指數、云、厄爾尼諾與南方濤動、蒸散發、熱帶氣旋、內波、自發地理信息、海洋的顏色、冰川、地統計學。2016?年以來,更關注歸一化植被指數、蒸散發、氣溶膠、海洋顏色、生態系統服務、冰川、自發地理信息、激光雷達、城市熱島、地學統計;此外,深度學習、滑坡、森林火災、光污染、城市熱島效應等主題的相關文獻數量增長較快。
圖?11—14?基于“作者關鍵詞”可視化展示了不同時期相關研究論文的?300?個高頻關鍵詞聚類網絡,從而可以一窺不同時期的主要熱點研究主題。每幅圖中用同一顏色代表同一個聚類。節點大小和節點字體大小表示該節點論文數量多少。可以看到不同時期熱點研究主題發生了一些變化。
地球大數據研究的國際合作情況
主要國家間的國際合作
圖?15?可視化展示了地球大數據研究相關論文最多的?50?個國家/地區間合作密度,其中美國、中國、加拿大、英國、德國等國家/地區的國際合作強度最大。
表?4?統計了地球大數據相關研究論文發文量最多的?25?個國家/地區的國際合作論文占本國相關論文比重。數據顯示,大部分國家/地區的國際合作論文所占比重均超過一半以上,國際合作論文比重占比較低的有印度、土耳其、中國。
中國主要國際合作伙伴
圖?16?顯示了在地球大數據領域,與中國開展相關研究論文國際合作最多的?25?個國家,其中連線粗細表示與中國合作論文數量多少。中國國際合作論文最多的國家是美國、英國、加拿大、澳大利亞、德國、法國、日本、荷蘭、意大利、韓國、比利時。中國發表的地球大數據相關研究論文中,近?10%?的論文為?3?國及以上國家合作完成。
表?5?統計了地球大數據相關研究中,與中國合作論文最多的?25?個國外機構。統計顯示,中國的國際合作機構主要分布在美國,美國馬里蘭大學、法國國家科學研究中心、美國國家航空航天局是中國地球大數據領域最主要的?3?個海外合作機構。
結論與展望
近年來互聯網、云計算和人工智能等相關技術發展,使得地球大數據研究熱度升高,發文量增長迅速,影響力呈上升態勢。美國和中國在地球大數據研究領域處于領先地位,且目前中國的年發文量已經超過美國,但高被引論文數量低于美國,論文質量發展提升空間較大。從全球地球大數據發文最多和論文總被引頻次來看,研究熱度較高的機構不一定是影響力較大的機構。受我國地球大數據工程項目牽引,我國近?3?年的地球大數據發文量和影響力均得到快速提升,已經躍居全球第一,并且由我國科學家發起的基于地球大數據的“數字絲路”國際科學計劃帶動,與“一帶一路”多個國家和國際組織合作,參與國家科研機構在地球大數據的科研產出上也得到明顯的發展。地球大數據發文所屬期刊來看,中國期刊的國際化與國際影響力仍有待提高,國際合作以華人居多,需要進一步深入拓展。地球大數據研究領域主要分布在遙感科學、環境科學、大氣科學等,其研究熱點也主要聚焦在地球科學的研究熱點主題上,以應用為主,理論方法主要涉及與信息技術相關的人工智能等。
盡管國內外地球科學大數據都已經形成了相當的規模,取得了可觀的應用成果,但從發表的地球大數據相關研究論文內容來看,仍然存在諸多問題亟待解決,如:缺乏統一的數據描述標準、規范的數據共享機制,以及數據融合與深度挖掘問題顯著和地球系統模擬預測精度不高等。未來地球大數據的重點研究方向主要集中在:跨學科的地球大數據共享與融合;構建地球科學大數據深度挖掘理論與方法;建設地球大數據智慧平臺;形成新的研究范式與協同研究模式。(作者:安培浚、李佳蕾,中國科學院西北生態環境資源研究院、中國科學院大學;肖仙,桃中國科學院西北生態環境資源研究院;郭華東、閆冬梅中國科學院空天信息創新研究院。《中國科學院院刊》供稿)。