|
數(shù)據(jù)管理與保存得到重視
重大項(xiàng)目計(jì)劃產(chǎn)生的海量科學(xué)數(shù)據(jù)作為國家資源和人類知識(shí)庫,應(yīng)進(jìn)行長(zhǎng)期保存和管理,讓科學(xué)家在未來很長(zhǎng)一段時(shí)間內(nèi)可以深入挖掘數(shù)據(jù)背后的知識(shí)。國內(nèi)外紛紛建立空間科學(xué)領(lǐng)域的數(shù)據(jù)中心/系統(tǒng),實(shí)施數(shù)據(jù)的長(zhǎng)期保存和質(zhì)量管控。
美國國家航空航天局(NASA)建立了國家空間科學(xué)數(shù)據(jù)中心(National Space Science Data Center,NSSDC)用以保障空間科學(xué)衛(wèi)星任務(wù)(含空間天文、天文物理、太陽和空間等離子體物理、行星科學(xué)、月球科學(xué)和空間物理)檔案數(shù)據(jù)永久安全和長(zhǎng)期可用,并為世界范圍的科學(xué)家提供公開數(shù)據(jù)服務(wù)。截至?2015?年?12?月,僅其所屬的行星數(shù)據(jù)系統(tǒng)(Planetary Data System,PDS)存儲(chǔ)和管理的火星、月球、金星、水星各等級(jí)軌道探測(cè)數(shù)據(jù)已超過?947?TB。
歐洲空間天文中心(European Space Astronomy Centre,ESAC)作為歐空局(European Space Agency,ESA)空間科學(xué)數(shù)據(jù)中心,也對(duì)所有歐洲空間天文、太陽系探測(cè)、行星科學(xué)、基礎(chǔ)物理等衛(wèi)星任務(wù)產(chǎn)生的科學(xué)檔案數(shù)據(jù)進(jìn)行了集中管理和存儲(chǔ)。
在空間科學(xué)先導(dǎo)專項(xiàng)支持下,我國也建設(shè)了集科學(xué)衛(wèi)星數(shù)據(jù)匯集與分發(fā),數(shù)據(jù)全生命周期質(zhì)量控制,數(shù)據(jù)存儲(chǔ)、管理與歸檔為一體的空間科學(xué)先導(dǎo)數(shù)據(jù)管理系統(tǒng)(空間科學(xué)數(shù)據(jù)中心),有效支撐了“悟空”“SJ-10”“墨子”和“慧眼”衛(wèi)星任務(wù)的實(shí)施,促進(jìn)了衛(wèi)星成果產(chǎn)出,可保障數(shù)據(jù)的永久安全。
研究范式發(fā)生轉(zhuǎn)變
科學(xué)大數(shù)據(jù)時(shí)代的典型特征是研究范式的轉(zhuǎn)變,與傳統(tǒng)基于少量數(shù)據(jù)樣本開展理論分析的科研模式不同,大數(shù)據(jù)時(shí)代下的科研人員主要通過對(duì)多源、多要素、全樣本空間的大數(shù)據(jù)進(jìn)行分析,通常結(jié)合神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)等大數(shù)據(jù)技術(shù),挖掘科學(xué)大數(shù)據(jù)中蘊(yùn)藏的科學(xué)知識(shí)。空間科學(xué)領(lǐng)域研究模式也正向數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)模式轉(zhuǎn)變。
作為數(shù)據(jù)驅(qū)動(dòng)知識(shí)發(fā)現(xiàn)的典范,暗物質(zhì)粒子探測(cè)衛(wèi)星——“悟空”的科學(xué)家團(tuán)隊(duì)通過對(duì)衛(wèi)星?530?天采集的?28?億份高能宇宙射線數(shù)據(jù)樣本分析,首次找到了電子宇宙線能譜在?~1?TeV?處的拐點(diǎn)(異常波動(dòng)),而這個(gè)拐點(diǎn)反映著高能電子輻射源的典型加速能力,拐點(diǎn)下降行為對(duì)解釋電子宇宙線是否來自暗物質(zhì)起著關(guān)鍵作用。
針對(duì)開普勒太空望遠(yuǎn)鏡(Kepler space telescope)獲取的海量數(shù)據(jù),NASA?科學(xué)家利用深度學(xué)習(xí)算法構(gòu)建的機(jī)器學(xué)習(xí)模型具備對(duì)低信噪比數(shù)據(jù)進(jìn)行自動(dòng)系外行星識(shí)別能力,模型對(duì)開普勒太空望遠(yuǎn)鏡數(shù)據(jù)庫?20?萬個(gè)目標(biāo)星系數(shù)據(jù)進(jìn)行自動(dòng)搜尋,成功從中找到了Kepler-80?g?和?Kepler-90?i?兩顆系外行星。
早在?20?世紀(jì)?90?年代,空間物理學(xué)研究中便開始采用機(jī)器學(xué)習(xí)等大數(shù)據(jù)技術(shù)對(duì)衛(wèi)星獲取的數(shù)據(jù)進(jìn)行分析,開展空間天氣研究和預(yù)報(bào)。諸如磁層亞暴觸發(fā)識(shí)別,太陽活動(dòng)(日冕物質(zhì)拋射、耀斑)預(yù)測(cè)和行星際激波預(yù)報(bào)等。其中太陽耀斑預(yù)測(cè)更是使用?SDO?衛(wèi)星?4?年,超過?5.5?TB?的太陽光球?qū)印⑸驅(qū)拥葓D像大數(shù)據(jù)作為模型的訓(xùn)練輸入。事實(shí)證明,大數(shù)據(jù)分析技術(shù)對(duì)非線性空間天氣過程研究和高度復(fù)雜度空間天氣事件預(yù)報(bào)具有重要實(shí)踐意義,數(shù)據(jù)密集型的研究模式正逐漸發(fā)展成空間物理學(xué)的主流模式。