|
中國網(wǎng)/中國發(fā)展門戶網(wǎng)訊 2007?年圖靈獎(jiǎng)得主吉姆?·?格雷(Jim Gray)發(fā)表了著名演講《科學(xué)方法的革命》,將科學(xué)研究分為?4?類范式(paradigm),即實(shí)驗(yàn)歸納、模型推演、仿真模擬和數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)(data-intensive scientific discovery),從而提出了被廣泛稱為“第四范式”的“科學(xué)大數(shù)據(jù)”新視角。經(jīng)過10年的技術(shù)發(fā)展,深度學(xué)習(xí)等先進(jìn)技術(shù)在圖像、語音、自然語言等人工智能領(lǐng)域均取得突破進(jìn)展。在自然科學(xué)領(lǐng)域,近年來科學(xué)家們也緊跟趨勢(shì),基于科學(xué)大數(shù)據(jù)驅(qū)動(dòng)的新模式,采用深度學(xué)習(xí)等新技術(shù),取得了一批重大科學(xué)發(fā)現(xiàn)成果,發(fā)表在?Science、Nature等權(quán)威學(xué)術(shù)刊物。然而,大數(shù)據(jù)驅(qū)動(dòng)的科學(xué)研究工作因?yàn)閲?yán)重依賴于先進(jìn)的信息技術(shù),對(duì)于大多數(shù)科學(xué)家團(tuán)隊(duì)而言仍具有一定門檻。
多學(xué)科、跨領(lǐng)域交叉背景下的科學(xué)大數(shù)據(jù)挖掘分析與知識(shí)發(fā)現(xiàn),依賴于構(gòu)建一套高效、易用、可擴(kuò)展的科學(xué)大數(shù)據(jù)智能分析軟件系統(tǒng),為復(fù)雜數(shù)據(jù)處理、分析、模式提取和知識(shí)發(fā)現(xiàn)提供學(xué)習(xí)模型、算法及開發(fā)工具支持。通過分析該領(lǐng)域發(fā)展現(xiàn)狀,我們發(fā)現(xiàn),一些分析軟件因?yàn)檫\(yùn)行在單機(jī)環(huán)境而無法處理大規(guī)模數(shù)據(jù),一些分析軟件因需要較高的編程開發(fā)技能而令科學(xué)家團(tuán)隊(duì)望而卻步。隨著云計(jì)算、大數(shù)據(jù)和人工智能技術(shù)的發(fā)展,利用云計(jì)算平臺(tái)承載人工智能技術(shù)進(jìn)行大數(shù)據(jù)智能分析已經(jīng)成為趨勢(shì),而開放共享與個(gè)性化定制也成為軟件發(fā)展的主流方向。從中可以總結(jié)出科學(xué)大數(shù)據(jù)智能分析軟件的五大發(fā)展趨勢(shì):AI?賦能、一體化、云服務(wù)、開放共享和可定制。
筆者通過對(duì)眾多科學(xué)家進(jìn)行需求調(diào)研,結(jié)合大數(shù)據(jù)智能分析技術(shù)及軟件的發(fā)展趨勢(shì),提出了一個(gè)面向科學(xué)大數(shù)據(jù)的一體化、可定制的智能分析框架,支持科學(xué)家交互式的構(gòu)建智能分析模型,并基于云平臺(tái)分布式計(jì)算引擎實(shí)現(xiàn)分析模型的高效執(zhí)行,為快速開展科學(xué)發(fā)現(xiàn)研究提供系統(tǒng)和工具支撐。期望通過該智能分析框架的研發(fā)與應(yīng)用,為下一代科學(xué)大數(shù)據(jù)智能分析軟件提供參考方案。