|
發展趨勢
科學大數據智能分析軟件的發展趨勢呈現出?AI?賦能、一體化、云服務、開放共享和可定制的重要特征。
AI?賦能。科學家在其研究領域嘗試使用人工智能新技術進行科學發現的需求日益高漲。因此,智能分析軟件除了提供領域相關的基礎運算操作和傳統算法,還需要支持深度學習、自然語言理解、知識圖譜等新型人工智能技術的集成應用,為人工智能模型的訓練、測試、部署和運行提供全生命周期的工具化支持。
一體化。科學大數據智能分析包含復雜的數據處理、分析、模式提取和知識發現過程,而現有的大數據框架和平臺存在學習曲線高、開發代價大等問題。因此,在傳統“編程式”的開發模式基礎上,還需要為領域科學家提供簡單易用的“拼裝式”可視化挖掘分析環境,并利用高質量、可復用的模型與算法庫,進行科學大數據分析模型的創新設計,實現涵蓋數據源集成、代碼編輯、流程設計、模型算法復用以及執行與可視化的一體化支撐。
云服務。云服務化的科學大數據智能分析軟件不需要本地進行軟件安裝和維護。因此,一方面,瀏覽器成為挖掘分析全流程操作和管理的統一門戶界面;另一方面,模型、算法以及數據源將以在線?API?的形式進行共享和復用,這一形式也被稱為“功能即服務”(function as a service)。
開放共享。交叉科學的重大發現需要綜合應用多領域的分析模型和算法。匯聚跨領域的共性模型,形成類型豐富、性能優異的模型和算法庫,這將成為降低領域交叉綜合分析模型開發難度、提升開發效率的基礎。同時,各領域科學家團隊通過共享高質量的模型和算法,也將促進軟件系統持續演化,使軟件系統更具生命力。例如,R?語言算法庫?CRAN?是交叉領域算法共享的典范,該算法庫目前收錄了各領域科學家貢獻的?4?000?多種算法,吸引了大量的用戶。
可定制。不同科學領域的數據分析模式千差萬別,通用的、固化的大數據分析軟件無法滿足特定領域科學家團隊的個性化分析需求,這種個性化需求存在于分析流程、數據源、算法模型、可視化等各個層面。因此,一個理想的科學大數據智能分析軟件應該支持數據、模型算法和可視化視圖等多個方面的領域定制與擴展,支持領域科學家以及領域內的軟件工程師進行特有組件的開發。