|
|
發(fā)展趨勢
科學大數(shù)據(jù)智能分析軟件的發(fā)展趨勢呈現(xiàn)出?AI?賦能、一體化、云服務(wù)、開放共享和可定制的重要特征。
AI?賦能。科學家在其研究領(lǐng)域嘗試使用人工智能新技術(shù)進行科學發(fā)現(xiàn)的需求日益高漲。因此,智能分析軟件除了提供領(lǐng)域相關(guān)的基礎(chǔ)運算操作和傳統(tǒng)算法,還需要支持深度學習、自然語言理解、知識圖譜等新型人工智能技術(shù)的集成應(yīng)用,為人工智能模型的訓練、測試、部署和運行提供全生命周期的工具化支持。
一體化。科學大數(shù)據(jù)智能分析包含復雜的數(shù)據(jù)處理、分析、模式提取和知識發(fā)現(xiàn)過程,而現(xiàn)有的大數(shù)據(jù)框架和平臺存在學習曲線高、開發(fā)代價大等問題。因此,在傳統(tǒng)“編程式”的開發(fā)模式基礎(chǔ)上,還需要為領(lǐng)域科學家提供簡單易用的“拼裝式”可視化挖掘分析環(huán)境,并利用高質(zhì)量、可復用的模型與算法庫,進行科學大數(shù)據(jù)分析模型的創(chuàng)新設(shè)計,實現(xiàn)涵蓋數(shù)據(jù)源集成、代碼編輯、流程設(shè)計、模型算法復用以及執(zhí)行與可視化的一體化支撐。
云服務(wù)。云服務(wù)化的科學大數(shù)據(jù)智能分析軟件不需要本地進行軟件安裝和維護。因此,一方面,瀏覽器成為挖掘分析全流程操作和管理的統(tǒng)一門戶界面;另一方面,模型、算法以及數(shù)據(jù)源將以在線?API?的形式進行共享和復用,這一形式也被稱為“功能即服務(wù)”(function as a service)。
開放共享。交叉科學的重大發(fā)現(xiàn)需要綜合應(yīng)用多領(lǐng)域的分析模型和算法。匯聚跨領(lǐng)域的共性模型,形成類型豐富、性能優(yōu)異的模型和算法庫,這將成為降低領(lǐng)域交叉綜合分析模型開發(fā)難度、提升開發(fā)效率的基礎(chǔ)。同時,各領(lǐng)域科學家團隊通過共享高質(zhì)量的模型和算法,也將促進軟件系統(tǒng)持續(xù)演化,使軟件系統(tǒng)更具生命力。例如,R?語言算法庫?CRAN?是交叉領(lǐng)域算法共享的典范,該算法庫目前收錄了各領(lǐng)域科學家貢獻的?4?000?多種算法,吸引了大量的用戶。
可定制。不同科學領(lǐng)域的數(shù)據(jù)分析模式千差萬別,通用的、固化的大數(shù)據(jù)分析軟件無法滿足特定領(lǐng)域科學家團隊的個性化分析需求,這種個性化需求存在于分析流程、數(shù)據(jù)源、算法模型、可視化等各個層面。因此,一個理想的科學大數(shù)據(jù)智能分析軟件應(yīng)該支持數(shù)據(jù)、模型算法和可視化視圖等多個方面的領(lǐng)域定制與擴展,支持領(lǐng)域科學家以及領(lǐng)域內(nèi)的軟件工程師進行特有組件的開發(fā)。