分布式自主科學:科學多樣可持續性發展的新范式
中國網/中國發展門戶網訊 生成式人工智能(generative artificial intelligence,GAI;AI generated contents,AIGC)系統ChatGPT的問世,標志著人類社會已經開啟新的研究范式,即人工智能驅動的科學(artificial intelligence for science,AI4S)與想象智能(imaginative intelligence)的研究時代。人工智能(AI)被廣泛應用于文獻分析、實驗設計、作品展示、知識創作、知識審查,以及編輯出版等領域,極大地提高了科學研究的效率和質量。如今,AI4S成為各國在新一輪科技革命和智能產業變革背景中的核心技術和關鍵籌碼。
AI4S為科學系統帶來了前所未有的變革和機遇,也不可避免地加劇了其不確定性、多樣性和復雜性。現有科學系統(CeSci)主要基于自上而下的組織結構和制度構建,滯后于智能技術的發展及現實要求。具體表現為:一些項目資助中出現的偏見、低效、知識壟斷對科學價值流動的阻礙,以及官僚式等級結構對科學的多樣性和開放性的破壞等。過去已有的一些努力試圖解決這些問題。如開放科學、研發群體科學(SciTS)等嘗試,但收效甚微,這與其所處的時代背景及技術發展階段相關。
以區塊鏈為代表的Web3技術和分布式自主組織與運營(DAOs)的出現,促使科學系統的資源和注意力重新分配。科學系統以更加快速、高效的方式自下而上資助、組織、培訓、規劃、協調、調度、收集和分配供需活動,并管理基于網絡空間的社區科技資源。這類技術的應用,有望消除研究偏見、信息孤島及知識壟斷等問題,從而將科學價值與所有權歸還于知識生產者,并實現科學的多樣可持續發展。分布式自主科學(decentralized science,DeSci)是隨著Web3技術和DAOs的基礎設施的逐漸完善而發展起來的一種新的科學發展范式。DeSci旨在加強科學資助、開放知識、消除對追求利潤中介機構的依賴、促進跨領域交流協作。
目前,關于DeSci的研究與應用相對較少。截至2023年3月,盡管各種各樣的DeSci組織已經在世界各大城市十分活躍,但可查詢且正在運營的公開正式創業型DeSci項目僅約100個。因此,DeSci被許多人誤解為AI創業中一個非常初期且應用范圍狹窄的賽道或科技生態中“參天大樹下的林間灌木和草地”,只適應于“解決小問題、完成小任務”。事實上,回顧科技發展史,科學自誕生以來便以DeSci的形式存在,且與各行各業交織發展。AlphaGo、AlphaFold及時下的ChatGPT,從起步、組織、實施到完成都是貨真價實的DeSci實質性成果,與CeSci并無關系。同時,作為新研究范式AI4S的組織和運營方式,DeSci和CeSci必須互相補充、相互促進,才能進而確保科學系統的公開、公平、公正、多樣性和可持續發展。本文將從理論層面闡述DeSci的概念、特征及架構,分析DeSci的研究現狀與應用現狀,探討和總結DeSci對于科學系統進一步發展的啟示與意義。
DeSci的概念、特征及架構
概念與主要特征
DeSci是相對較新的術語,暫無統一的概念。常見的理解為:基于Web3和DAOs構建,使用智能合約、代幣(可替代和不可替代)和開源金融工具,特別是去中心化金融(decentralized finance)將科學及科學服務開放化和市場化。如知識產權代幣化、科學系統的民主集中治理、同行評審,以及數據或基礎設施的訪問權限。這種定義是一種局限于Web3技術下的狹義視角;我們可以從更廣義的視角來理解DeSci,即DeSci是一種通過智能數字技術融合自下而上與自上而下的決策與服務,是一種集資助、組織、培訓、規劃、協調、調度、收集、分配供需為一體的生態化科學活動。目前DeSci最大的應用領域是管理基于網絡空間的社區科技資源。DeSci是對改進CeSci的集體愿景的呈現。通過智能技術有望使科研機構轉變為具有更高效能的數字化組織機構,更好地履行科研職責并具有與人類價值觀相一致的能力。DeSci從多方面與現有的CeSci互補。DeSci的主要特征如下。
公平。DeSci正在試圖解決CeSci的資助偏見和第三方機構對知識與數據的壟斷等問題。科學過程除了基于證據的研究之外,還受到各種人為因素的影響,如社會力量和個人動機。CeSci通常建立在特定的社會等級制度上,不可避免地存在身份、文化、種族、年齡、性別及研究議題的偏見。DeSci通過分布式技術協議和開放性參與權利,吸引邊緣化的或排除在科學之外的群體,確保研究群體與議題的多樣性、資助的公平性和知識使用的開放性。
自由。DeSci主要通過社區自下而上的努力來解決特定問題。在科學活動的組織過程中,CeSci往往缺乏介入微觀活動的能力。DeSci與CeSci互補,有效打破了CeSci對科學活動施加的認知約束以及激勵偏見。這使得研究者能夠專注于具體問題或研究課題,同時有強烈的動機開展跨學科交流和學科交叉合作。此外,DeSci將數據所有權和價值歸還給用戶,這將進一步促進數據的自由流動和使用。
負責。可復制性和“科技作惡”是CeSci中的兩大難題。前者與缺乏原始數據或數據捏造,以及分析方法越來越復雜和靈活有關,后者則源于科學技術成果的不當使用、濫用及違背社會倫理規范等原因。DeSci是由研究者、資助者、使用者共同組成的生態系統,通過代幣化的經濟機制激勵研究者開放研究方法、代碼和數據,這就使得科學研發過程更加透明,“作惡”成本更加高昂,從而降低不負責任的科學行為的產生。
敏捷。高度優化的科學系統難以適應科學中的不確定性,以及應對不穩定性的挑戰。DeSci依賴網絡社區資源,采用自下而上的運營與治理模式,能夠敏捷、高效地應對系統中的不確定性和不穩定性,一定程度上避免了系統為適應多變的環境而形成的自我保護泡沫和次優循環風險。
基本架構
CeSci和DeSci都以知識發現、管理和自動化為目標,但不同之處在于實現這一目標的手段和過程,具體體現在技術棧、組織結構、運營方式等方面(圖1)。
智能技術。理想狀態下,DeSci由數字人、生物人和機器人的共同協作實現。部分科學工作是由數字人引導生物人和機器人代替生物人完成的。要實現這一工作模式,數字孿生技術、元宇宙技術和Web3技術等起到關鍵支持作用。數字孿生技術:是DeSci的工程技術,從工程的角度出發,服務于科學系統的數字建模過程,同時與人工智能技術相結合,為構建科學系統的成員群體,尤其是虛擬生物人和機器人,在形態、行為和知識等方面提供技術支持。元宇宙技術:是基于DeSci的場景技術,從場景的角度出發,服務于DeSci功能實現過程,為DeSci構建了組織群體智慧與大規模生產力的場景。Web3技術:是服務于DeSci的網絡技術,Web3技術的本質是技術與模式的綜合創新,其從生態的角度出發,服務于科學系統的協作過程,實現虛實相生的環境。
組織。DeSci以分布式自主的方式來組織勞動分工、分配資源、劃分權責,構建科學社區共有所有權的組織結構。DeSci的組織層面:主要涉及組織形態與治理機制。DeSci的組織形態:可分為分布式多中心、分布式全中心和不對等中心等不同類型。具體表現形式包括基金會+DAO社區和基金會+DAO社區+公司等。這些不同類型的組織形態與DeSci的去中心化程度和應用場景有關。DeSci的治理機制:通常包括鏈下治理、鏈上治理、鏈下治理+鏈上治理等方式。鏈上治理是指決策規則被編寫進協議,并且任何經過批準的決策都會自動添加進協議。這種治理方式使得去中心化社區能夠通過在鏈上投票直接更新區塊鏈,決策過程通過質押和交易在區塊鏈上進行。鏈下治理是指決策過程在區塊鏈之外進行,主要通過非正式討論、改進提案流程或類似方式展開。鏈下治理具有決策快速和易于達成共識的優勢。
運營。自主的協調與執行是DeSci的核心。DeSci采用項目制任務分工協調,并建立了激勵驅動的動態自治協調機制,以集體決策的方式在去信任的環境中管理和控制組織的決策過程。DeSci的協調層主要關注決策方法和激勵機制。通過組合不同的激勵手段和采用不同的激勵機制設計,如通證、信譽和治理權力,DeSci能夠更好地滿足成員的外在和內在需求,從而激勵他們更好地分工協作以實現組織目標。同時,DeSci利用智能合約的自動執行能力和智能算法的學習與優化能力,在無需人為干擾的情況下實時可靠地生成并實施面向特定問題的決策。執行層主要包括智能合約和智能算法,能夠有效增強DeSci智能性。
DeSci的研究現狀與應用現狀
DeSci并不是一個全新的概念,不同的學術群體和組織曾提出過類似的觀點。其源頭是社會運動組織或社會運動群體(SMOs),近段時間就是人肉搜索、眾包、動態網民群體組織(CMO或CeMOs)、研發群體之科學(SciTS)、開放化自治社會(DAS或DeSoc)等。本節以區塊鏈技術和智能合約技術等開放化應用技術為追溯源頭分析DeSci的研究現狀與應用現狀。
研究現狀
DeSci最早的思想雛形源于2016年聯合國開發計劃署(UNDP)和青島智能產業技術研究院(QAII)發起利用SciTS和區塊鏈、智能合約的AI4F2rS2計劃。隨著DAOs應用場景逐漸豐富,蘇黎世聯邦理工學院的博士后Martin Etzrodt于2018年從期刊如何解決同行評審及付費墻的角度首次提出DeSci概念。隨后,Sarah Hamburg于2021年12月致信Nature期刊提出DeSci運動。此時的DeSci處于提出與號召的階段,暫無學術研究。
2020年,中國科學院自動化研究所與澳門科技大學聯合組建了智能科學與系統聯合實驗室,該實驗室研究領域主要集中于研究平行管理、平行經濟與平行社會等,并獲得澳門科學技術發展基金委的重點項目資助。2022年該實驗室的DeSoc團隊在已有的平行DAOs治理工具,即cad2CAS與casCAD2研究基礎之上,發表“DAO to DeSci、DeSci研究框架和DeSci的元市場”等系列學術研究成果,填補了DeSci在學術研究領域的空白。
此外,2022年3月21—30日,IEEE Intelligent Systems和IEEE Transactions on Intelligent Vehicles學術期刊,以及2022年9月召開的“IEEE智能交通系統國際會議2022”分別組織了多場DeSci相關的研討會,旨在探討DeSci面臨的挑戰及其對現有科研生態和未來科學活動,及其運營演變的影響。
目前,中國在DeSci領域的理論研究處于全球領先地位。但在DeSci的實踐方面嚴重滯后于西方發達國家,特別是歐洲工業國家。2016年,中國科學院自動化研究所復雜系統管理與控制國家重點實驗室的平行智能團隊開始專注于區塊鏈和智能合約的研究,并提出了平行區塊鏈和可編程智能合約的研究框架和實現方法[17]。2019年,該團隊還提出了DAOs的研究框架及其關鍵要素。2020年,該團隊提出DAOs的平行治理研究方法,并發布DAOs的平行治理系統cad2CAS與casCAD2。2023年,為應對DAOs在實踐中遇到的治理權力壟斷、代幣資源陷阱及決策惰性等問題,該團隊進一步提出TAOs,即“真”自主的組織與運營(TRUE autonomous organizations and operations)。這些研究成果為各國在DeSci領域的研究奠定了理論基礎。
應用現狀
當前,DeSci的應用多集中在科研資助、知識共享以及科學系統的所有權與價值體系的探索。主要應用具體如下。
資助。當前科研資助通常由特定的機構管理和分配。資助機構與被資助者所關注的視角以及知識存在差異,導致資助者的目標與社會最優資助水平不一致,某些研究領域經常被忽視。最為明顯的現象是,近年來突破性研究出現的頻率在降低,資助資金越來越傾向于資助成功率高、符合當前熱點并具有高聲譽的研究人員,十分不利于創新的多樣性基礎之培育。DeSci正在嘗試通過DAOs技術和Web3技術,探索新的資助模型。典型的資助機制包括:二次方融資資助、可追溯性公共物品資助、知識產權的不可替代通證(IP-NFT)、資助DAO (Grants DAO)等。例如,DoraHacks作為典型的二次方融資資助平臺,從2021年底,開始明確資助DeSci和前沿研究。IP-NFT則是一種利用分布式分類賬技術(DLT)來管理知識產權(IP)所有權的新機制。這種模式已在生物技術領域成功應用,如長壽研究Vital DAO、迷幻藥研究PhyDAO和計算生命科學研究社區Lab DAO等。Grants DAO是DeSci中最廣泛的用例,Grants DAO可以根據DAO的目標設置開放化的資助機制,并在Environment DAO、Klima DAO等得到了成功的應用,有效地推動了環境的保護。開放化資助已經成為Web3重要的組成部分,也是DeSci中最早和相對成熟的實踐。
出版與同行評審。同行評審過程為科學成果提供了必要的質量控制,但在當前機制下,期刊出版機構并沒有更優化的激勵(包括報酬和聲譽)評審專家為其提供高質量同行評審的方式。結構性問題導致2個不良循環:①由于找不到愿意審查該工作的評審專家,潛在良好的研究延遲出版;②找到了不匹配的評審專家,導致不良研究成果出版。基于以太坊的開放與隱私同行評審協議Ants Review正在嘗試解決其中的部分問題。它允許作者在以太坊上發布公開的匿名同行評審獎勵,第三方可以匿名提交評審意見,然后,這些評審意見由外部評審專家審查,根據外部評審專家的意見接受或拒絕評審意見,并按照評審意見的質量發放獎勵。OpenAccess DAO正在致力于創建一個公共數據存儲庫和開放同行評審的平臺,以使科學研究更加透明,以及成果可被公開訪問;同時,OpenAccess DAO準備建立一個評審者聲譽網絡,該網絡旨在鼓勵評審者參與到開放的同行評審過程中來。
數據訪問及可復制性。數據可訪問是復制研究結果的前提,有效的激勵機制可以進一步促進重復研究。這需要一個不可篡改、可驗證憑證的系統,允許受信任的各方安全地復制敏感數據,復現研究結果,甚至能讓多方協作并向數據集添加新數據。基于Web3技術的數據解決方案支持上述場景,并為科學的開放提供基礎。研究人員可以創建無需訪問權限或費用的公共物品。例如:開放化氣候數據協議dClimate提供開放的全球氣候和天氣數據訪問。DeSci基金會正在試點通過資助以及特定的聲譽來鼓勵社區復制現有的科學結果。
啟示與意義
在一個負責、公平、安全和合乎道德的科學系統上實現AI4S,是科學發展的基石。DeSci在資助、數據開放和民主參與等方面有著獨特的優勢,但DeSci的發展也面臨著探索應用場景、平衡科學社區參與質量及科學過程的問責機制等問題。DeSci的劣勢恰恰是CeSci的優勢。因此,構建一個科學資源民主化、科學研究多樣化及更負責任的科學系統,需要DeSci和CeSci兩方面共同努力和有效的合作。
科學資源的民主化。AI4S對于科學資源的民主化是一把雙刃劍。一方面,它使有限資源的研究組織和個人利用大語言模型能力快速解決復雜問題和展開科學研究;另一方面,其使用權、可用語料庫等卻可能加劇科研不平等,尤其是那些身處落后地區或處于邊緣化的群體。解決負面問題,需要CeSci和DeSci共同采取一系列措施來推動科學資源的民主化和科學創新。例如,CeSci支持大預言模型的使用權;借用DeSci的資助力量,加大科研投入,特別是資助科研薄弱地區;充分發揮DeSci自下而上調動社區資源的能力,構建無邊界科學,促進知識和技術的資源共享等。
科學研究的多樣化。AI4S的使用可能會加劇偏見和歧視的問題,因為AI的智能能力是基于大量學習語料庫而得的。而算法程序、文本語料可能蘊含特定的價值形態,特別是在性別、種族、地域、文化等方面,這意味著訓練出來的模型也存在偏見和歧視。再加之,輸出結果和內容又可以根據個人的偏好進行調整,導致個人偏見得到進一步自我強化。在AI4S的背景之下,CeSci的特定目標導向性特征難以滿足科學研究的多樣性,但是可以通過制定相應的政策法規來構建DeSci與CeSci的合作橋梁,促進創新生態DeSci發展。借助DeSci的組織結構和運營手段來進一步促進研究群體與議題的多樣性、資助的公平性,以及無國界的交叉學科、跨學科、多學科的交流與合作。
更負責任的設計與合乎道德的使用。大語言模型的輸入與輸出過程是一個不透明的“黑箱”,不良算法設計、決策和行為可能會引發安全隱患及倫理沖突。為確保AI4S系統的可持續性發展,需要實施強有力的安全措施。① DeSci與CeSci共同推動算法標準開源,確保AI系統的設計和實現是可靠的。②通過在DeSci社區建立審核機制來確保數據源的質量和多樣性,從而消除AI系統可能存在的歧視性。③強化技術理性和算法倫理的教育培訓,提高對AI技術的認識,了解如何更好地使用和設計AI系統,以確保其合道德和法律標準。④人工干預來監督AI系統的行為,并在必要時進行糾正。這些措施的實施離不開CeSci和DeSci的共同努力,只有CeSci和DeSci攜手共進,才能建立更加負責和可持續的AI4S系統。
在AI4S的科學范式中,確保科學系統的公正性、多樣性是非常重要的,因為只有這樣才能真正發揮科學研究的價值,并為智能科學的可持續發展奠定堅實的基礎。隨著人工智能大模型不斷成熟、生成式人工智能發展愈發深入,DeSci將成為學術活動必不可少的形式,與CeSci共同應對未來科研的復雜性。CeSci、DeSci、AI4S互相補充、互相促進,也將形成一種新的科學范式——平行科學。平行科學基于平行智能理論和技術,利用數字人、理論科學家和機器人工程師構建平行物理、平行化學、平行材料、平行生物、平行醫學、平行經濟、平行藝術、平行哲學等學科。平行科學的發展可以促進不同領域之間的交流和合作,加速科學研究成果轉化過程,為智能產業和智慧社會的發展奠定基礎,提供保障。
(作者:王飛躍,中國科學院自動化研究所 復雜系統管理與控制國家重點實驗室、澳門科技大學 創新工程學院;丁文文,澳門科技大學 創新工程學院;編審:金婷;《中國科學院院刊》供稿)