全球首個地理科學大模型“坤元”發布 深度融合人工智能
中國網/中國發展門戶網訊 (記者 王振紅)9月19日,中國科學院地理科學與資源研究所在北京召開新聞發布會,正式發布該單位聯合中國科學院青藏高原研究所、中國科學院自動化研究所等單位研發的多模態地理科學大模型“坤元”(Sigma Geography)。
全球首個多模態地理科學大模型“坤元”發布,圖為發布現場。
據中國科學院地理科學與資源研究所副所長、研究員蘇奮振介紹,該大模型是專注于地理科學的專業語言大模型,具備處理地理科學相關問題的專業能力,研發團隊完成了地理學全譜系高質量語料庫構建、地理科學語言大模型構建、地理科學研究智導平臺研發等工作,“讓‘坤元’具備‘懂地理’‘精配圖’‘知人心’‘智生圖’等特點,實現了地理專業問題解答、地理學文獻智能分析、地理數據資源查詢、地理數據挖掘分析、專題地圖繪制等功能。”
研發團隊建立了涵蓋4大類、16小類的地理全學科語料庫,提供320億詞元供大模型自監督學習,并制作了4萬余條高質量地理學指令進行模型微調。“相比通用語言大模型,‘坤元’更熟悉地理學的語言模式、專業術語和領域知識,在地理學基準測試集上的準確性提升了31.3%。”蘇奮振介紹說。
團隊自主研發了面向多層次地圖信息的多模態檢索技術、支持地理認知與圖形表達的知識推理技術。蘇奮振表示,這些技術使得“坤元”能夠在解答地理學提問的同時,可以根據生成的文字答案檢索不同地理要素,并匹配地理景觀照片、專題地圖或示意圖表呈現給提問者。
據了解,團隊創新提出了基于“認知啟航-應用智導-前沿研析”框架的用戶畫像精準判別與響應技術,保證“坤元”能夠充分考慮地理知識愛好者、地理學專業學生以及科研人員的地理科學知識體系認知和表達差異,以圖文共現的方式給出適配用戶知識結構的地理學專業問題解答。
團隊基于“坤元”開發的科研助手,可以根據用戶指令完成概念理解、數據獲取、信息分析、制圖綜合等流程,最終生成用戶需要的專業地理圖表。
“坤元”旨在拓寬普通大眾的地理視野,解放地理從業者的雙手,推動地理智能發展,賦能地理科學研究、加速重大地理科學發現。
北京大學教授劉瑜點評認為,“‘坤元’在地理學術論文發表上已經展現出極大的應用潛力,未來通過地圖大模型與地理推理機的研發,預計能夠進一步提升地理信息處理的智能化水平,為地理科研協作提供全新的范式。”
中國測繪科學研究院副院長、研究員劉紀平點評認為,“‘坤元’體現了我國地理信息領域的前沿創新能力。其研發成果不僅在學術上具有重要意義,還為地理科學與測繪領域的智能化發展提供了強有力的技術支撐。這一成果的廣泛應用,將極大推動測繪行業的進步,為我國地理科學的全球競爭力提升做出重要貢獻。”
蘇奮振表示,未來,研發團隊將推進地圖大模型及地理推理機研發,有望讓地理科學語言大模型讀懂地圖;將打造地理科研協作大平臺,以期讓每個科學家和科研團隊都可以擁有專屬的地理大模型,能夠與數百萬科學家通過共享數據、模型、研究思路等方式協同工作。