關于信息技術驅動未來產業的若干思考
中國網/中國發展門戶網訊 黨的二十大為新一代的信息技術產業指明了方向,要以推動高質量發展為主題,構建新一代信息技術產業新的增長引擎。信息技術領域市場巨大,技術競爭激烈,比傳統產業更具壟斷性和技術排他性。李國杰院士指出,決定市場勝負的主要因素不是單項技術,而是有優勢的信息技術體系。一旦一個技術體系占據了主導權,后發者就很難在同一賽道實現趕超或取代,而原賽道的領先者也很難在新“藍海”延續其成功。因此,形成新的技術體系必須把握住新應用出現時的寶貴機遇。隨著新一輪科技革命和產業變革突飛猛進,科研范式發生深刻變革,把握當前信息技術發展的機遇期,對于加快構建新發展格局、加快建設科技強國具有重要意義。
人工智能的發展和應用成為信息技術發展前沿的主要趨勢
人工智能的快速發展正在對人類社會產生重大影響
《麻省理工科技評論》(MIT Technology Review)近?5?年發布的年度“全球十大突破性技術”(10 Breakthrough Technologies)中,涉及人工智能(AI)的相關技術頻頻入選。例如,2023?年“制作圖形的AI”和“改變一切的芯片設計”;2022?年“終結密碼”“AI?蛋白質折疊”“PoS?權益證明”“AI?數據生成”;2021年“GPT-3”“數據信托”“數字接觸追蹤”“TikTok?推薦算法”“多技能?AI”等。從這些入選的突破性技術可以看出,人工智能在應用側和基礎設施層面扮演著重要的角色。在應用側,人工智能在許多領域(如生物學、圖形學等)發揮著重要作用,其中?AI?助理也正在被廣泛應用。在基礎設施層面,支持?AI?應用的基礎設施面臨著許多挑戰。例如,如何更好地生成、管理和保護數據,以及如何提供足夠的算力等。總體來看,人工智能新興的問題主要集中在應用側和基礎設施側,這也是當前的重點研究方向。
當前,信息技術領域中蘊藏著巨大的發展機遇。隨著新的數據挖掘和應用算法的推進,數據驅動的工具對許多基礎科學研究具有重大意義。例如,人工智能的快速發展及應用對自然科學(如生命科學、材料科學等)有著巨大的推動作用。但同時,信息技術領域的發展也面臨著巨大挑戰,摩爾定律逐漸失效。一方面,信息技術的發展需要更多的算力;另一方面,一些新的計算方法,如量子計算、光計算等,對計算機本質的認識重新提出了挑戰。例如,在重新設計量子計算機系統時,人們會發現當前并未完全理解計算機本質。這是在信息技術領域特別是計算機領域中的挑戰,同時也是一個很大的理論機遇。
從整個信息技術領域發展的角度來看,人工智能的迭代性類似于摩爾定律——隨著數據量、訓練量和模型大小的增加,其能力不斷提升,而且增長仍然沒有停止。這種快速迭代不僅對人工智能本身的能力提升有幫助,同時也對傳統產業和學科發展有巨大的助力,因為有了更多的數據,科研過程可以加速進行。因此,人工智能的發展對整個社會都有積極的影響。
信息技術領域學術界與產業界結合度仍需加強
信息技術學界與產業之間存在密切的聯系,但現在學術界關注的問題與產業界實際關注的問題存在一定的差距仍是不爭的事實。當前,急需從產業應用中提煉出關鍵問題,并將這些問題反饋給學術界進行研究。
以理論計算機學科為例,理論計算機學科主要研究計算的可行性,在很大程度上是計算機科學和信息科學的基礎;理論計算機可以看作是計算機和信息處理世界中的基本規律,類似于物理學中的客觀規律。在計算機被創造之前,理論計算機就作為數學的分支存在,關注計算的基本理論、算法和復雜性,計算機發明制造、算法應用等許多劃時代革新都建立在它的基礎上。因此,理論計算機學科在計算機科學領域中扮演著重要的角色,處在計算機科學與其他學科交叉的前沿。理論計算機科學是方法論學科,它的價值蘊藏在計算思維中,具有很強的普適性,能夠在計算機、經濟學、自然科學、工程等多個領域交叉,能夠在許多原來缺乏語言描述或難以求解的復雜問題和情景中,提出新問題、新視角和解決思路,這不僅僅對于計算本身有意義,對于物理世界和人類社會也有重要意義。
理論計算機和應用之間的匹配是一個非常重要的前沿方向。在過去,理論計算機是先有理論,再有計算機;計算機的行為是由人來設定的,人類完全能夠理解。但是隨著計算機的復雜度越來越高,包括?ChatGPT?模型等的復雜度已經越來越接近自然科學,這時需要做一些實驗來探索驗證其理論,從而與原始的理論產生了不一致。因此,如何將理論與應用更加匹配是一個非常重要的前沿方向。當理論與應用不匹配時,需要發展新的理論或將理論應用的抽象性更好地呈現。例如,在深度學習方面,應用非常前沿,但理論認知還不夠。因此,需要探索如何使理論和應用結合更加緊密。該方向既與基礎研究密切相關,也涉及應用研究,同時也受到好奇心的驅動。2020?年華為成立了理論計算機實驗室,研究方向涉及工業應用中算法復雜性相關的問題。理論計算機學科在工業應用中大有用武之地,尤其是在華為的信息與通信技術(ICT)、光、速通、芯片、系統、應用和云服務等方面都有大量的應用。
當前中國企業在高新技術方面有很大的探索空間,但因同時面臨較大風險而止步不前。雖然企業是技術轉移轉化為產品的主體,但在探索新技術方面涉及較多基礎研究投入,企業面臨著較大的風險,而很多企業不愿意承擔這種風險。這也導致了當前我國在復雜芯片設計和電子設計自動化(EDA)工具方面存在一定的短板。
以處理器芯片為例,處理器芯片需要軟件和硬件的配合,是一類相對設計比較復雜的芯片。近幾年,“開源芯片”(將開源軟件的模式應用到處理器芯片設計中)的設計方式代表了處理器芯片領域的新方向。例如,RISC-V?新型處理器的架構,受到全球關注。可以像通信領域的?5G?標準那樣,聯合全球力量共同構建芯片生態,共同制定標準,各國可以在產品層面進行競爭。未來芯片的設計希望通過更加開放的方式,充分發揮出市場規模大、技術人才多的中國優勢。近年來,中國科學院計算技術研究所發起的“香山”開源芯片項目,吸引了國內外企業參與聯合開發。
人才培養是信息技術領域發展的重要動力儲備
我國科技事業發展進入新階段,創新成為引領發展的第一動力。在本土培養出規模宏大、具有突出創新能力的青年科技人才,是我國科技事業實現可持續發展的動力源泉。
如今,我國科研院所和高校在基礎理論與核心技術方面投入了大量資源來培養人才、全力攻堅。例如:2019?年?8?月,中國科學院大學啟動了“一生一芯”計劃,通過讓本科生全程參與處理器芯片從設計到生產、運行的全過程,培養具有扎實理論與實踐經驗的處理器芯片設計人才,提高我國處理器芯片設計人才培養規模,縮短人才從培養階段到投入科研與產業一線的周期,培養更多國家緊缺的芯片人才。該計劃已經開展了?5?期,有超過?2000?名學生參與,初步形成了大規模的高質量芯片設計人才培養方案。香港科技大學(廣州)微電子學域組建團隊,建立了一系列中央研究設施,包括材料、器件微納加工實驗室和?EDA?研究中心,旨在為微電子領域培養人才并推動產出更多的原創技術。近期,該團隊在光電融合芯片、驗證和多處理器高速仿真等領域取得了一些進展和原創性發現。
在信息技術領域的快速發展中,科學界的合作方式可能會出現一些變化。以前的學校和研究所的組織結構可能需要進行調整,以適應人工智能所帶來的一系列變化。這些變化也會影響到學生的課程設置和教育方式。人工智能所帶來的沖擊讓現有的教育體系顯得跟不上技術進步的潮流。因此,需要不斷地調整教育方式和組織結構,以適應新的科技發展趨勢。
信息技術將推動自然科學研究加速發展
人工智能成為推動基礎科學研究加速的重要動力
事實上,信息技術已經逐漸滲透到自然科學研究中。例如,數據庫和人工智能等方法已經成為日常科研研究中必不可少的工具。
在數據科學領域,圖靈獎獲得者吉姆?·?格雷(Jim Gray)提出了第四范式——在實驗觀測、理論推演、計算仿真之后的數據驅動的科學研究范式。近幾年第五范式被提出,這類新的科學研究范式是以智能為研究目標的浸入式具身研究,基于數據科學本體論認識。可以猜測“第五范式”和第四范式一樣,都會以數據為對象;不同的是,“第五范式”更側重于人、機器及數據之間交互,強調人的決策機制與數據分析的融合,體現了數據和智能的有機結合。
人工智能與科學研究結合可以幫助科研人員提高科學研究的效率和準確度。例如,在數學、統計學、物理學和計算機科學等領域有交叉背景的研究人員,就可以將人工智能與高性能計算結合起來,為分子動力學模擬和第一性原理模擬提供強大的工具。通過超級計算機的加速,研究人員在模擬原子方面取得了很大的突破,模擬規模從之前的百萬級別提升到億級,模擬時間已經提升到了納秒級別,這對物理學和材料學研究都有很大的幫助。隨著科學和人工智能的不斷結合,未來將會有更多的突破。
未來,數據將成為科學研究的基礎資源,數據庫將成為重要的科學基礎設施,像大科學裝置一樣滋養各學科成長。松山湖材料實驗室聯合中國科學院物理研究所近期發布的材料科學數據庫(https://Atomly.net),利用高通量計算和信息化技術將高質量科學數據帶給我國科研工作者。在信息技術助力下,物質科學發展進入了“大數據+人工智能”時代,打破了國外在此領域中的壟斷地位,為廣泛支撐我國物質學科的發展打造了優質基礎數據及工具,并已經開始發揮效力,切實地推進了領域發展。
人工智能對整個科學領域帶來了巨大的沖擊,包括在教育領域也產生了影響。在學習和研究中,新技術的應用會帶來新的挑戰和機遇。例如,在使用?GPT?等技術時,需要權衡其優缺點,確保其合法和合理使用。從信息本身的角度來看,信息處理是現代社會的基礎,包括在信息的收集、整理、加工、存儲、加密等各個環節。人工智能對于信息的整理和收集有著巨大的幫助,但是在深度挖掘信息方面,由于人工智能本身是基于統計方式,其對于事物本身的發現仍然存在挑戰,需要進行更多的研究和突破。因此,在應用人工智能時,需要充分考慮其局限性,同時也需要積極探索新的技術和方法,不斷推動人工智能的發展。
在人工智能和理論計算機的發展過程中,需要關注它們對科學研究的正面和負面影響。正面影響:一方面,人工智能會降低基礎科學研究的門檻,讓更多的人可以參與到這個過程中;另一方面,從國家尺度到全球尺度來看,人工智能也會使大規模協作更加容易,科學家之間的合作將更加便捷。負面影響:例如,誤用數據工具會導致大量的文章出現,而且現在已經有機器生成數據和文章、再用機器處理這些文章的情況,這可能導致信息流失和物化等問題。因此,在使用人工智能和理論計算機進行科學研究時,我們需要審慎地權衡利弊,保持對數據和研究結果的質量和準確性的關注。
人工智能促進學科交叉和交叉學科的發展
信息技術作為自然科學研究的工具,已經被廣泛應用并取得了顯著成果。除此之外,計算機科學的發展也對自然科學研究產生了深遠的影響。例如,理論計算機中的?NP?完全問題,起初只是為了計算復雜度而提出,但現在已經被廣泛應用于物理學、化學和生物學等領域。這些學科使用?NP?完全問題闡述它們的規律和復雜性,并將其作為一種描述復雜性的工具。如果某個物質是?NP?完全的,說明它的規律比較混亂;反之,如果它不是?NP?完全的,就可能存在一些內部規律。這種跨學科的應用,充分體現了計算機科學在自然科學研究中的重要作用。從不同的角度看待計算機領域,如與物理學、經濟學等學科的結合,可以發現計算機科學的深刻性、普適性等方面的優勢。計算機領域之所以如此獨特,是因為它擁有著豐富的色彩和多樣性。
信息技術和計算的發展為自然科學研究帶來了新的本質概念和度量方法,這對科學的發展非常有益。例如,研究證明了一個統計物理系統中配分函數計算的復雜度與物理系統的相變線完全重合,這表明計算復雜度的概念與物理系統的相變有著內在聯系。類似這種交叉學科的發展不僅是將信息技術作為工具使用,而且還為科學研究提供了新的本質概念和方法。因此,需要探索更多的交叉學科研究,將不同領域的知識和方法相互融合,推動科學研究的發展。又如,通信技術的發展,早期是基于香農的信息論和麥克斯韋的電磁場理論,但當將這兩個理論結合起來,用電磁場作為信息的載體,就可以打破信息與物理之間的邊界,提高通信效率。這種連接是非常重要的,可以給信息和通信領域帶來更多的創新和突破。
第五范式是當前科學研究特別是“AI for Science”(人工智能和科學的結合)中的一個重要模式。現在,人們更多地認為人工智能可以幫助我們發現科學規律,并提出假設。特別是現在的大型語言模型,它可以閱讀各種文獻,包括計算機科學、信息科學,以及一些傳統學科(如物理學和化學等)領域,這些概念在其語義空間中是相通的。因此,人工智能就像一個通才,能夠促進不同學科之間的交流和互動,從而發現它們之間的共同點,并提出相關的例子。這種交叉學科的交流可以帶來新的科學發現,也可以讓我們更好地了解人工智能與科學之間的關系。
作為科研人員的工具,人工智能輸出結果也需謹慎對待
人工智能在科學研究中的作用非常明顯,它可以幫助科學家更好地探索和研究。以?ChatGPT?為例,它可以為研究人員提供更好的思路和方向,甚至比科學家本身的想法更完善。此外,ChatGPT?的輸出還具有一定的隨機性,可以作為頭腦風暴的工具,提供新的思路和想法。然而,使用者也需要認識到人工智能模型背后的超參數,以及它們產生的輸出可能存在的偏差和誤差。因此,在使用人工智能模型進行科學研究時,需要謹慎對待其輸出結果,同時保持對科學研究質量和準確性的關注。
信息技術引領工業界向數字化和智能化變革
人工智能為工業界和下游應用帶來利好
人工智能、數據驅動和算力已經在科學界引起了巨大的變革,這種變革在工業界中也已經悄悄地發生了。隨著信息技術的不斷發展,工業界也在逐漸轉向數字化和智能化。在這種環境下,產學研關系的發展和工業界發生的變化值得重點關注。
人工智能的發展為工業界和下游應用帶來了明顯利好。隨著?AI?模型的通用性和能力的不斷提高,下游應用的開發成本得到了大幅降低。以往將?AI?應用于傳統行業需要專業人員進行數據收集、標記和調試,成本較高。現在,AI?模型的通用性和智能性得到了提高,每個人都可以利用自己的數據進行訓練;AI?模型的理解能力也大幅提高,能夠按照用戶的意愿進行交流和修正。這種?AI?模型的廣泛應用,使得下游應用的開發成本大幅降低,用戶只需要通過簡單的接口和提示就可以調試修改并達到想要的效果,這極大降低了成本和消耗的算力。因此,AI?模型在工業界和下游應用中的前景非常廣闊。
人工智能在自然科學領域的發展前景非常廣闊,將會取得更多的突破和進展。在未來?3—5?年,人工智能有望在生物學、物理學、氣象預報和?EDA?集成電路設計工具等領域取得重大突破。目前,在這些領域已經有了一些初步的結果。例如,在生物學領域,機器學習已經被用于加速仿真;在物理學和量子物理學領域,也有許多應用場景;而在?EDA?集成電路設計工具領域,機器學習已經展示了其帶來的巨大效果和效率。但目前這些應用場景仍需要進一步工業化,然后才能傳導到產品上。
信息技術領域發展趨勢
開源模式在信息領域中已經產生了巨大的影響,未來?3—5?年影響將會更加深遠。開源軟件已經對信息領域產生了巨大的影響,現在這種模式正在向硬件領域滲透。例如,在芯片領域,開源芯片的趨勢將會逐漸增強。另外,盡管目前開源預訓練模型還只是小模型,但是隨著越來越多的人加入進來,它有可能從小模型逐漸成長為大模型。開源模式將會帶來一系列深遠的影響,包括數據的開源方式、數據共享和交換方式等方面。這種模式的影響不僅僅是單個技術層面的,更是整個技術研發模式和生產關系的改變。因此,不僅要重視開源模式的影響,更要不斷適應這種變化,以便更好地推進信息技術的發展。
信息技術是一個能不斷保持指數型增長的領域,這種指數型增長趨勢并非每個研究領域都存在。以飛機發動機推力的發展為例,從?1911?年萊特兄弟發明第一架飛機到?20?世紀?50?年代,在這期間飛機發動機推力的發展出現了指數型增長;這種增長曾經讓人們對能否登月充滿了期待,但后來這種發展趨勢基本停滯了。相比之下,從?20?世紀?60?年代起,信息技術領域中的摩爾定律已經發展了近?60?年,雖然摩爾定律的發展從現實中看即將面臨停滯,但是數據領域又呈現出一個指數型增長,這給信息技術領域帶來了新的活力。這種增長趨勢不僅在硬件方面有所體現,在數據量和其他維度上也呈現出指數型增長。這是信息技術領域的顯著特點,我們需要把握住這種機遇,不斷發揮其優勢,推動信息技術與其他領域的結合。
人類社會已進入信息時代,但是人們對于信息科技的理解、掌握和應用還遠遠不夠。近年來,我們已經看到了許多令人驚嘆的應用場景(如?ChatGPT?等),但這些只是冰山一角,未來還會有更多的新技術和新突破涌現。從信息技術領域來看,當前是學術研究的黃金時代,雖然美西方國家試圖與中國“脫鉤”,這就逼迫我們做自己的原創技術,尋找其他的出路,這給我們提出了新的挑戰,但更是一個難得的機遇。在一個新的領域里,永遠不缺乏新的出路。因此,要牢牢抓住這個機遇,積極探索開展研究,努力推動信息技術的發展。
信息科學和信息技術是一種共性技術,對于不同的科學研究和工業應用來說,它們都是底層的關鍵技術。因此,信息技術的重要性不言而喻,它對于科學研究和產業應用都具有助力作用。信息技術已經廣泛應用于各個領域,如醫療、金融、交通等,為人們的生活和工作帶來了便利。同時,信息技術的發展也推動了各個行業的創新和轉型升級。在未來,隨著信息技術的不斷發展,它將繼續發揮更加重要的作用,為人類的進步和發展作出更大的貢獻。
(作者:包云崗,中國科學院計算技術研究所;劉淼,中國科學院物理研究所、松山湖材料實驗室;陸品燕,上海財經大學 信息管理與工程學院;邱錫鵬,復旦大學 計算機科學技術學院;須江,香港科技大學(廣州) 微電子學域;編審:楊柳春,《中國科學院院刊》供稿)