日本福利一区_最近中文高清在线观看_免费黄色电影在线观看_亚洲天堂成人在线 - 91人人

資訊 > 正文

開放科學平臺:大國科技競爭的關鍵變量

發布時間:2022-04-20 www.xstr.xyz


  當代科技發展對數據和算力提出了極高要求。在傳統基礎技術研究領域,科研院所、高校的科研團隊普遍缺乏這方面的能力支撐。為了應對這一變化,近十年來,“開放科學平臺”在歐美逐漸盛行,為科研社區提供包含開放數據及相關分析工具、開放算力平臺、開放源代碼的各種支持。在科學技術的大國競爭時代,“開放科學平臺”逐漸成為推動科技發展的關鍵變量。中國在這個領域需要加大投入,從而實現科學范式轉變階段基礎科學平臺建設的跟跑、并跑直到領跑。

  1  科學進步背后的規律:從“Paradigm Shift”到“第四范式”
  科學進步的軌跡是什么樣的?
  早期,人們普遍認為,科學發展是循序漸進的,科學家不斷涌現,將已有科學理論向前推進從而推動科學發現越來越接近真理。
  1962年,美國學者托馬斯·庫恩在《科學革命的結構》一書中提出,以物理學歷史發展為例,科學發展存在有規律的不連續性。書中說,科學由一系列交替的“正??茖W階段”和“科學革命”階段組成。在科學革命階段,伴隨著概念層的突破,已有的理論框架被新科學范式全面顛覆并重構,例如從牛頓力學到量子力學的轉變。
  庫恩創造了“范式轉變(Paradigm Shift)”這一科學哲學新概念。在庫恩定義的范式轉變理論中,科學發現遵循的是另一條五個階段的循環路徑:
  1.     “前范式階段”:幾個不相容和不完整的理論,并逐漸收斂到一種被科學界普遍接受主導范式
  2.     “正常科學階段”:在主導范式的背景下不斷解決科學難題,推進科學進步
  3.     “危機階段”:主導范式能未解決的異常現象,會在較長時期內不斷累積,最終導致主導范式的信任危機
  4.     “范式轉變階段”:主導范式出現重大失敗后,科研基本假設被重新審視,進入新范式建立階段
  5.     “新范式階段”:科學革命后,新范式主導地位確立
  庫恩開創了一門名為科學史或科學社會學的新學科。社會學家和歷史學家開始把科學看成一種普通的亞文化。范式轉變推動科學發展已成廣泛共識。
  庫恩之后,計算機領域的學界泰斗、數據庫領域的傳奇科學家吉姆·格雷把科學技術發展史總結為四個范式階段:

  1. 第一范式:經驗(empirical)證據。數千年文明史中,人類絕大多數技術發展源于對自然現象觀察和實驗總結。相比于宗教或神學中不允許被質疑的教條來說,基于觀察和實驗的經驗范式是科學技術發展中人類邁出的一大步。
  2. 第二范式:理論(theoretical)科學。相比于依賴觀察和實驗的第一范式可以做到“知其然”,第二范式的科學理論需要做到“知其所以然”,對自然界某些規律做出背后原理性的解釋。因此,理論必須滿足進一步的要求,如可證偽的預測能力、多個獨立來源的一致性等。
  3. 第三范式:計算(computational)科學。隨著計算機的運算能力越來越強大,它逐漸被用于科學研究領域。同前兩個范式不同,計算科學中誕生了一種嶄新的技術工具:計算模型與系統模擬。這一工具利用計算機的計算能力、基于大規模并行的計算機體系結構、通過設計算法并編制程序來模擬復雜過程,在大氣環流、核反應過程、病毒感染過程。在經濟學、心理學、認知科學等缺乏簡單、直觀分析解決方案的領域獲得廣泛采用。
  4. 第四范式:數據科學(Data exploration)。從基因測序儀、深空望遠鏡到覆蓋全球的社交媒體,人類社會已經被深度數字化。每天在我們生活的數字地球里每天都會產生海量的數據。據估計到 2025 年,全球每天將新產生463 EB 的數據,相當于212,765,957 張 DVD,這些DVD疊在一起有30個珠穆朗瑪峰那么高。在這樣一個數據爆炸的時代,基于數據的技術革命也正在發生,數據科學成為技術發展的最前沿。以數據為中心的計算平臺、數據加工、處理與分享工具、算法與模型庫等一系列科學研究方式構成了技術發展的第四范式。
  2 “開放科學平臺”:更好應對第四范式的挑戰
  在第四范式主導的科技時代,研究團隊除了研讀技術最前沿研究論文,同時也需要這些論文涉及的實驗數據集,以便復現實驗結果。巨量數據和龐大計算需求給創新帶來了新的挑戰。傳統科學交流僅限于論文和有限的公開數據集,為了促進新范式時代技術發展的持續性,加速科研團隊的合作共享,歐美開始興起了“開放科學”運動:
  arXiv:美國物理學博士保羅·金斯帕格1991在美國洛斯阿拉莫斯國家實驗室創建了分享arXiv存儲庫,幫助全球科研團隊分享研究論文預印本的全文數字版本。2008年,arXiv突破了50萬篇文章的里程碑;2014年底達到100萬篇;今天, arXiv每月從全球科研社區獲得超過15000篇投稿。一些出版商還免費授予arXiv作者存檔同行評審后印本的權限。arXiv也鼓勵了更多科研機構,如美國國家醫學圖書館仿照arXiv建立了醫學領域的PubMed中央存儲庫。

  Papers with Code:相比arXiv,Papers with Code在開放獲取領域則更進一步。這個平臺不僅分享論文,還鼓勵科研團隊分享論文工作所對應的代碼和數據集。平臺同時提供了相關評測環境,可以對提交的算法代碼在公共數據集合上做技術排名。Papers with Code不僅創建一個包含論文、代碼和數據集的開放集合,同時也提供了技術評估方法的免費開放平臺,顯著促進了相關領域科研團隊技術分享與協作,加速科技創新進程。
  NASA開源科學計劃:為了降低太空科學探索門檻,讓更多的科研團隊可以參加美國國家航空航天局的科學研究,NASA 提出了開源科學計劃 (OSSI)。OSSI的目標是在十年內建立一個開放科學社區,參與的科研團隊承諾在研發過程中開放和共享相關軟件、數據以及知識(包含算法、論文、文檔以及相關輔助信息),并充分利用協作工具和云計算在內的技術工具提高NASA科學進步的速度和質量。

  3 大國科技博弈:開放科學平臺的重要性
  在第四范式時代,爆炸式增長的數據在科技研發工作中扮演了極其重要的角色,它也給經歷這一次范式轉變中各個學科,尤其是非計算機領域的科研團隊帶來全新挑戰,涉及數據與模型的獲取與分享、計算模型與系統模擬的規模膨脹、大規模人工合成數據構造、多模態數據處理與分析的工具、數據抽取、轉換、加載、數據可視化與交互、人工智能工具集與算力平臺等領域。

  今天,新一輪大國競爭很大程度上體現為支撐科技發展的生態系統以及創新體系之間的競爭,開放科學平臺已成為促進科技研發重要的基礎能力之一。以第四范式驅動的新一代創新體系在歐美已經有先發優勢,從政府主導的科研項目到學術界的實踐已有十年經驗。我國需要在這個領域認識到不足,加速構建獨立自主的開放科學平臺,從而實現科學范式轉變階段科技發展的跟跑、并跑直到領跑。
  參考文獻:
  1.https://www.theguardian.com/books/2012/jul/03/structure-scientific-revolutions-kuhn-review
  2.https://www.britannica.com/biography/Thomas-S-Kuhn
  3.https://amturing.acm.org/award_winners/gray_3649936.cfm
  4.https://www.microsoft.com/en-us/research/publication/fourth-paradigm-data-intensive-scientific-discovery/
  5.https://en.wikipedia.org/wiki/Metaphysics_(Aristotle)
  6.https://www.weforum.org/agenda/2019/04/how-much-data-is-generated-each-day-cf4bddf29f/
  7.https://www.skatelescope.org/8https://arxiv.org/help/stats/2021_by_area

標簽:源代碼,開放科學平臺,人工智能

相關文章