為什么天文學的最大問題是數據太多?

本年早些時辰, 天文學家偶爾有了一個不測的發現:我們的銀河系中間四周可能存在著數千個黑洞 。 導致這一發現的X射線圖像并不是來自于一些最進步前輩的新千里鏡, 甚至都不是比來的不雅測數據, 此中一些數據其實是20年前就已經收集到 。
【為什么天文學的最大問題是數據太多?】研究人員經由過程挖掘以前的、持久存檔的數據, 發現了黑洞 。 因為年夜數據時代改變了科學的成長體例, 像如許的發現只會變得越來越遍及 。 天文學家天天都在收集呈指數增加的海量數據, 以至于需要數年時候才能發現埋藏在存檔中的所有埋沒信息 。
天文學的成長
60年前, 典型的天文學家根基上是獨自工作, 或者是在一個小團隊中工作 。 他們可能在地點院校中能利用一個半斤八兩好的年夜型地面光學千里鏡, 這些不雅察年夜多局限于可見光的波長 。 這意味著他們錯過了來自豪量天體物理源的旌旗燈號, 這些物質可以發射出非可見的電磁波, 從低頻無線電波一向到高能伽馬射線 。
現在, 有一些天文臺籠蓋了整個電磁波譜 。 這些最進步前輩的天文臺不再由單個機構運作, 凡是由宇航局發射, 有很多國度配合介入的 。

為什么天文學的最大問題是數據太多?



哈勃太空千里鏡
這些天文臺發生了驚人數目的數據 。 例如, 哈勃太空千里鏡自1990年起頭運行, 已經完當作了130多萬次不雅測, 每周傳輸年夜約20 GB的原始數據 。 要知道, 這臺千里鏡是在20宿世紀70年月設計出來的, 現在還在正常工作 。 位于智利的阿塔卡瑪年夜型毫米陣列此刻估計天天會增添2 TB(2048 GB)的不雅測數據 。
海量數據
天文數據的存檔已經很是復雜了 。 每一代天文臺的活絡度凡是至少是以前的10倍, 要么是因為手藝前進, 要么是因為尺寸更年夜 。 例如, 同為運行10年的伽馬射線千里鏡——高能伽馬射線嘗試千里鏡和費米伽馬射線太空千里鏡, 前者在1991年投入利用, 在10年里發現了年夜約190個伽馬射線源;后者在2008年投入利用, 今朝已經不雅測到跨越5000個伽馬射線源 。
為什么天文學的最大問題是數據太多?



年夜口徑全景巡天千里鏡
今朝正在智利建造的年夜口徑全景巡天千里鏡是一種光學千里鏡, 每隔幾個晚上, 就能繪制整個天空的圖像 。 它的活絡度極高, 每晚將會發現1000萬個新的旌旗燈號源, 10年后會發生跨越15 PB(1 PB=1024 TB)的數據 。
此外, 平方公里陣列射電千里鏡在2020年落成后, 將當作為宿世界上最活絡的千里鏡, 它可以或許探測到50光年遠的外星文明的航空雷達站發出的旌旗燈號, 若是那邊存在外星文明的話 。 僅僅一年的不雅測, 該千里鏡將發生比整個互聯網更多的數據 。
為什么天文學的最大問題是數據太多?



這些大志勃勃的項目將考驗科學家處置數據的能力 。 圖像需要進行主動處置, 這意味著數據需要被簡化為可處置的大小, 或者轉換當作最終成果 。 新的天文臺正在沖破計較能力的極限, 要求設備天天可以或許處置數百TB字節 。
解鎖新科學
海量的新數據將使天文學當作為比以往任何時辰都加倍需要合作和開放的科學 。 多虧了互聯網檔案, 壯大的進修社區和新的拓展打算, 通俗人此刻可以介入天文學研究 。 例如, 經由過程計較機法式Einstein@Home, 任何人都可以操縱他們計較機的余暇時候來幫忙尋找來自黑洞碰撞的引力波 。

猜你喜歡