科技的突破不斷改變我們的生活面向,人工智慧的潮流已逐漸為各領域技術開發創造許多新的可能性。Google持續探索機器學習如何運用至發掘天文探索的相關研究,並且有新進展。
|
Google Brain研究團隊資深軟體工程師 Chris Shallue分享機器學習在天文領域的探索應用。 |
天文領域神秘浩瀚,天文學家利用克卜勒太空望遠鏡(Kepler space telescope)來進行研究,4 年期間蒐集超過 20 萬顆恆星的亮度,而平均 30 分鐘記錄一次每顆恆星的亮度,每顆恆星至今已記錄大約 7 萬次亮度,透過克卜勒太空望遠鏡所偵測到恆星各個訊號點形成的亮度曲線(light curve)來判斷,然而有許多現象會造成偵測的恆星亮度變弱,舉例來說,恆星上的斑點(稱為黑斑或星斑)或是人造的太空載具運行(太空船)時會轉動讓太陽能板保持面向太陽。
克卜勒任務(Kepler mission)為 2009 年 5 月開始的計畫,天文學家以人工的方式進行檢查,超過 3 萬個透過克卜勒太空望遠鏡所偵測到的訊號,而且約有 2500 個訊號被認定為行星,但由於耗時且許多較弱的訊號同時也有較多雜訊,太多雜訊會導致無法人工檢查判別是否為行星或是造成誤判。
Google Brain研究團隊資深軟體工程師Chris Shallue表示,天文學家傳統在尋找行星的作法分為兩階段:1.透過電腦演算法找出潛在行星訊號;2.由天文學家判斷哪些訊號是來自真實的行星。然而在許多情況下,當人類無法人工檢查或處理龐大資料時,運用機器學習技術能夠提供更好的解決方案協助。
神經網路為機器學習的一種運算模型,能夠有效的辨識圖像,因此Google將此運算模型套用至探索行星當中,建立一個神經網路來分類克卜勒的訊號。卷積神經網路(convolutional neural network)為一種特定的神經網路,通常 用於圖像分類,例如 Google 相簿。Chris Shallue表示,目前Google利用 15,000 個天文學家已人工標記的克卜勒訊號來訓練模型,亦即透過訓練卷積神經網路來預測偵測到的訊號為行星的機率有多少。
在訓練模型後,透過模型搜尋克卜勒資料庫中的 670 個恆星並藉此辨別新行星,發現了克卜勒-90 i 和克卜勒-80 g兩大行星。其中,克卜勒-90 i 是在克卜勒 90 星系中第八個被發現的行星,而克卜勒 90 星系更是目前已知第一個與我們所處的太陽系同樣擁有 8 顆行星數的星系,至於克卜勒-90 i 是克卜勒 90 星系中最小的一顆星球,而克卜勒-90 i是距離其恆星第三靠近的行星。
目前尚未能夠解決的問題之一是假陽性預測(background false positives)。舉例來說,有可能偵測到一顆恆星的亮度其實是來自附近恆星的亮度(受到光影的影響),以現階段來說,模型還無法辨別行星的訊號是來自哪一顆恆星。現今仍仰賴以人工方式來確認模型偵測到的行星位置訊號,未來希望可以將位置資訊結合製模型當中,讓模型可以辨別這類的訊號。
下一個目標是運用模型運算整個克卜勒資料庫中超過 20 萬顆的恆星,而現在已在 20 萬顆恆星中探索 670 個,此外更發現了兩顆新行星。Chris Shallue表示,人類和模型判讀資料的方式不同,天文科學家看訊號的強弱來判定結果,但若是不易分辨就需要好幾個小時,而藉由機器學習判斷則不須1秒鐘,雖然現今是建立機器學習模型辨識篩選數據,找到架構和最適合的模型讓天文科學家判斷結果。
Google臺灣董事總經理簡立峰表示,AI對於人類的影響可見,跨領域研究值得發展與重視,資料與工具的方便,對於跨領域研究會有更大的貢獻,他強調開放原始碼的重要性,他表示Google研究機器學習工具與實驗數據並且開放原始碼,在於開放環境回饋給社群持續研究,未來當使用工具更加簡便,讓科學家得以自行操作,而無須軟體工程師從旁協助後再驗證,相信研究成果會更有所突破。