科技的突破不断改变我们的生活面向,人工智慧的潮流已逐渐为各领域技术开发创造许多新的可能性。Google持续探索机器学习如何运用至发掘天文探索的相关研究,并且有新进展。
|
Google Brain研究团队资深软体工程师 Chris Shallue分享机器学习在天文领域的探索应用。 |
天文领域神秘浩瀚,天文学家利用克卜勒太空??远镜(Kepler space telescope)来进行研究,4 年期间搜集超过 20 万颗恒星的亮度,而平均 30 分钟记录一次每颗恒星的亮度,每颗恒星至今已记录大约 7 万次亮度,透过克卜勒太空??远镜所侦测到恒星各个讯号点形成的亮度曲线(light curve)来判断,然而有许多现象会造成侦测的恒星亮度变弱,举例来说,恒星上的斑点(称为黑斑或星斑)或是人造的太空载具运行(太空船)时会转动让太阳能板保持面向太阳。
克卜勒任务(Kepler mission)为 2009 年 5 月开始的计画,天文学家以人工的方式进行检查,超过 3 万个透过克卜勒太空??远镜所侦测到的讯号,而且约有 2500 个讯号被认定为行星,但由於耗时且许多较弱的讯号同时也有较多杂讯,太多杂讯会导致无法人工检查判别是否为行星或是造成误判。
Google Brain研究团队资深软体工程师Chris Shallue表示,天文学家传统在寻找行星的作法分为两阶段:1.透过电脑演算法找出潜在行星讯号;2.由天文学家判断哪些讯号是来自真实的行星。然而在许多情况下,当人类无法人工检查或处理庞大资料时,运用机器学习技术能够提供更好的解决方案协助。
神经网路为机器学习的一种运算模型,能够有效的辨识图像,因此Google将此运算模型套用至探索行星当中,建立一个神经网路来分类克卜勒的讯号。卷积神经网路(convolutional neural network)为一种特定的神经网路,通常 用於图像分类,例如 Google 相簿。Chris Shallue表示,目前Google利用 15,000 个天文学家已人工标记的克卜勒讯号来训练模型,亦即透过训练卷积神经网路来预测侦测到的讯号为行星的机率有多少。
在训练模型後,透过模型搜寻克卜勒资料库中的 670 个恒星并藉此辨别新行星,发现了克卜勒-90 i 和克卜勒-80 g两大行星。其中,克卜勒-90 i 是在克卜勒 90 星系中第八个被发现的行星,而克卜勒 90 星系更是目前已知第一个与我们所处的太阳系同样拥有 8 颗行星数的星系,至於克卜勒-90 i 是克卜勒 90 星系中最小的一颗星球,而克卜勒-90 i是距离其恒星第三靠近的行星。
目前尚未能够解决的问题之一是假阳性预测(background false positives)。举例来说,有可能侦测到一颗恒星的亮度其实是来自附近恒星的亮度(受到光影的影响),以现阶段来说,模型还无法辨别行星的讯号是来自哪一颗恒星。现今仍仰赖以人工方式来确认模型侦测到的行星位置讯号,未来希??可以将位置资讯结合制模型当中,让模型可以辨别这类的讯号。
下一个目标是运用模型运算整个克卜勒资料库中超过 20 万颗的恒星,而现在已在 20 万颗恒星中探索 670 个,此外更发现了两颗新行星。Chris Shallue表示,人类和模型判读资料的方式不同,天文科学家看讯号的强弱来判定结果,但若是不易分辨就需要好几个小时,而藉由机器学习判断则不须1秒钟,虽然现今是建立机器学习模型辨识筛选数据,找到架构和最适合的模型让天文科学家判断结果。
Google台湾董事总经理简立峰表示,AI对於人类的影响可见,跨领域研究值得发展与重视,资料与工具的方便,对於跨领域研究会有更大的贡献,他强调开放原始码的重要性,他表示Google研究机器学习工具与实验数据并且开放原始码,在於开放环境回??给社群持续研究,未来当使用工具更加简便,让科学家得以自行操作,而无须软体工程师从旁协助後再验证,相信研究成果会更加突破。