帮天文学家“大海捞针” 人工智能有了新办法
研究人员利用人工智能的深度学习方法,发现了38个新的强引力透镜候选体,为研究天体物理学问题提供了新的“宇宙探针”候选体。
近年来,随着技术日益进步,天文学研究中产生了海量数据。天文学家要想从郭守敬望远镜、“中国天眼”FAST、LSST大型综合巡天望远镜等遍布世界的大型望远镜捕获的海量数据中找出有价值的信息以资研究,无异于大海捞针。
如何高效地处理这些数据,已成为现代天文学面临的一项重要挑战。由于人工智能在海量数据分析和处理方面所具有的突出优势,它也很自然地走入了天文学家的视野。
日前,中国科学院云南天文台丽江天文观测站龙潜研究员与云南大学中国西南天文研究所宇宙学研究组尔欣中教授团队合作,利用人工智能深度学习的方法,发现了38个新的强引力透镜候选体,为研究天体物理学问题提供了新的可靠的“宇宙探针”候选体。英国《皇家天文学会月刊》发表了这项研究成果。
天文观测产生海量数据 用机器学习给天体分类已十分普遍
随着下一代大规模测光巡天项目的开展,人们期待发现数以万计的强引力透镜系统。但如何在海量天体图像中快速地找到强引力透镜候选体?近年来,人工智能的快速发展,给人类提供了一种新的可能。
以2009年发射升空的世界首个用于探测太阳系外类地行星的飞行器开普勒太空望远镜为例,仅在起初3年半的任务期内,就监控了超过15万个恒星系统,同时也产生了海量数据。这些数据通常要经由计算机处理,但当计算机识别出一定的信号时,又必须依靠人类分析,判断其是否是行星轨道所产生的,这项巨大的筛查工作单靠美国国家航空航天局(NASA)的科学家或科学小组,是无法有效完成的。
“如此大的数据量,人工分析在很多时候已经达不到所需要的速度。借助人工智能的优势,我们可以极大地提升对数据的分析速率。”龙潜向科技日报记者介绍,人工智能展现出来的效率和准确性远高于传统方法。
龙潜研究员长期从事人工智能深度学习方面的研究。近期,他与尔欣中教授团队合作,构建并训练了一个卷积神经网络,用来寻找强引力透镜系统。他们把这个网络应用到欧洲南方天文台2.6米巡天望远镜(VST)千平方度巡天数据,并找到了38个新的强引力透镜候选体。此次构建的神经网络,也可应用于其他大型望远镜的巡天数据。
“在这项工作中,我们用计算机分别模拟了强引力透镜图像和非强引力透镜图像,从而来训练计算机。我们发现,在准备训练计算机的图像时,非强引力透镜图像比强引力透镜更加重要。”尔欣中说,开始的分析中,他们使用简单的规则星系图像作为非强引力透镜训练样本,发现结果正确率非常低。只有把各种可能的非引力透镜图像都考虑进来之后,才能得到比较好的结果。
“这就像在教电脑认识什么是狗的时候,还要告诉它猫、羊、牛等都不是狗。而如果你只告诉它猫不是狗,电脑有非常大的概率把羊、牛认成狗。”龙潜说,目前利用机器学习来对天文学中各种天体分类已经非常普遍,最简单的是把恒星和星系分开,或者把不同行态的星系进行分类,以及利用星系的多重颜色来估计星系的距离等。
每秒可识别上万张照片 新型神经网络便于实时修改、训练和测试
人眼看强引力透镜系统的图像,最快就是每秒钟看一张图。而计算机每秒钟可以识别成千上万张图片。
龙潜研究员和尔欣中教授团队此番训练的这个卷积神经网络,可以充分利用GPU进行并行加速,通过装备更多或更强的GPU,系统可以根据实际需要极大提升搜索速度和效率。
“这个神经网络的训练,主要使用模拟数据,只使用了很少的人工标注数据,由于模拟数据可以任意生成,因此多样性远大于人工标注数据,进一步根据数据的特点调节训练参数和训练算法,使神经网络的泛化能力得到了极大的提高。”龙潜说,此外,研究人员使用新型科学计算语言Julia完全自定义网络结构,由于Julia语言兼具速度和灵活性,使得神经网络在CPU和GPU上都有良好的性能,并且可以任意切换,因此非常有利于研究人员实时修改、训练和测试。
“我们还通过对引力透镜数据的研究,定制了有针对性的小型网络,有效地抑制了过拟合现象,同时实验证明该网络具有与大型网络相似的准确率。相比大型网络,小型网络在普通计算机终端就可以训练和测试,不需要依赖大型GPU集群,这为天文工作者使用和改进网络提供了便利。”龙潜说。
目前,随着技术与装备水平快速发展,人工智能在天文学上的应用还会越来越多。“我们计划对一些变源的多波段光变曲线来进行机器的快速分类,这样在实施大样本巡天的时候,电脑可以自动对所发现的变源进行筛选,并对我们感兴趣的天体做出提示,以便进一步开展后续研究工作。”尔欣中说,正因为人工智能的帮助,天文研究者得以从耗时单调的数据筛查分析中解脱出来,当人力“大海捞针”难以招架之日,正是人工智能大显身手之时。
本报记者 赵汉斌 通讯员 陈 艳
电脑开机黑屏只有鼠标怎么办 电脑开机黑屏只有鼠标解决办法? 电脑开机后会显示桌面,不显示桌面的原因有设置原因、系统本身原因和病毒破坏原因。方法一:设置原因的解决办法1、开机后如果不显示桌面的
笔记本键盘打不出字 手提电脑键盘打不出字的原因是什么? 手提电脑因为其体积小、携带方便,所以受到广大消费者的喜爱,在日常办公中很多人都喜欢将手提电脑带在身边。但是对于一些刚刚接触手提电脑
mdf是什么文件有什么用?mdf文件怎么打开? mdf是什么文件MDF(Mirror Disc File)文件是光盘镜像文件的一种,我们可能经常接触诸如系统文件的ghost镜像文件或者iso镜像文件等。同样的
电脑常见故障的维修技巧 维修大全及解决方法 电脑出现的故障原因扑朔迷离,让人难以捉摸。并且由于Windows操作系统的组件相对复杂,电脑一旦出现故障,对于普通用户来说,想要准确地找
io设备错误怎么解决 解决方法有哪些? io设备通俗来说,就是计算机的输入输出设备,键盘就是计算机的输入设备,而打印机等东西就是计算机的输出设备。Io设备作为计算机的重要组成
农发行究竟是什么性质的银行?农发行现任行长是谁? 公开简介显示,农发行全称是中国农业发展银行,成立于1994年,现任行长是湛东升。不少人很是好奇,农发行究竟是什么性质的银行?如果你对此
华兴转债发行公司是哪家 该公司主营业务是做什么的? 据最新消息,华兴转债将于2021年12月20日起在上海证券交易所挂牌交易。不少人好奇,华兴转债发行公司是哪家?该公司主营业务是做什么的?如果
股票分红需要持股多久 购买股票要看哪几个面? 随着社会的不断进步,现在越来越多老百姓投资股市了,股票分红是上市公司将利润拿出来送给投资者的一种方式,大多数人对于股票分红理解的不
花呗影响个人负债率吗 影响借款人个人负债率的因素还有哪些? 如今互联网发展越来越快速,市面上的小额贷款也越来越多。支付宝平台有不少小贷产品,大家所熟知的蚂蚁花呗。日前,有一个朋友询问,花呗影
彝人老家:深度根植贫困县,辐射带动你我他 凉山州位于四川西南边陲,广袤无垠,层峦叠嶂,北起大渡河,南临金沙江山山水水在亘古岁月中见证着沧海桑田。山高谷深、林峰苍茫,是典型的深度
前三季度完成交通固定资产投资25632亿元 同比增长2% 记者今天从交通运输部获悉,前三季...
1-9月份第一产业投资10395亿元 同比增长14.0% 据国家统计局官网消息,1-9月份,...
1-8月河南省货物贸易保持高速增长 商务运行稳中有进 据河南省商务厅官网消息,2021年1-...
医药板块投资性价比显现 基金公司密集调研医药上市公司 12月14日,资本邦了解到,随着年内...
拓荆科技针对科创板第二轮问询相关问题进行问询回复 盈利能力不足、产品类型单一且周转...
立讯精密涨6.32%目前报价36.99元 这家企业主要是干什么的? 据最新消息显示,立讯精密涨6 32%...
国漫多利好迈入黄金期 头部动漫公司扎堆IPO 今年以来,动漫市场绽放异彩。暑期...
4月1日起 北京市燃油车不得占用充电专用泊位 充电站必须配专人巡检 今日,记者从北京市市场监管局网站...