没有任何天文物理背景,计算机科学家曹军威却一心扑上去和引力波“纠缠”了十多年。这让他更确信,在未来的引力波探测中,运算速度将变得越来越重要,甚至直接事关成败。
去年10月,多国科学家宣布,人类首次直接探测到双中子星合并产生的引力波及其伴随的电磁信号,令全球天文界震动。
实时引力波数据监测示例。 新华社发图片由都志辉提供
其实,引力波发现的过程,就是一场与时间的赛跑。美国“激光干涉引力波天文台”(LIGO)发现引力波信号后的1.7秒,美国费米太空望远镜就观测到疑似对应的伽马射线暴。LIGO和费米立即向天文界发送警报,随后,全球约70个地面及空间望远镜从红外、紫外、X光等不同波段展开全面的后续观测。正是因为探测到了电磁信号,科学家才能在茫茫宇宙中进一步精确定位出引力波的源头。
这样的合作模式开启了“多信使天文学”的大幕,这意味着更多更神秘的宇宙谜团将一步步由此揭开。
天文学新时代的到来比曹军威预料的更早,这让他非常高兴。正如他所判断的,一个关键因素是运算要快,越快越好。
2004年,还在国外留学工作的曹军威凭借计算机方面的特长加入了麻省理工学院LIGO实验室,从此和引力波结下不解之缘。2009年,他带领清华大学信息技术研究院工作组(简称“清华工作组”)加入LIGO科学合作组织,参与数据处理工作。
“当时我们是LIGO科学合作组织里唯一的中国工作组,也是很独特的一个工作组,因为我们所有成员都没有天文物理背景,而是从事计算机和自动化研究的。”曹军威说。
前五年,清华工作组主要侧重于计算平台搭建和数据分析。但是,基于专业敏感和自身特长,他们随后把提高运算速度作为自己的目标。然而,“快到极致”究竟有什么意义,当时很多人对此并没有清晰明确的认识。
“我们一开始就提出,快速运算可以服务于多信使天文学,因为这需要在引力波信号发现后,立刻协调其他设备共同观测,当然是算得越快越准越好。”曹军威说,“只是没想到,这一切来得这么快。”
一方面,曹军威和他的清华同事有了大展才华的空间,另一方面,他们也将面临更多的挑战和压力。
LIGO于2017年8月25日结束第二次科学运行,并计划于今年七八月间开始第三次科学运行,这期间的主要工作是升级探测器,进一步提高灵敏度。“灵敏度提高了,探测到引力波的几率就会大大增加。原来可能一年发现几次信号,将来可能每月,甚至每天都能发现信号,现在的数据处理速度还远远跟不上这个节奏。”曹军威说。
清华大学LIGO科学合作组织工作组成员都志辉老师在进行学术交流。 新华社发图片由都志辉提供
据介绍,LIGO科学合作组织包括上千名科学家,其中大约400名负责建造和运行天文台,其余都是从事数据处理分析工作的。他们分成多个组来处理探测数据,比如引力波暴数据分析组(Burst)、致密双星并合数据分析组(CBC)、连续波数据分析组(CW)以及引力波随机背景数据分析组(Stochastic)等。
“清华工作组只承担了其中很小一部分,现在主要参与CBC的加速工作、探索使用计算机神经网络进行数据处理等。”曹军威说。
为了方便大众了解引力波,科学家们每次都会把LIGO的重大科学发现转换成生动直观的图像甚至是视频,而它们其实来源于LIGO探测器每秒采样16000次形成的密集数据。这些数据,要经过除噪、比对等一系列处理,才能供研究引力波之用。
为此,清华工作组和西澳大学合作,建立了一条新型的低延迟引力波数据处理流水线:首先,天文台将观测数据打包传送到数据中心;然后,对这些数据进行预处理;接下来,将预处理后的数据与大量引力波数据模板进行快速并行匹配,以确定信号是不是引力波;最后,发出预警,协同观测。
“以前,这个过程大概需要几分钟。后来,我们对滤波算法进行了加速,可以在1秒内完成数据和上万个引力波数据模板的匹配,从而把整个过程缩短到十几秒。我们下一步的目标是3至5秒。”同在清华工作组里的都志辉副教授说。
“引力波对应的电磁信号的发现,恰恰印证了高性能并行计算的必要性。当引力波过来时,一些伴随引力波的电磁信号间隔时间可能非常短,仅仅只有几秒,要捕捉这些很快出现又十分短暂的电磁信号,就必须实现引力波数据的准确快速处理,甚至是‘零延迟’。”都志辉说。
不过,目前LIGO的数据分析还不能完全实现自动化,工作组要轮流值班,人工检查数据产生的触发。“我们正在尝试引入人工智能,如果成功,将来就不需要人来检查,并可以自动匹配波形,用更短的时间处理更多的信号,并更快地给出结果。”曹军威说。
清华工作组在LIGO科学合作组织中的积累和创新,将为中国未来的引力波探测项目提供宝贵的经验。曹军威认为,在基础比较薄弱的科研领域,中国应该积极参与国际合作,培养人才,积蓄力量。