面向射电日像仪的随机组结构剖析与文件设计*

2013-12-18 00:53:44高姣姣季凯帆刘东浩
天文研究与技术 2013年4期
关键词:关键字射电天文

高姣姣 ,王 锋,3 ,戴 伟,季凯帆,邓 辉,刘东浩,王 威

(1. 昆明理工大学云南省计算机技术应用重点实验室,云南 昆明 650500; 2. 中国科学院国家天文台, 北京 100012; 3. 中国科学院云南天文台,云南 昆明 650011)

面向射电日像仪的随机组结构剖析与文件设计*

高姣姣1,王 锋1,3,戴 伟1,季凯帆1,邓 辉1,刘东浩2,王 威2

(1. 昆明理工大学云南省计算机技术应用重点实验室,云南 昆明 650500; 2. 中国科学院国家天文台, 北京 100012; 3. 中国科学院云南天文台,云南 昆明 650011)

我国新一代厘米—分米波日像仪(Chinese Spectral Radio Heliograph, CSRH)已经进入了试观测调试阶段,设备误差修正、试观测数据的处理成为当前CSRH的重要工作。其中,有效地保存与快速处理试观测数据是数据处理的前提。在调研当前国内外射电干涉观测设备的基础上,深入分析了Aips++、CASA等当前主流射电天方数据处理软件对数据格式的支持情况,分析了射电天文领域的随机组(UVFITS)格式,给出了满足射电日像仪数据的随机组格式。实验表明,所生成的UVFITS文件可以被主流软件正确处理。对CSRH的研制起到了较好的推动作用,也对国内正在开展的其它大型射电观测数据存储有参考价值。

UVFITS;射电天文;数据存储

为了推动太阳射电观测技术的发展,由我国天文学家提出的400 MHz~15 GHz范围内的厘米—分米波日像仪将首次在多波段上实现同时以高空间、高时间和高频率分辨率观测太阳活动的动力学性质,对太阳从色球层到高日冕的广大区域中进行高分辨率的三维动态成像观测,填补国际科学界在太阳耀斑、日冕物质抛射等爆发活动的能量初始释放区高分辨射电成像观测的空白,揭示太阳剧烈活动的起源和发生规律,并取得一批原创性的研究成果[1],大大提升我国在太阳活动预报方面的能力,为航空、航天、卫星通讯和国防建设等提供有力保障,对推动学科发展及相关高技术领域的建设具有重要作用。

CSRH最终选址在内蒙古锡林格勒盟正镶白旗。整体共分两期完成:第一期CSRH-I低频阵由40面4.5 m天线及接收设备组成,在64个频率点上成像;第二期CSRH-2高频阵由60面2 m天线及接收设备组成,在528个观测频点上成像。随着CSRH-I进入系统联调和试观测,当前迫切需要实现的是试观测结果的存储、处理,以推进CSRH设备误差修正、设备定标等一系列工作。这其中,就需要应用当前射电天文领域的相关软件,如Common Astronomy Software Applications-CASA (http://casa.nrao.edu/)等对试观测数据进行处理与分析,从而获得同行公认的结果。而如何将CSRH观测得到的结果快速保存为CASA可以接收的数据格式成为当前一个急需解决的问题。

在天文数据存储中,普适图像传输系统(Flexible Image Transport System, FITS)格式无疑是当前数据格式的标准[2-4],但在射电天文领域,被广泛采用的是所谓的随机组(Random groups)结构[4-5]的FITS文件。因为主要保存UV复可见条纹数据也经常被称为UVFITS文件。因为在射电干涉领域以外基本不使用这样的文件格式,所以为其它领域设计的FITS格式读取软件无法读取随机组相应的数据。从标准FITS格式定义来看,随机组的构造是异常的,它也是唯一不遵从主HDU(FITS头与数据单元)扩展特殊记录序列定义的记录。但是随机组经过多年的发展,众多的射电天文软件(如Aips、Aips++和Casa等)均支持这一格式,为此,将CSRH观测数据保存为UVFITS格式,无疑可以充分利用当前主流软件对CSRH试观测结果进行处理分析,加快CSRH的建设进程。

但较为遗憾的是,在对UVFITS格式进行调研中发现国内详细讨论随机组(UVFITS)结构的资料非常少,国外也只有Aips++的部分文档描述了这一格式,给整体工作带来了较大的困难。本文在参考NASA/GSFC Astrophysics Data Facility文档的基础上[6],重点分析了UVFITS格式,对CSRH保存的UVFITS文件进行了说明,并最终通过开源的CfitsIO库(http://heasarc.gsfc.nasa.gov/fitsio/)实现了编程,所生成的文件可以正确被CASA软件处理,验证了格式的正确性。

1 随机组(UVFITS)结构分析

1.1 随机组结构

如前所述,随机组结构基本只应用于射电天文领域,也主要被射电天文相关软件支持。这一格式最早由文[5]作者在1981年提出。从基本设计思想来看,随机组格式是标准FITS格式的扩展。随机组结构主要应用于UV干涉可见度数据中,因此,随机组结构也被称为UVFITS结构,在后续讨论中,两个概念是完全等同的。

在FITS文件中最基础的数组结构完全可以处理沿各个数据轴均匀分布的数据矩阵,但在射电天文中,有时数据沿一个轴或者多个轴的数据分布是不均匀的,如果采用标准FITS的方法无疑会浪费大量的存储资源,而随机组结构正是用于处理这样的情况。随机组结构中,FITS头后面不是跟数据数组,而是跟特定的记录集。这些记录集也按标准的FITS块(23 040 bits)大小组织,称之为随机组记录。这些记录包含一系列的组,每个组都由一系列的参数和后续的数据数组组成。这些参数后的数据,间距不统一,无顺序要求,也就是随机的。但这些参数的数量和后续数据的大小在组中必须是相同的。

针对CSRH这样的干涉观测设备,在UV干涉可见度数据的存储中,随机组数据需要保存的也就是一系列的在一个等间距频率序列上针对4个斯托克斯极化的加权复可见条纹。数据轴分别是U、V、W、时角、基线、条纹的可见度信息(实部、虚部、权重)、斯托克斯参数和频率。沿频率轴的点间隔均匀,条纹的可见度和斯托克斯轴都可以通过使用“等间隔的”整数索引点表示离散部分(即实部、虚部和权重(表示可见性))和4个斯托克斯参数。因此,即使在每一矩阵中基线、时角和(u,v,w)的值均是不均匀分布的,一次射电观测数据也可以很容易地被定义为一个包含可见度部分、斯托克斯参数和频率的多轴数组的矩阵结构。

使用随机组结构、基线、时角和(u,v和w)的值需要在每个矩阵(复可见度、极化、频率)前作为参数被指定。参数和数组的组合构成一个组,这个组的结构可以表示如下:

|r1,r2,r3,r4,…,rN|p111,p112,…,plmn|

(1)

相应地,针对CSRH的实际情况,就是:

|u,v,w,时间,基线|(可见度部分,斯托克斯参数,频率)|

(2)

其中,随机参数从1到N,P111,…,Plmn表示对应数据矩阵的相应数据值。在原则上对于每一个轴,p的值最大可以是998,而不是一般FITS规定的999。

数据数组pijk紧跟在上一个参数rN之后开始,随机组数据数组的存储顺序和数据的内部表达与基础 FITS中所定义的完全一样。其实,基础FITS数据结构就是一个没有参数的UVFITS结构的子集。

1.2 随机组的关键字

与FITS文件一致,随机组结构中保留了一系列的关键字,这些关键字必须严格符合标准FITS格式定义,字长不超过8个字节,全部为大写符号、数字、下划线与连字符。FITS格式中广义扩展部分的两个关键字PCOUNT和GCOUNT最初就是为随机组结构定义的。在随机组中的关键字与一般FITS格式的相同,顺序也一致。但随机组有其相应的特点,如其中一个特征是NAXIS1关键词设置等于0,NAXIS和NAXISn关键字会比普通的 FITS中有些许不同的含义。表1列出了随机组中最为重要的关键字。需要说明的是,在本文中,在描述各个关键字的类型时与标准FITS文件保持一致,采用如下代码表示相应的二进制表数据类型:L(逻辑型),I(16位整型),J(32位整型),A(字符型),E(32位浮点数),D(64位浮点数)。

表1 随机组中的若干核心关键字Table 1 Some most important keywords in a random-group data file

在生成文件时,上述关键字间一定不能插入其它的关键字。除了上述5个关键字,如表2关键字也需要写入。

表2 随机组中的其它若干常见关键字Table 2 Some common keywords in a random-group data file

通过关键字PCOUNT和GCOUNT可以获得NBITS的值,即在随机组中填充空白的位数,见(3)式:

NBITS=ABS(BITPIX)×GCOUNT×(PCOUNT+NAXIS×NAXIS3×...×NAXISm)

(3)

其中,m表示NAXIS的值。

在这些关键字的基础上,随机组文件通过自定义关键字的方式进行扩展,自定义关键字采用3个关键字进行定义:TFORMn表示该关键字的存储变量类型(如1D、 1A等等),TUNITn表示该扩展关键字的单位(如Hz等),用TTYPEn存储自定义关键字的名称。举例如下:为了在随机组文件中自定义总带宽(TOTAL BANDWIDTH)这个字段,那么在标准关键字结束后,在头定义中,就可以采用如下方法来定义:

TFORM10=‘1D ’

TUNIT10=‘HZ ’

TTYPE10=‘TOTAL BANDWIDTH’

2 UVFITS文件详细存储格式分析

参考AIPS++对干涉仪观测数据的保存格式[7],CSRH在文件存储中,则应包括可见度数据与相应的参数表。

2.1 轴设计

为保存CSRH的观测数据,随机组包括如表3的轴信息。

COMPLEX 轴必须是数据矩阵中的第一个轴,同时也必须保证 NAXIS2的值为2或者3,CDELT2、CRPIX2和CRVAL2的值为1.0。COMPLEX轴的第一个数据,应是复可见度的实部,其次是复可见度的虚部。如果第三部分存在的话,则包括这个可见度数据的测量权重。权重≤0则表示可见度测量已经被标记,所有的权重值是没有意义的。

表3 UV数据存储中常规轴Table 3 Regular axes for a UV data array

STOKES轴主要用来列出所有的极化的组合。对应的NAXISm的值,表示第n个斯托克斯参数,值应在1到4之间。CRPIX的值应为1.0。STOKES轴是比较常见的轴,其值在1到4之间,分别表示斯托克斯的I、Q、U和V参数。如果是-1到-4,则表示RR、LL、RL和LR 4个极化乘积。-5到-8则分别表示XX、YY、XY和YX 4个极化乘积。

FREQ轴主要用来列举频率通道。对应的CRVALm就是对应数据集的参考频率。习惯上是第一个IF的频率。所有的CRVALm和CDELTm的单位是赫兹(Hz)。频率的数量用nchan表示。

IF轴列举了所有的频窗(频率波段)。对应的CRVALm、CRPIXm和CDELTm等关键字的值都应是1.0。如果只有一个波段和一个频率,则IF轴可以被忽略;如果该轴存在,则FITS文件中一定要包含AIPS FQ的二进制表。在IF轴上的象素数量用nIF表示。

RA和DEC轴都有对应的nAIXSm,值为1。如果只有一个源存在或者没有SOURCE表存在,关键字CRVALm则以角度保存相位中心的赤经值,或者是相位中心的赤纬值;这些坐标值如果有多个源存在,则CRVALm的值均应是0,且不再需要申明二分点。

2.2 随机参数设计

与上述数据相对应,也参考了其它相关的日像仪(干涉仪等)的数据存储格式,并进一步核实了CASA软件模拟观测所得到的UVFITS数据格式,最终CSRH的随机组文件设计如下。

整个数据包括4个组,主数据、频率表FQ、天线表AN和SU数据。每个部分均包含头和数据。在FQ、AN和SU 3个表中,在这些关键字中,除了标准的FITS关键字以外,其它均采用自定义参数的方式描述定义,在下述各表中说明是强制与可选的列,均采用扩展关键字描述方式(表4~6)。顺序说明如下:

2.2.1主数据随机参数

表4 主数据随机参数关键字Table 4 Keywords for random parameters of uv data

2.2.2 频率表(FQ)组随机参数

表5在频率表头中强制与可选的关键字

Table5MandatoryandoptionalkeywordsforanAIPSFQtableheader

名称类型 值EXT-NAMEA‘AIPSFQ’NO_IFI谱窗(频率)数量。在频率表中,这个用来控制除频率设置数以外的列的维数

表6 在AIPS FQ表头中强制与可选的列Table 6 Mandatory and optional columns for an AIPS FQ table header

2.2.3 天线表(AN)组随机参数

天线表保存所有的天线信息,其中包含馈源的相关极化信息(表7)。

表7 在天线表头中强制与可选的关键字Table 7 Mandatory and optional keywords for an AIPS AN table header

2.2.4 源表(SU)组随机参数

SU表主要用于观测超过一个源的场合,提供了名称、校正代码、流量和每个源的坐标信息。SU表的头如表8。

3 文件格式的验证

在完成上述分析后,使用CFITSIO这一开源软件包开发了相应的观测数据存储程序。CFITSIO在编程中,通过fits_create_image函数打开相应的文件,并通过fits_write_record插入相应的记录,

表8在源表头中强制与可选的关键字

Table8MandatoryandoptionalkeywordsforanAIPSSUtableheader

名称类型 值EXT-NAMEA‘AIPSSU’NO_IFIIFs(nIF)编号FREQIDI频率设置ID编号VELDEFA‘RADIO’VELTYPA速度坐标参考

在全部数据写入完成后,最终通过fits_close_file函数关闭文件。

根据CSRH I的当前情况,一共40面天线,经过上述程序生成的UVFITS文件,长度为77 824字节,分为26个2 880块,按照二进制方式顺序存储。采用FITS扩展格式,其中包括4部分,主数据部分、FQ数据部分、AN数据部分和SU数据部分,每个部分均包含头和数据。

表9 在源表头中强制与可选的列Table 9 Mandatory and optional columns for an AIPS SU table header

为进一步确认生成的数据文件是否符合标准,本文采用CASA软件对生成的数据文件进行读取,并转换为ms格式,具体的验证过程如下:

(1)正常启动CASA系统,出现“>”符号的提示符;

(2)利用importuvfits命令,读入相应文件,并写出ms(测量集文件)。命令如下:

importuvfits (fitsfile=‘xxx.fits’, vis=‘msoutput.ms’, antnamescheme=None)

(3)在相应目录下,检查ms文件是否存在;

(4)在CASA中读入ms文件,进行相应的图像分析处理,核实输出结果,证明所生成的数据文件是正确的,可以满足数据存储、数据处理和共享交换的要求。

4 结 论

本文调研了当前国内外各类射电干涉观测设备对数据存储的要求,深入分析了Aips++、CASA等当前主流射电天方数据处理软件对数据格式的支持,在文中分析了射电天文领域的随机组(UVFITS)格式,给出了满足射电日像仪数据的随机组格式,实验表明,所生成的UVFITS文件可以被主流软件正确处理。

随着CSRH试观测的不断开展,本文对CSRH的研制与最终建成有较好的推动作用,同时,对UVFITS文件的详细分析也对国内正在开展的其它大型射电观测数据存储有参考价值。本文除了对CSRH的工作有推进作用外,所实现的方法也对正在建设的FAST等我国射电观测设备的研制有参考价值。

[1] 颜毅华, 张坚, 陈志军, 等. 关于太阳厘米-分米波段频谱日像仪研究进展[J]. 天文研究与技术——国家天文台台刊, 2006, 3(2): 91-98.

Yan Yihua, Zhang Jian, Chen Zhijun, et al. Progress on Chinese solar radioheliograph in cm-dm wavebands[J]. Astronomical Research & Technology——Publications of National Astronomical Observatories of China, 2006, 3(2): 91-98.

[2] 崔辰州, 李文, 于策, 等. FITS数据文件的检索和访问[J]. 天文研究与技术——国家天文台台刊, 2008, 5(2): 116-123.

Cui Chenzhou, Li Wen, Yu Ce, et al. Search and location of FITS data files[J]. Astronomical Research & Technology——Publications of National Astronomical Observatories of China, 2008, 5(2): 116-123.

[3] R J Hanisch, A Farris, E W Greisen, et al. Definition of the flexible image transport system (FITS) [J]. Astronomy and Astrophysics, 2001, 376(1): 359-380.

[4] D C Wells, E W Greisen, R H Harten. Fits-a flexible image transport system[J]. Astronomy and Astrophysics Supplement Series, 1981, 44: 363-370.

[5] E W Greisen, R H Harten. An extension of FITS for groups of small arrays of data[J]. Astronomy and Astrophysics Supplement Series, 1981, 44: 371-374.

[6] NASA/GSFC Astrophysics Data Facility. A User′s Guide for the Flexible Image Transport System (FITS)’1997) [EB/OL]. [2012-11-08]. http://archive.stsci.edu/fits/users_guide/node28.html.

[7] Eric W Greisen. AIPS Memo 117-AIPS FITS File Format[EB/OL]. [2012-11-08]. http://www.aoc.nrao.edu/~egreisen/, 2012.

AnAnalysisoftheRandom-GroupDataFormatandaDesignoftheDataFileStructureforaSolarRadioHeliograph

Gao Jiaojiao1, Wang Feng1,3, Dai Wei1, Ji Kaifan1, Deng Hui1, Liu Donghao2, Wang Wei2

(1. Key Lab of Applications of Computer Technology of the Yunnan Province, University of Science and Technology of Kunming, Kunming 650500, China, Email:wangfeng@acm.org; 2. National Astronomical Observatory, Chinese Academy of Sciences, Beijing 100012, China; 3. Yunnan Observatories, Chinese Academy of Sciences, Kunming 650011, China)

The CSRH (Chinese Spectral Radio Heliograph) is a new generation radio heliograph working in the wavelengths of centimeters and decimeters. It has entered the test stage. At this stage it is important to study error corrections, instrumental calibrations, and observational data precessing for the CSRH to facilitate its development. Efficient data storage and high-performance data processing are crucial to these studies for the CSRH. In this paper, by investigating current radio interferometers in the world and data formats supported by main-stream analysis softwares in radio astronomy (e.g. AIPS++ and CASA), we choose to analyze the widely adopted random-group format (UVFITS). We then design the structure of a random-group data file for the CSRH to store needed data, including theuv, antenna, and object-information data. We also design and test a software protocol. Our experiment shows that such a data file can be read and processed successfully by the CASA software. Our study is expected to help the development of the CSRH and benefit research of other astronomical instruments.

Random-group format (UVFITS); Radio astronomy; CSRH; Data storage

CN53-1189/PISSN1672-7673

TP311.11

A

1672-7673(2013)04-0365-07

国家自然科学天文联合基金重点项目 (U1231205);国家自然科学基金 (11263004, 11103005) 资助.

2012-11-08;修定日期:2012-12-10

高姣姣,女,硕士. 研究方向:天文技术与方法. Email:gaojiaojiao@cnlab.net

王 锋,男,教授. 研究方向:天文技术与方法. Email:wangfeng@acm.org

猜你喜欢
关键字射电天文
天文动手做/中国古天文系列 三星在天、在隅、在户
军事文摘(2024年4期)2024-01-09 09:08:34
谁能抓住“神秘天神”——快速射电暴?
军事文摘(2022年12期)2022-07-13 03:10:22
射电星系
履职尽责求实效 真抓实干勇作为——十个关键字,盘点江苏统战的2021
华人时刊(2022年1期)2022-04-26 13:39:28
美国的绿岸射电望远镜
军事文摘(2021年22期)2022-01-18 06:22:52
天文篇
成功避开“关键字”
世界著名射电望远镜
太空探索(2016年9期)2016-07-12 10:00:01
一群“玩”天文的痴迷少年
学生天地(2016年31期)2016-04-16 05:16:00
天文知识普及
视野(2012年2期)2012-07-26 02:50:20