陈 磊
(河北省环境应急与重污染天气预警中心 河北 石家庄 050030)
近年来,通过不断研究探索,各区域、省、市环境保护部门与相关的气象部门进行合作,进行了多种预报方法的研究与应用,基本形成潜势预报、统计预报和数值预报相结合的污染预报模式。随着计算机技术的迅速发展和预报准确性的不断提高,数值预报模式越来越受到重视,并在空气质量预报中发挥着越来越重要的作用。
超级计算机(supercomputer)最早出现在20世纪70年代初期。第一代超级计算机是单指令多数据流的阵列计算机。第二代超级计算机是具有流水结构的向量机。第三代超级计算机是具有多指令多数据流形式的共享存储多处理机系统。第四代超级计算机是MPP系统,它由上万个处理机组成,凭借高度平行来获取超高性能。第五代超级计算机是集群系统,这是当今最流行的超级计算机。早期的集群系统采用同构方式,当今集群逐步转向采用异构方式。上世纪80年代后期,随着超算应用面的逐渐扩大,高性能计算的概念产生了,随之而来的是,超级计算走向了各个行业和领域,人们对超算的追求已经不是单一的计算,而是转向了高性能的综合指标。
HPC高性能计算(High Performance Computing)主要由五类计算设备和三类网络组成。五类设备主要指登录节点、管理节点、计算节点、交换设备、I/O节点和存储设备,三类网络主要是计算网络、管理网络和存储网络。
有关人类社会文明进步的巨大挑战性问题求解的迫切需要和新的挑战性问题的不断涌现,促使超级计算机不断发展。有的需要高时效性,如数值气象预报;有的需要高精度,如核爆模拟;有的需要高吞吐量,如海量的事务处理;更有的可能在时间、精度和吞吐量上都有要求。
以数值预报的应用问题求解为例,将地球的大气层建立数值模型,把大气层划分为数个三维的单元格,利用牛顿运动定律、质量守恒定律、热力学第一定律、状态方程、水汽方程等构成非线性偏微分方程组来估测各种影响。实际上,每个单元内影响大气的各种条件(风温湿压)是前一时间间隔中的大气条件通过非线性方程组进行计算得到的,每个大气单元的计算都要重复许多次,用来模拟时间的向前推移。此模型的关键点在于有足够多的单元数,有足够的单元数模拟数据才更具有效性。为了预报未来几天的大气条件,由于大气层会受到远距离大气事件的影响,所以大气模型要覆盖足够大的范围。假设划分的每个单元格大小为1 km×1 km×1 km,高度为20 km(20个单元格的高度),估计有1×109个单元格,假设每个单元进行200次浮点操作,则在一个时间步中就必须完成2×1011次浮点操作,如果预报7天以上的天气,时间间隔为1分钟,则需要10 080个时间步和总计2×1015次浮点运算。对于一台运算速度为109浮点运算/秒的计算机则需要2×106秒,超过十天才能完成上述计算,显然是不能满足要求的。如果想要在5分钟内完成上述计算,则需要运算速度达到6.8×1012浮点运算/秒的计算机。如果将分割单元缩小到0.1 km×0.1 km×0.1 km的大小,则总的浮点运算次数将会增加到2×1019次,若同样想在5分钟内完成这一计算,则需要运算速度为6.8×1015浮点运算/秒的计算机。
数值预报主要利用牛顿运动定律、质量守恒定律、热力学第一定律、状态方程、水汽方程构成非线性偏微分方程组,通常无解析解。通过对方程进行离散化,用差分近似微分,空间差分和时间差分进行数值求解。
数值预报方法以大气动力学理论为基础,把初始和边界条件、污染源清单、模拟气象场等数据输入非线性偏微分方程组,模拟大气污染物在大气中的输送、扩散、转化、沉降等过程。通过高性能计算集群数值求解,描述出污染物的传输过程、污染物动态变化分布以及变化趋势。数值模型是建立在科学的理论和假设基础之上,用数值方法描述大气中污染物的传输、扩散、化学反应以及清除过程,通过输入污染源清单、地理数据以及模拟气象场、运行模式得到空气质量数据。
数值模式预报系统一般包括高性能计算硬件系统,以及空气质量模式、气象数值模式、源清单编制与动态更新机制、监测网络数据同化和综合分析工具等软件系统。涉及多尺度范围、多种污染物、多种物理化学过程、高时空分辨率。
数值预报结果的准确率决定了空气质量预报业务的准确率,模式产品准确率越高,业务预报基础越好。数值预报模式结果主要受以下几点因素影响:模拟气象场的准确度、模式的分辨率(模型单元格的大小)、污染源清单的准确度和空气质量监测数据等。3.1 模式分辨率。模式分辨率主要分为垂直分辨率和水平分辨率,垂直分辨率主要反映混合层高度、对流层垂直扩散等大气层结构特征,水平分辨率主要反映污染物水平分布,以及传输、扩散等变化趋势。
图1 不同分辨率模式结果对比
如图1,左图分辨率为45×45 km约108网格,右图为5×5 km约8720网格,右图比左图能够更准确的描述污染物的扩散沉降过程。
在发生大气重污染过程时,高分辨率的模式结果更有利于预报员判断污染过程的起止时间、影响范围和影响程度等关键信息。
3.2 大气条件预报结果。模拟气象场是数值预报模式的重要前提条件,直接影响预报结果的准确度。当发生重污染过程时,分析判断重污染的影响范围程度和结束时,主要依赖相应时间段的模拟气象场结果。
3.3 污染源清单。污染源清单反映了一定范围内大气污染排放量的时空分布特征,是数值预报模式重要的输入数据。全面、准确、高分辨率并动态更新的污染源清单可提高预报的准确率,有利于精确开展重污染过程中污染物源解析和去向追踪。
无论是提高预报模式的分辨率、还是提高大气预报结果的准确度,或者输入高分辨率的污染源清单都对高性能计算集群提出了更高的要求,增加更大的作业量,提高高性能计算集群的计算速度成为提高空气质量预报准确度的关键点。
[1]王晓彦,刘冰,李健军,等.区域环境空气质量预报的一般方法和基本原则[J].中国环境监测,2015,31(1):134~ 138.
[2]吉青.超算竞赛导引 [M].北京:科学出版社,2016.
[3]程念亮,李云婷,孙峰,等.北京市空气重污染天气类型分析及预报方法简介 [J].环境科学与技术,2015,38(5):189~ 194.
[4]王茜,伏晴艳,王自发,等.集合数值预报系统在上海市空气质量预测预报中的应用研究 [J].环境监控与预警,2010,2(4):1~6.