美章網(wǎng) 資料文庫 提升數(shù)值預(yù)報存儲效率方法分析范文

提升數(shù)值預(yù)報存儲效率方法分析范文

本站小編為你精心準(zhǔn)備了提升數(shù)值預(yù)報存儲效率方法分析參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。

提升數(shù)值預(yù)報存儲效率方法分析

摘要:通過有代表性的測試實驗,展現(xiàn)了NetCDF4的新特性,對比了3種典型數(shù)值預(yù)報業(yè)務(wù)數(shù)據(jù)使用NetCDF3與NetCDF4存儲的性能、NetCDF4連續(xù)存儲與非連續(xù)存儲的創(chuàng)建與更新文件性能。經(jīng)過實驗得出:在連續(xù)存儲時,NetCDF4表現(xiàn)出的性能較NetCDF3更為出色,尤其在數(shù)據(jù)量很大的情況下,性能提升非常顯著;選擇合適分塊策略的情況下,NetCDF4的優(yōu)勢更是令人耳目一新。測試結(jié)果表明,全面使用NetCDF4替代NetCDF3的數(shù)值預(yù)報產(chǎn)品是可行的,而且將會大大提高程序的效能。

關(guān)鍵詞:計算機技術(shù)與應(yīng)用;數(shù)值預(yù)報;連續(xù)存儲;分塊存儲;性能分析

目前,數(shù)值預(yù)報業(yè)務(wù)體系已經(jīng)日益完善,在各級氣象臺站的日常公眾氣象預(yù)報服務(wù)中發(fā)揮著越來越重要的作用[1]。特別是為災(zāi)害性、關(guān)鍵性、轉(zhuǎn)折性天氣的預(yù)報服務(wù)等提供了定量參考信息,并為預(yù)報業(yè)務(wù)向應(yīng)用、環(huán)境氣象領(lǐng)域的拓展提供了有利的技術(shù)支持[2-5]。廣東省氣象數(shù)值預(yù)報業(yè)務(wù)平臺目前已建立了相對完善的NetCDF數(shù)值預(yù)報產(chǎn)品庫,軟件版本為3.6。NetCDF4是使用HDF5存儲數(shù)據(jù)的編程API6]。由于NetCDF4項目使用HDF5存儲格式,HDF5獨有的壓縮能力使數(shù)據(jù)文件占用的空間大幅度降低[7]。本研究通過幾個有代表性的實驗回答了:NetCDF4是否比NetCDF3有更好的性能、NetCDF4在什么情況下性能最好或最糟以及如何使用NetCDF4提高應(yīng)用程序性能等問題,旨在為“廣東省氣象數(shù)值預(yù)報業(yè)務(wù)平臺”升級提出指導(dǎo)方案。

1HDF5簡介

HDF[8]是由美國國家超級計算應(yīng)用中心(NCSA)提出,用于存儲和分發(fā)科學(xué)數(shù)據(jù)的一種自描述、多對象文件格式[9],具有自描述性、通用性、靈活性、擴展性及跨平臺性。HDF最新的產(chǎn)品HDF5采用了新的架構(gòu),改善了HDF4的一些不足[10-11],表現(xiàn)在3個方面:1)單個文件可以存儲更多的對象,文件大小可以超過2Gb字節(jié)。2)數(shù)據(jù)模式更簡潔、更全面,它包含2個基本結(jié)構(gòu):多維數(shù)組記錄結(jié)構(gòu)和分組結(jié)構(gòu)。3)更簡潔的工程庫和應(yīng)用編程接口,支持并行I/O、線程和其他一些現(xiàn)代應(yīng)用。

2測試用例和測試環(huán)境

2.1時間測度

本研究主要對NetCDF文件的創(chuàng)建與更新2個核心過程做時間測算,關(guān)注NetCDF文件的寫入操作。其中對NetCDF文件創(chuàng)建的時間測量是使用C函數(shù)gettimeofday分別獲取NetCDF的API函數(shù)nc_create之前、nc_close之后的時間,取兩者差值;對NetCDF文件寫數(shù)據(jù)的更新操作是使用gettimeofday分別獲取nc_open之前、nc_close之后的時間,取兩者差值。由于不同的數(shù)據(jù)預(yù)報模式的數(shù)據(jù)量不同,本研究選取了數(shù)據(jù)量較小、中等、較大3個有代表性的模式來做測試,分別是月數(shù)據(jù)量20Gb的歐洲中心32d數(shù)值預(yù)報(簡稱ECMWF_S4F)、507Gb的NCEP_GFS模式和955Gb的歐洲中心46d集合預(yù)報(簡稱ECMWF_ENSEXT),參數(shù)如表1所示。值得注意的是,本研究所有的月數(shù)據(jù)量在未特殊說明的前提下均為模式在NetCDF3.6連續(xù)存儲方式下獲得的數(shù)據(jù)量,同時NetCDF3均指版本3.6。

2.2機器配置

為了對比同一模式在不同存儲方式下的實際運行時間,所有測試程序均在同一臺服務(wù)器上運行。服務(wù)器使用了Linux虛擬機,內(nèi)核版本為CentosLinuxrelease7.1.1503,CPU為4個Intel(R)Xeon(R)CPUE7-4809,每個4核,主頻2.0GHz,32Gb內(nèi)存,gcc版本為4.8.2。

3NetCDF3與NetCDF4性能對比

相對于NetCDF4而言,NetCDF3構(gòu)建的應(yīng)用程序只能使用連續(xù)存儲的方式。而NetCDF4構(gòu)建的應(yīng)用程序則既可以選擇連續(xù)存儲的方式,也可以選擇分塊存儲方式。使用表1中描述的數(shù)值預(yù)報模式信息,將使用連續(xù)存儲的NetCDF3的性能與使用連續(xù)和分塊存儲的NetCDF4的性能進行比較。

3.1連續(xù)存儲

以表1中3個數(shù)值預(yù)報模式為例,分別測試每個模式使用NetCDF3連續(xù)存儲與NetCDF4連續(xù)存儲方式創(chuàng)建模式和更新模式所使用的時間(使用3.1節(jié)中的時間測度)。由圖1可見,月數(shù)據(jù)量為20.3Gb的ECMWF_S4F模式,不論是創(chuàng)建文件時間,還是更新文件時間,使用NetCDF4連續(xù)存儲方式都不如NetCDF3連續(xù)存儲寫入時間快。尤其是更新時間,NetCDF3僅僅使用1.98s,速度是NetCDF4連續(xù)存儲的更新時間的125倍。因此在數(shù)據(jù)量較小的模式中,不論創(chuàng)建文件還是更新文件,使用NetCDF3效果更好。由圖2a-b可見,NCEP_GFS模式使用NetCDF4連續(xù)存儲方式,創(chuàng)建文件時間是NetC-DF3連續(xù)存儲方式的1.5倍,減少了600s,效率提升明顯。而在更新文件時,NetCDF4和NetC-DF3連續(xù)存儲的速度相當(dāng),沒有明顯的差異。由此可見,數(shù)據(jù)量中等規(guī)模的模式,相對于NetC-DF3來說,使用NetCDF4連續(xù)存儲效率更佳。由圖2c-d可見,月數(shù)據(jù)量955Gb的ECM-WF_ENSEXT模式使用NetCDF4連續(xù)存儲的情況下,創(chuàng)建文件速度是NetCDF3連續(xù)存儲方式2.7倍,節(jié)省了近80min,效率提升非常明顯。在更新文件的情況下,比NetCDF3連續(xù)存儲略快一點,速度較為接近。因此,數(shù)據(jù)量較大的模式,使用NetCDF4更為可靠。

3.2NetCDF4分塊存儲

3.2節(jié)使用NetCDF4連續(xù)存儲與NetCDF4分塊存儲方式進行對比,檢驗2種方式的性能。其中使用[]來表示分塊策略。圖3a-b為ECMWF_S4F模式NetCDF4連續(xù)、分塊存儲方式的性能對比,其中分塊存儲方式使用了[51×31×1×61×61]的分塊策略,代表ECMWF_S4F模式分塊使用了5維數(shù)組,分別為[集合成員×預(yù)報時效×層數(shù)×緯度×經(jīng)度],即集合成員分塊數(shù)為51,預(yù)報時效分塊數(shù)為31,層數(shù)分塊數(shù)為1,緯度分塊數(shù)為61,經(jīng)度分塊數(shù)為61。由圖4可見,使用分塊策略的ECM-WF_S4F模式在創(chuàng)建文件時,節(jié)省了1min,約為連續(xù)存儲的2/5。而在更新文件時,NetCDF4連續(xù)存儲需要6min,使用分塊策略只要5.86s,速度提升了60倍。由此可見,使用合適的分塊存儲策略的ECMWF_S4F模式無論創(chuàng)建時間還是更新時間都遠遠快于NetCDF4連續(xù)存儲方式。圖3c-d為NCEP_GFS模式NetCDF4連續(xù)、分塊存儲方式的性能對比,其中分塊存儲方式使用了[1×14(1)×141×720]的分塊策略。由圖5可見,使用該分塊策略的NCEP_GFS模式創(chuàng)建全部要素文件使用分塊存儲方式的NCEP_GFS模式創(chuàng)建時間要遠遠快于NetCDF4連續(xù)存儲方式,僅用27.79s,就完成全部25個要素文件的創(chuàng)建,相對于NetCDF4連續(xù)存儲的1212.09s,速度提升了約44倍。而更新時間二者較為接近,沒有明顯差異。因此,選擇合適的分塊策略,NCEP_GFS模式使用分塊存儲方式比連續(xù)存儲方式更快更有效。對ECMWF_ENSEXT模式NetCDF4連續(xù)、分塊存儲的性能對比(圖4),其中分塊存儲中前4個高空要素使用了[51×1×7×91×360]分塊策略,第5、第6個高空要素使用了[51×1×1×91×360]分塊策略,地面要素使用了[51×1×1×161×281]分塊策略。由圖4可見,使用分塊存儲方式的ECMWF_ENSEXT模式創(chuàng)建時間僅為175s,速度約是連續(xù)存儲的16倍。分塊存儲的更新時間也遠遠快于NetCDF4連續(xù)存儲的更新時間,節(jié)省了約53min,速度是連續(xù)存儲的19倍。可見,在數(shù)據(jù)量較大的情況下,合適的分塊策略,在提升文件創(chuàng)建、更新速度方面效果顯著。

3.3對比結(jié)果

從表2可知,NetCDF4連續(xù)存儲與NetCDF3連續(xù)存儲方式相比,在數(shù)據(jù)量較小情況下,不具優(yōu)勢,反而NetCDF3速度較快,尤其在更新文件時最為顯著。在數(shù)據(jù)量中等或較大時,NetCDF4連續(xù)存儲創(chuàng)建文件的優(yōu)勢顯著,且數(shù)據(jù)量越大優(yōu)勢越為明顯,而在數(shù)據(jù)量中等或較大時,NetCDF4連續(xù)存儲與NetCDF3連續(xù)存儲更新時間相近,沒有明顯不同。通過選擇合適的分塊策略,NetC-DF4不論在數(shù)據(jù)量適中、還是較大,不論在創(chuàng)建文件,還是更新文件情況下,速度優(yōu)勢都非常明顯。在數(shù)據(jù)量較小的情況下,仍是NetCDF3更具優(yōu)勢。

4結(jié)論

1)在連續(xù)存儲時,NetCDF4表現(xiàn)出的性能比NetCDF3更出色,尤其在數(shù)據(jù)量很大(NetCDF3下超過500Gb的數(shù)據(jù))的情況下,性能提升非常顯著。2)在分塊存儲時,選擇合適的分塊策略,NetCDF4無論在數(shù)據(jù)量較大、適中的情況下,優(yōu)勢均非常明顯。3)在數(shù)據(jù)量比較小,尤其是NetCDF3.6下100Gb以下的業(yè)務(wù)場景,遷移到NetCDF4版本下,程序性能提升不明顯。本研究結(jié)合實驗,測試了NetCDF4的連續(xù)存儲與分塊存儲的功能,通過實驗了解了NetCDF4的新特性。測試結(jié)果表明,全面使用NetCDF4替代NetCDF3的數(shù)值預(yù)報產(chǎn)品是可行的,即使簡單地使用NetCDF4替代原有NetCDF3的編譯庫,都會顯著提升程序的性能。這也是未來半年內(nèi)“廣東省氣象數(shù)值預(yù)報平臺”的主要工作方向。

參考文獻:

[1]楊國杰,沙天陽,程正泉,等.2013年歐洲中心臺風(fēng)集合預(yù)報的檢驗[J].廣東氣象,2014,36(2):1-5.

[2]程正泉,廖代強.?dāng)?shù)值天氣預(yù)報模式產(chǎn)品在預(yù)報業(yè)務(wù)中的應(yīng)用[J].廣東氣象,2012,34(4):1-5.

[3]鄢俊一.GRAPES中尺度模式的廣東定量降水預(yù)報檢驗[J].廣東氣象,2012,34(5):35-39.

[4]曹春燕,江崟.歐洲數(shù)值預(yù)報產(chǎn)品在深圳2次強降溫預(yù)報中的釋用[J].廣東氣象,2007,29(1):25-26.

[5]王剛,孫周軍,吳映,等.基于IDEA數(shù)據(jù)平臺的海珠城市生態(tài)氣象綜合系統(tǒng)建[J].廣東氣象,2016,38(2):77-80.

[7]查石祥.NetCDF數(shù)據(jù)的編程式訪問[J].氣象科技,2004,32(增刊):40-43.

[10]王永韜,劉良明.HDF5格式特點及其對遙感數(shù)據(jù)格式標(biāo)準(zhǔn)化的幾點啟示[J].國土資源遙感,2005,65(3):39-43.

[11]沈衛(wèi)超,曹立強,夏芳,等.面向數(shù)值模擬數(shù)據(jù)的HDF5性能優(yōu)化[J].計算機研究與發(fā)展,2012,49(增刊):314-318.

作者:楊玉紅 侯靈 鄭曉志 張永華 單位:廣東省氣象探測數(shù)據(jù)中心

主站蜘蛛池模板: 欧美极度极品另类| 被cao的合不拢腿的皇后| 女人张开腿等男人桶免费视频 | 精品区卡一卡2卡三免费| 国产卡一卡二卡3卡4乱码| 18精品久久久无码午夜福利| 天天综合色一区二区三区| 中文字幕在线日韩| 日本高清中文字幕在线观穿线视频| 亚洲伊人久久精品| 毛片免费在线播放| 免费久久一级欧美特大黄| 美女福利视频一区二区| 国产亚洲美女精品久久久2020| jizzjizz视频| 国产美女在线一区二区三区| a级毛片毛片免费观看久潮喷 | 视频黄页在线观看| 国产欧美日韩一区二区三区在线| 91不卡在线精品国产| 天天爽夜夜爽夜夜爽精品视频| 中国老熟妇xxxxx| 日本在线|中文| 久草视频在线资源站| 欧美在线观看免费一区视频| 亚洲精品在线免费观看| 猫咪免费人成在线网站 | av色综合网站| 妖精视频一区二区三区| 中文字幕aⅴ人妻一区二区| 日本中文字幕在线视频| 久久精品免费全国观看国产| 欧美、另类亚洲日本一区二区| 亚洲日韩国产欧美一区二区三区| 特黄特色大片免费播放路01| 免费日韩三级电影| 精品人妻系列无码天堂| 午夜视频高清在线aaa| 美女被免费网站视频九色| 国产一区二区三区精品视频 | 被公连续侵犯中文字幕|