美章網(wǎng) 資料文庫 混沌解調的蒙特卡羅仿真范文

混沌解調的蒙特卡羅仿真范文

本站小編為你精心準備了混沌解調的蒙特卡羅仿真參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。

《計算機仿真雜志》2014年第六期

1混沌解調原理

1.12FSK信號混沌解調方法在微弱信號檢測領域應用較為廣泛的Holmes型Duffing方程標準形式如下:當參數(shù)ω,δ確定后,策動力幅值γ逐漸由0增大的過程中,系統(tǒng)相軌跡(x,y)將歷經(jīng)同宿軌道、分叉、混沌軌跡、臨界狀態(tài),最后進入大尺度周期狀態(tài)。在微弱信號檢測中主要利用的是臨界混沌狀態(tài)和大尺度周期狀態(tài)。利用Duffing振子弱信號檢測模型實現(xiàn)對受噪聲干擾的2FSK信號的檢測主要是依據(jù)在碼元傳輸周期內,接收端接受的信號是固定頻率的弱信號,由混沌相變判別方法可知:當載波信號與策動力同頻同相時,Duffing系統(tǒng)將處于大周期狀態(tài),載波頻率與策動力不同時,系統(tǒng)將處于混沌狀態(tài)。這樣,當2FSK的信號在0和1之間跳變時,對應的是Duffing系統(tǒng)在混沌態(tài)和大尺度周期態(tài)之間的轉換。式(3)是用于對2FSK信號進行檢測的Duffing振子弱信號檢測系統(tǒng),S(t)是待測2FSK信號,n(t)為加性噪聲,γd為檢測系統(tǒng)的臨界閾值。利用Duffing振子實現(xiàn)2FSK信號的解調主要在于對系統(tǒng)狀態(tài)的判別,具有量化指標的數(shù)值判別方法是使得該弱信號檢測技術在通信信號解調中運用的關鍵。本文采用工程實踐中常用的過零周期數(shù)算法作為相變判別算法實現(xiàn)混沌檢測的并行蒙特卡羅仿真程序設計。

1.2ZCN相變判別標準過零周期數(shù)(Zero-crossingnumber,ZCN)算法是基于大尺度周期狀態(tài),系統(tǒng)相軌跡收斂于一條確定軌跡,過零周期數(shù)恒定,混沌狀態(tài)下,系統(tǒng)相軌跡沒有確定軌跡,過零周期數(shù)沒有穩(wěn)定的數(shù)值且小于大尺度周期狀態(tài)的過零周期數(shù)[9]。圖1所示是在仿真時間為0.005s,k=0.5,ω=(2π×60000)rad/s時的過零周期數(shù)變化圖。在混沌狀態(tài),系統(tǒng)過零周期數(shù)呈現(xiàn)大幅度波動狀態(tài),當系統(tǒng)進入大尺度周期狀態(tài),系統(tǒng)過零周期數(shù)將處于一個穩(wěn)定水平。在數(shù)值求解系統(tǒng)微分方程的同時,通過記錄過零周期數(shù)即可快速判斷系統(tǒng)混沌和大尺度周期狀態(tài)。由以上分析可以看出混沌解調技術主要是將碼元周期內的傳輸信號作為待測信號,通過數(shù)值求解Duffing方程,計算量化相變指標,實現(xiàn)對信號的判別,從而達到解調的目的。在傳統(tǒng)的CPU平臺上進行蒙特卡羅仿真時,由于求解Duff-ing方程和相變判別過程需要大量迭代運算,時間和計算資源消耗巨大,造成了仿真時間效率較低。但對每一個碼元而言,該混沌解調過程是獨立的,因此通過合理的規(guī)劃GPU內核函數(shù)的存儲空間及線程分布,可以實現(xiàn)在GPU平臺上的混沌解調并行蒙特卡羅仿真,提高仿真時間效率。

2混沌解調的并行蒙特卡羅仿真方法

2.1并行蒙特卡羅仿真模型利用GPU實現(xiàn)對通信信號的蒙特卡羅仿真,主要是通過其SIMT(單指令多線程)執(zhí)行模型并發(fā)實現(xiàn)多線程碼元并行解調。考慮到GPU的片上存儲單元十分有限,通過AWGN信道的調制信號無法存儲到片上存儲器中,同時若存儲在片外存儲器中,在核函數(shù)的每次迭代調用時都需要訪問片外存儲器,會帶來巨大的存儲器訪問延時,GPU高性能計算的優(yōu)勢無法充分發(fā)揮。因此,并行蒙特卡羅仿真模型中將2FSK調制與AWGN信道的信源部分仿真也置于GPU核函數(shù)中實現(xiàn)。在Duffing振子迭代求解的每一步中將該時刻運算所需的2FSK信號和隨機噪聲產(chǎn)生出來并疊加生成此刻的待檢測信號。其仿真流程圖如圖2所示。該模型將調制解調中計算密集型的工作全部分配到GPU中完成,并充分利用了GPU的片上存儲單元,使GPU的并行處理能力得到了充分的發(fā)揮。

2.2混沌解調的GPU核函數(shù)程序設計并行混沌解調模型以GPU的計算核心作為解調的基本單元,在蒙特卡羅仿真中每一個計算核心單元對應于一個待解調碼元。CUDA架構下的GPU核函數(shù)是單指令多線程并發(fā)執(zhí)行的[10-11],保證了碼元的并發(fā)解調。該過程的實現(xiàn)關鍵在于GPU解調核函數(shù)的設計。式(4)所示為基于Duffing振子的2FSK解調模型的離散化迭代模型,其中D為噪聲單邊功率譜密度,ε(t)為服從標準高斯分布的隨機數(shù),S2FSK(j)是每一步迭代過程中的待測信號。1)存儲器的分配在設計求解Duffing方程數(shù)值解的核函數(shù)時,由式(4)可以知道,核函數(shù)中迭代求解過程需要分配存儲空間的變量主要有{x,y}以及系統(tǒng)參數(shù)γd{,ω,k,D}等。由于沒有線程間的通信,因此選取寄存器變量存儲效率最高。同時考慮到在迭代求解Duffing方程過程中對數(shù)值解{x,y}進行存儲,其存儲規(guī)模會比較大,但在相變判別時只需對每一步的過零點進行判斷計數(shù),因此無需存儲中間解,所以選擇xj,xj+1,yj,yj{}+1四個寄存器變量,分別存儲更新前后的系統(tǒng)數(shù)值解。這樣,從存儲器分配上而言,該核函數(shù)的數(shù)據(jù)基本通過寄存器存儲、運算,在訪問延時上時延最短,能獲得較高的運算效率。2)隨機數(shù)的產(chǎn)生由式(4)可以看出,在迭代求解的每一步中需要產(chǎn)生相應的噪聲序列。調用CURANDLibrary中隨機數(shù)種子分配核函數(shù)為每條線程分配私有的隨機數(shù)種子,其核函數(shù)形式為。該方法保證了在GPU中對碼元進行并行解調過程中,每個碼元所在的核函數(shù)將獲得唯一的隨機數(shù)種子,在每個核函數(shù)內部求解Duffing方程中每步迭代中輸入待測信號中的噪聲點是由該線程擁有的隨機數(shù)種子隨機產(chǎn)生的獨立同分布的隨機數(shù)。調用過程在主機端完成的,但設備生成隨機數(shù)是在核函數(shù)中執(zhí)行的,生成的隨機數(shù)將直接供GPU中各線程使用而無需從全局存儲器進行讀寫。3)線程的安排考慮到每個核函數(shù)需要占用一定的計算資源,并行蒙特卡羅仿真的線程安排需要考慮到存儲器資源,確定一次可以并發(fā)執(zhí)行的計算規(guī)模。同時,按照CUDA的執(zhí)行模型,線程網(wǎng)格(Grid)中的各個線程塊(Block)會被分配到GPU的各個流多處理器(SM)中執(zhí)行,實際運行中線程塊(Block)會被分割為更小的線程束(warp)。在Tesla架構的GPU中,一個線程束由32個線程組成。每個SM至少需要6個activewarp才能有效隱藏流水線延遲。所以在線程塊(Block)和線程網(wǎng)格(Grid)的維度設計上要盡量保證其數(shù)值為32的整數(shù)倍。通常在線程組織上,根據(jù)問題規(guī)模,在確定線程塊(Block)的尺寸和維度后,再確定線程網(wǎng)格(Grid)的尺寸和維度。可采用以下方法計算(以x軸為例),N為問題計算規(guī)模:。根據(jù)以上分析,可以確定2FSK信號混沌解調的并行蒙特卡羅仿真程序執(zhí)行流程如圖3所示,CPU端通過初始化設備和數(shù)據(jù),調用GPU設備分別對不同信噪比下的隨機碼元進行并行解調,將解調結果返回CPU端進一步處理得到蒙特卡羅仿真誤碼特性曲線。

3仿真及性能分析

3.1仿真環(huán)境仿真采用曙光W580工作站,配備了IntelXeon24核CPU和NVIDIATeslaC2050GPU,系統(tǒng)內存為24GB。軟件方面,采用CUDAC語言,開發(fā)環(huán)境使用VisualStdio2010。實驗中CPU串行蒙特卡羅仿真程序僅對邏輯控制語句做了必要改動,通過for循環(huán)遍歷各信噪比和檢測碼元。

3.2仿真結果及性能分析1)仿真可靠性分析結果是本文在實驗室仿真中選擇的2FSK信號參數(shù)列表。在實驗中以f1=60000Hz的信號作為Duffing檢測系統(tǒng)策動力的頻率,2FSK待測信號是具有頻差Δf=5000Hz的典型2FSK信號,其廣泛應用于通信、電力線載波通信等領域。實驗在信噪比-35dB~-15dB范圍內對106量級的隨機碼元利用GPU進行并行蒙特卡羅仿真。Duffing振子策動力幅值為0.764,積分步長為1/24000000,初始值(x,y)=(0,0)。由圖4所示的仿真曲線可以看出,在不同的計算平臺下,基于Duffing振子的2FSK信號解調誤碼率曲線大致相同,各信噪比下的誤碼率量級一致,說明利用GPU平臺實現(xiàn)解調過程的準確性與CPU平臺一致,同時仿真能夠反映出ZCN算法在2FSK信號解調中具有一定的抗噪聲性能。2)仿真時效性分析可以看出,利用GPU實現(xiàn)并行蒙特卡羅仿真的時耗要遠小于CPU的時耗,對106個碼元在信噪比-35dB~-15dB這21個信噪比下的蒙特卡羅仿真中GPU耗時約為82分鐘,而CPU在每一個信噪比下的仿真時間約為93分鐘。可見基于GPU的并行蒙特卡羅仿真較CPU串行仿真加速明顯,能實現(xiàn)高效的計算機仿真。同時,為了比較數(shù)據(jù)規(guī)模對GPU仿真時間的影響,分別在不同的數(shù)據(jù)規(guī)模下,利用CPU串行蒙特卡羅仿真和GPU并行蒙特卡羅仿真對基于Duffing振子的2FSK信號解調進行了比較實驗。其仿真條件參照表2的設置。從圖5、圖6中可以看出,在數(shù)據(jù)規(guī)模較小時,GPU并行蒙特卡羅仿真程序的時間開銷基本相同,而CPU執(zhí)行時間成線性增長。其主要原因是數(shù)據(jù)規(guī)模較小時,在GPU中執(zhí)行并行解調的碼元數(shù)目并沒有充分的占用GPU片上的全部存儲資源,使得解調的過程在多線程并行下時間消耗沒有大的差異。隨著數(shù)據(jù)規(guī)模的增加,GPU執(zhí)行時間的開銷也逐漸開始成倍數(shù)遞增,說明此時GPU上的片上存儲資源已得到充分利用,在SIMT執(zhí)行模型下,每次發(fā)射并行執(zhí)行的線程已達到最大,時間開銷隨著數(shù)據(jù)規(guī)模的遞增也成倍遞增。圖7是不同數(shù)據(jù)規(guī)模下的GPU并行蒙特卡羅仿真執(zhí)行時間的加速比,仿真顯示伴隨數(shù)據(jù)規(guī)模的增加,GPU執(zhí)行時間的加速比成遞增趨勢,在數(shù)據(jù)規(guī)模為106量級時,加速比最高可達到近24倍。但隨著數(shù)據(jù)規(guī)模的繼續(xù)增加,加速比成下降趨勢,主要原因是GPU資源已得到充分利用,繼續(xù)增加數(shù)據(jù)規(guī)模會增加數(shù)據(jù)傳遞等操作的訪問延時,使加速比下降。但可以看出相較CPU執(zhí)行時間依然可以達到較大的加速,使混沌解調的蒙特卡羅仿真快速、準確的實現(xiàn),提高了研究的仿真時間效率。

4結論

本文針對通信信號混沌解調研究中蒙特卡羅仿真計算量大、仿真時效性差的問題,將該解調問題分解為碼元間并行解調的數(shù)據(jù)并行問題,通過合理設計解調過程的核函數(shù),實現(xiàn)了基于GPU的并行蒙特卡羅仿真。仿真結果顯示,該仿真方法在106量級的數(shù)據(jù)規(guī)模下能獲得較CPU串行仿真約24倍的加速比,使實驗室仿真研究階段能夠高效地實現(xiàn)通信信號的混沌解調,為新的混沌解調算法研究奠定了基礎。

作者:陳鵬芮國勝王林張洋單位:海軍航空工程學院信號與信息處理山東省重點實驗室海軍航空工程學院電子信息工程系

主站蜘蛛池模板: 一个人看的www视频免费在线观看| 亚洲激情第二页| 黄色香蕉视频网站| 在线亚洲v日韩v| 一本大道无码人妻精品专区| 日本边添边摸边做边爱边| 亚洲国产成人久久综合一| 特级毛片视频在线| 又大又硬又黄的免费视频| 韩国v欧美v亚洲v日本v| 国产精品久久久久久久久久久搜索| bt天堂网www天堂在线观看| 成人羞羞视频国产| 久久国产小视频| 欧美一区二区三区久久综合| 亚洲精品无码久久久久AV麻豆| 精品亚洲视频在线| 四虎影院最新域名| 野花日本中文版免费观看 | 在线观看免费污视频| 一卡二卡三卡在线观看| 无码国产精品一区二区免费模式 | 亚洲欧美一区二区三区四区 | 国产精品无码专区在线观看| 99精品国产在热久久无码| 小魔女娇嫩的菊蕾| 中文字幕ヘンリー冢本全集| 无需付费看视频网站入口| 久久国产精品一国产精品| 最近中文字幕高清免费大全8| 亚洲性无码av在线| 欧美精品亚洲精品日韩1818 | 尤物视频www| 国产综合色在线视频区| 99re5在线精品视频热线| 天天摸天天躁天天添天天爽| √天堂中文在线最新版8下载| 性色av一区二区三区| 中文字幕一区二区三区有限公司| 日日摸日日碰夜夜爽97纠| 久久午夜夜伦鲁鲁片免费无码 |