美章網 資料文庫 統計分析的許可回收規則定義范文

統計分析的許可回收規則定義范文

本站小編為你精心準備了統計分析的許可回收規則定義參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。

統計分析的許可回收規則定義

摘要:

針對許可回收規則中特征項和閾值的選取缺少定量分析的模型和方法的問題,本文在形式化定義參數模型的基礎上,綜合使用差分編碼、信息熵和相關矩陣等統計分析方法描述特征敏感性和相關性,并提出了敏感突出、代價最小化、趨零一致性和翻倍穩定原則,以篩選特征項、界定閾值。根據用戶使用企業級軟件的數據,該方法能夠從多個候選項中,選定CPU利用率作為許可回收規則唯一的特征項,并設定閾值為8%,判定時間間隔為1136s。實驗結果表明,該方法簡單有效,而且易于編程實現。

關鍵詞:

特征選擇;統計分析;規則定義;熵;相關系數

企業中的專業軟件許可是一種價格昂貴且數量有限的重要資源,因此如何有效監控、回收“占而不用”的許可資源,降低許可應用成本,成為企業必須面對的一個現實問題。傳統的軟件許可管理是基于Flexnet軟件的集中式管理方法[1-2],最近幾年,一種許可證動態控制技術[3-4]逐漸在企業級軟件的應用環境中部署使用。它通過在客戶端安裝插件,定時采集、分析CPU、網絡IO、鍵盤/鼠標動作等特征,基于預定義的回收規則,判斷許可的使用狀態,主動釋放“占而不用”的許可,能夠有效減少管理員的參與。其邏輯處理流程如圖1所示。此外,隨著云計算、網格計算的應用實踐不斷深入,許可證的授權管理機制[5-6]和云環境中軟件許可的管理[7-8]也逐漸成為研究的熱點。

但是,文獻[1-2]采用的方法管理員無法獲知用戶的實際使用狀態,在許可不夠用時,只能人工強制回收許可。文獻[3-4]缺少對回收規則定義的定量規定,需要管理員根據經驗設置;而且這種方式沒有考慮特征項的顯著性,以及特征項之間的相關性,所以會導致采集數據的大量冗余,進而影響分析的性能。因此,研究回收規則中特征項和閾值定義方法的重要性就日益凸顯。本文在形式化定義參數模型的基礎上,綜合使用差分編碼、信息熵和相關矩陣等統計分析方法,描述特征的敏感性和相關性,并提出了“敏感突出原則”、“代價最小化原則”、“趨零一致性原則”和“翻倍穩定原則”,用于特征項篩選和閾值界定。

1參數建模

定量統計分析方法的基礎是建立形式化的參數模型。下面依次給出了假設、參數形式化和數據預處理的形式化定義,并說明了其實際含義。

1、1假設設定假設條件有利于降低建模復雜度,是形式化建模、分析的基礎。四條基本的假設為:(1)企業級應用軟件占用的本地硬件資源,會隨著軟件的運行而變化;(2)用戶可隨機使用軟件;(3)采樣間隔為8s,能夠準確反映特征值的變化;(4)統計分析間隔是采樣間隔的整數倍,記為N倍。假設(1)是根據客戶端硬件資源使用情況,判斷許可使用狀態的最基本的前提條件;假設(2)指出了用戶操作之間的獨立性,進而可以推導出采樣點之間,以及統計分析點之間是獨立的;假設(3)、(4)簡化了采樣、統計的計算,使程序易于實現。因此,根據一個統計分析點,就可以確定出許可的當前狀態。

1、2參數形式化定義根據前面的假設,對涉及的概念進行了抽象,給出了形式化的定義:

1、3預處理針對連續型數值,比如:網絡IO,由于統計流量不可避免的誤差,需要定義一個誤差區間,這里選取波動范圍是±0.5。經過區間限定,連續型數值退化為離散型數值。

2特征統計分析

2、1特征敏感性分析本文借鑒了差分編碼和信息熵[10-12]的思想,通過信息熵衡量特征項的變化程度。特征敏感性分析包括三步:首先記錄相鄰采樣點的特征值的絕對變化。最后,根據“敏感突出原則”,選擇H(D(i))的候選特征項。根據假設(1),特征項應該對應用軟件運行狀態的變化反應快速,而且差異顯著。根據實踐經驗,這里選擇H(D(i))的閾值為1。“敏感突出原則”正是基于該條件,對候選特征項進行過濾。

2、2特征相關性分析特征項之間的相關性分析是降維的一個基本方法,本文采用Pearson相關性分析方法[13-16],衡量特征項之間線性相關性的強弱。值得注意的是,奇異點對相關性影響很大[17]。因此,首先要過濾奇異點,這里奇異點集合簡單定義。如果P(V(i)=0|V(j)=0)>0.6,表示cfi,cfj在零值處的變化具有很強的一致性。根據假設(1),如果特征值為0,也就意味著該硬件資源空閑,用戶沒有與應用軟件交互。所以,即使cfi,cfj在相關性上表現不強,只要二者具有趨零的特性,仍然可以認為cfi,cfj在判斷空閑狀態上,具有較強的“相關性”。

2、3閾值選擇在統計分析間隔時間內,如果存在特征值大于下限,那么回收規則判斷該軟件狀態為“活躍”,這意味著有交互或者后臺任務;否則判定為“空閑”狀態。

3實驗驗證

為了驗證2中的統計分析方法,本文對單一用戶一天中(10:04:35~17:34:38)的工作狀態進行監控。該用戶通過Xmanager軟件遠程登錄應用服務器,操作GeoFrame企業版軟件。實驗選取4個典型的候選特征項,見表1。需要注意的是如果用戶直接使用本地的應用軟件,則需要監控本地磁盤IO,而不是網絡IO。根據21中描述的方法,首先計算候選特征的信息熵,然后根據“敏感突出原則”,選擇H(D(i))>1的候選特征,結果見表2。根據22中描述的方法,首先計算cf1,cf3,cf4之間兩兩的Pearson相關系數,并驗證雙尾顯著性,結果見表3。顯然,cf3,cf4具有顯著相關性,并且前者的統計數值偏小易于計算,根據“代價最小化原則”,選擇cf3。而cf1,cf3雖然線性相關系數不高,但是,P(V(3)=0|V(1)=0)=0.868,也就是說在CPU利用率為0時,上行網絡IO也趨于零。根據“趨零一致性原則”,二者的相關性是有價值的,進而可以使用“代價最小化原則”,選擇cf1作為回收規則中的特征項,因為從本地獲取CPU信息比循環中斷計算上行網絡IO更廉價。根據23中描述的方法,計算得到N=142,即統計分析間隔1136s,近19min;因為選的是閾值下限,所以對應的W=8。至此,可以將精煉后的許可回收規則描述為:如果在1136s的142次采樣結果中,Xmanager的CPU占用率都低于8%,則判定軟件應用空閑,需要釋放占用的許可資源。從圖2中,可以比較直觀地看到cf1,cf3,cf4在時間軸上特征值的變化趨勢。虛線表示W=8的CPU閾值,實線表示CPU利用率的變化,細點線表示IO_up的變化,頓點間隔線表示內存的變化,許可回收規則判定為軟件應用忙碌的時間點由三角形標記。可以看出以上判定規則對空閑發現是有效的,候選特征和閾值的選擇過程清晰易懂,而且算法簡單,易于編程實現。

4結語

實驗證明,許可回收規則定義時,基于統計分析的方法能夠通過定量的計算,明確候選特征項的敏感性和相關性,而本文提出的“敏感突出原則”、“代價最小化原則”、“趨零一致性原則”和“翻倍穩定原則”綜合運用后,能夠有效篩選特征項,并確定閾值。從另一方面來看,CPU、內存和IO僅僅反映了軟件自身的運行狀態,沒有考慮用戶與軟件的交互行為。下一步的研究可能需要結合用戶點擊鍵盤、鼠標的操作行為,運用統計學原理,進一步充實回收規則。但是,植入鉤子(hook)[18]采集用戶行為,不僅CPU資源開銷巨大,可能影響正常的軟件使用,而且用戶會有安全性的擔憂。

參考文獻:

[1]史明宏,唐浩FlexNetManager在大慶油田研究院軟件集中管理中的應用[J]辦公自動化,2013(4):28-30

[2]鄧莉,范德軍,孫胤航大型專業軟件集中管控技術探索與實踐[J]中國管理信息化,2014(22):93-94

[3]上海萊曼特信息科技有限公司萊曼特軟件許可證動態釋放軟件LMTlicRecycler:中國,2013SR005134[P]2013-01-16

[4]無錫云科軟件科技有限公司許可證動態控制器[EB/OL](2012-08-02)[2014-08-02]

[5]陳智聰基于浮動授權管理的許可證使用報表系統的研究與實現[D]廣州:華南理工大學,2011

[6]李美蓉軟件許可證授權管理系統的設計與實現[D]成都:電子科技大學,2011

[7]侯正雄,周興社,王云嵐,等網格環境中面向按需服務的軟件license管理方法[J]。華中科技大學學報:自然科學版,2007,35(s2):140-143

[8]王寅峰,董小社,郭華,等網格環境中軟件共享系統的License管理器[J]華中科技大學學報:自然科學版,2006,34(s1):5-8

[9]KIMM,CHENH,MUNSONJ,etalManagementbasedlicensediscoveryforthecloud[M]//ServiceOrientedComputingBerlin:Springer,2012:499-506

[10]周炯?,龐沁華,續大我,等通信原理[M],北京:北京郵電大學出版社,2005:67

[11]SHANNONCE,WEAVERWThemathematicaltheoryofcommunication[M]Urbana:UniversityofIllinoisPress,1971:1-10

[12]崔穎差分編碼關鍵技術研究[D]北京:北京郵電大學,2013

[13]李秀敏,江衛華相關系數與相關性度量[J]數學的實踐與認識:2006,36(12):188-192

[14]張宇鐳,黨琰,賀平安利用Pearson相關系數定量分析生物親緣關系[J],計算機工程與應用,2005(33):79-82

[15]丁劍潔相關性分析技術在軟件度量中的應用[J]陜西教育學院學報,2008,24(1):100-103

[16]STIGLERSMFrancisGalton'saccountoftheinventionofcorrelation[J]StatisticalScience,1989,4(2):7379

[17]NEYMANJOnthetwodifferentaspectsoftherepresentativemethod:Themethodofstratifiedsamplingandthemethodofpurposiveselection[M]//BreakthroughtsinStatisticsNewYork:Springer,1992:123-150

[18]倪步喜Windows的鉤子技術及實現[J]計算機與現代化,2007(1):28-30

作者:孫劍 楊澎濤 張媛 單位:勝利油田物探研究院計算室 勝利油田中心醫院

主站蜘蛛池模板: 久久久久久a亚洲欧洲AV冫| 你懂得的在线观看免费视频| 六月婷婷中文字幕| 大香伊蕉国产av| 中文字幕欧美日韩在线不卡| 明星女友开挂吧电视剧在线观看| 亚洲理论电影在线观看| 精品人妻伦一二三区久久| 国产亚洲综合成人91精品| 亚洲自国产拍揄拍| 国产香蕉97碰碰视频VA碰碰看| yellow2019电影在线高清观看| 无码一区二区三区免费| 久久综合九色综合97伊人麻豆| 欧美性大战久久久久久| 亚洲精品福利视频| 白嫩少妇激情无码| 四虎在线永久精品高清| 野花社区在线播放| 国产成人三级视频在线观看播放| 1024香蕉视频| www.尤物视频| 成人区人妻精品一区二区不卡 | 女人18毛片a级毛片免费视频| 中文字幕人成无码人妻| 日本乱码一卡二卡三卡永久| 乱中年女人伦av三区| 欧美中文字幕在线| 亚洲日韩乱码中文无码蜜桃| 激情图片在线视频| 免费一区二区三区四区| 精品国产日韩亚洲一区| 嗯啊h客厅hh青梅h涨奶| 色欲香天天天综合网站| 国产人成视频在线观看| 麻豆波多野结衣| 国产换爱交换乱理伦片| 天天躁夜夜躁狂狂躁综合| 国产精品久久久久久久福利院 | 日韩色图在线观看| 国产精品欧美一区二区|