本站小編為你精心準(zhǔn)備了證據(jù)權(quán)重方法與信用風(fēng)險論文參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
1經(jīng)典邏輯回歸
給出企業(yè)的真實數(shù)據(jù)格式(整理后的財務(wù)報表數(shù)據(jù)),如表1所示,其中違約標(biāo)志一欄為響應(yīng)變量Y,0表示正常,1表示違約,xij,i=1,…,n,j=1,…,m表示第i個客戶的第j個指標(biāo)數(shù)值。首先要介紹經(jīng)典的線性回歸。假設(shè)響應(yīng)變量為向量Yn×1,n為樣本個數(shù);設(shè)計矩陣為Xn×(m+1),m+1表示常數(shù)列以及m個變量(表1)。將常數(shù)列放在X的第一列,經(jīng)典的線性回歸具有如下表達:該式即為經(jīng)典的邏輯回歸模型。其中求解關(guān)鍵未知參數(shù)β的簡單而直接的方法是根據(jù)極大似然估計(利用式(2)寫出似然函數(shù)繼而利用NewtonRaphson方法求解極大值點[4])。經(jīng)典邏輯回歸相關(guān)理論已經(jīng)比較成熟并且已經(jīng)用到實際風(fēng)險評級模型中,相關(guān)的結(jié)果可參考文獻[2]。
在實際的風(fēng)險評級模型中,經(jīng)典邏輯回歸模型有著諸多缺陷。首先變量個數(shù)m過大,例如在下一節(jié)做的真實數(shù)據(jù)中m=147,于是需要在建立邏輯回歸模型之前做變量選擇的工作,而變量選擇一直是統(tǒng)計學(xué)中的難題[1];其次,在邏輯回歸模型中,假定中間變量θ與設(shè)計矩陣X呈線性關(guān)系即θ=Xβ,這一假設(shè)在實際中也并不是都滿足的。再次,對于實際的風(fēng)險評級模型,往往真實數(shù)據(jù)的采集質(zhì)量比較差(設(shè)計陣不可逆、變量方差過小或者過大等)導(dǎo)致模型偏差較大,甚至無法建立模型,需要新的手段來解決這些問題。在風(fēng)險評級模型中,我們實際上更關(guān)心的是違約樣本分布與正常樣本分布之間的距離,于是利用信息論中相對熵的思想,證據(jù)權(quán)重方法(weightofevidence)與經(jīng)典邏輯回歸結(jié)合,設(shè)計了證據(jù)權(quán)重邏輯回歸模型,用以估計違約概率。
21信息價值與證據(jù)權(quán)重在這一小節(jié)中,介紹信息論中熵、相對熵與信息價值的概念,并且借此引出證據(jù)權(quán)重(weightofevidence)的定義。實際上,證據(jù)權(quán)重的概念是Good正式提出的[5],用來處理假設(shè)檢驗問題。而真正應(yīng)用到風(fēng)險評級模型中,則是近年來國際主流評級模型的發(fā)展方向[2]。對于連續(xù)隨機變量X,密度函數(shù)為f(x),熵的定義為對于風(fēng)險評級模型,基于相對熵判別能力的測量工具是信息價值(informationvalue),用以刻畫違約樣本分布和正常樣本分布的差異[56]。對于某個特定的變量,將對應(yīng)違約樣本密度函數(shù)記為fD;該變量正常樣本密度函數(shù)記為f珚D。信息價值定義為違約樣本對應(yīng)于正常樣本的相對熵與正常樣本對應(yīng)于違約樣本相對熵之和[2],即從式(5)可知,信息價值的取值范圍為[0,∞)。按照定義,信息價值刻畫的是正常樣本與違約樣本分布之間的差異,對于選定的變量,為了得到具有高的判別能力的風(fēng)險評級模型,該變量的信息價值應(yīng)當(dāng)盡可能的大。信息價值越高,說明該變量對于樣本違約與否的判別能力越強。而信息價值與響應(yīng)變量(違約與否)的相關(guān)關(guān)系[5]如表2所示,此外根據(jù)信息價值可以變量選擇,將信息價值足夠大(如>03)的變量引入邏輯回歸模型,而舍棄那些信息價值偏?。▽τ跇颖具`約與否,幾乎沒有判別能力)的變量。即正常樣本與違約樣本對數(shù)似然函數(shù)的差。為使信息價值即式(5)達到最大,我們希望WOE值與該選定變量的原始數(shù)據(jù)呈單調(diào)關(guān)系,即該變量x數(shù)值越大,則對應(yīng)WOE值單調(diào)變化(越大或者越?。4送?,這種單調(diào)關(guān)系,同時反映了該變量對于違約與否的判別能力。定義式(6)反映了正常樣本與違約樣本對數(shù)似然函數(shù)的差,于是該選定變量WOE值的增加意味著違約概率的降低。利用單調(diào)的WOE值作為新的設(shè)計陣代入經(jīng)典邏輯回歸,能夠克服本節(jié)一開始討論的第二個經(jīng)典模型的困難,即中間變量θ與原始數(shù)據(jù)可能并非線性。
22算法在實際風(fēng)險評級模型中,考慮第j個變量即設(shè)計矩陣X的第j列X•j=[x1j,x2j,…,xnj]T,響應(yīng)變量yi=0或1,i=1,…,n表示第i個樣本的實際違約情況。證據(jù)權(quán)重邏輯回歸的算法可以歸納如下,(1)將原始連續(xù)數(shù)據(jù)離散化,尋找第j個變量的最優(yōu)劃分,并計算信息價值。具體來說,將X•j按照升序排序,記為X(•j)=[X(1,j),…,X(n,j)]T。假設(shè)希望將X(•j)分成k個區(qū)間(即尋找k-1個分點)且找到的分點必須使得WOE值為單調(diào)序列。若不存在這樣的劃分,則舍棄該變量;若存在多個這樣的劃分,則選取使得信息價值最大的劃分方式(即最優(yōu)化分)。設(shè)Gi、Bi分別表示該變量第i個區(qū)間的正常、違約樣本個數(shù),G、B表示全部的正常、違約樣本個數(shù),則由式(5)和(6)可得相應(yīng)的樣本估計形式為。在實際風(fēng)險評級模型中,區(qū)間個數(shù)k依賴于經(jīng)驗,建議取8~10。(2)根據(jù)信息價值(IV)的大小選取變量。選取第一步中信息價值較大的變量(如IV>03);舍棄信息價值較小的變量。(3)將選取變量對應(yīng)的WOE值作為新的設(shè)計陣,代入經(jīng)典邏輯回歸模型。利用經(jīng)典模型中的方法解決選取變量間可能存在的多重共線性問題[7],計算違約概率并給出相關(guān)統(tǒng)計推斷(系數(shù)的極大似然估計和置信區(qū)間等)。
3真實數(shù)據(jù)分析
這一節(jié)將結(jié)合某商業(yè)銀行真實的近兩年來的制造業(yè)數(shù)據(jù),給出上述證據(jù)權(quán)重邏輯回歸算法的應(yīng)用。通過與經(jīng)典邏輯回歸模型作比較,來驗證證據(jù)權(quán)重邏輯回歸模型的功效。數(shù)據(jù)格式如表1所示,其中違約企業(yè)為60個,正常企業(yè)240家,涉及的財務(wù)指標(biāo)為147個,即該訓(xùn)練模型設(shè)計陣Xn×(m+1),n=300,m=147。此外,我們選取另外150家企業(yè),30條違約樣本、120條正常樣本作模型功效檢測。在算法第一步中,取區(qū)間數(shù)為8,計算信息價值與WOE值,選取了10個變量(權(quán)益乘數(shù)、流動負債率、全部資產(chǎn)現(xiàn)金回收率、現(xiàn)金流量凈值、固定資產(chǎn)成新率、盈利能力、現(xiàn)金比率、資本化資金充足率、(應(yīng)收票據(jù)+應(yīng)收款)/(應(yīng)付票據(jù)+應(yīng)付款)、保守速動比率)進入經(jīng)典邏輯回歸模型。繼而利用經(jīng)典模型相應(yīng)結(jié)果(參數(shù)估計與假設(shè)檢驗等),計算違約概率(PD)、正常樣本與違約樣本違約概率的累計分布函數(shù)曲線、訓(xùn)練樣本和檢測樣本的功效曲線(ROC曲線)[1]如圖1~4所示。從違約概率分布來看,證據(jù)權(quán)重邏輯回歸模型很好的將正常樣本(實線)與違約樣本(虛線)分開,且大多數(shù)的正常樣本的違約概率估計值遠小于違約樣本的違約概率估計值。從ROC曲線功效來看,無論是訓(xùn)練模型還是檢測模型,結(jié)合證據(jù)權(quán)重的邏輯回歸方法的功效(實線)都要明顯的高于經(jīng)典邏輯回歸方法的功效(虛線)。此外,若取02為分界點(即若樣本違約概率>02,認(rèn)為該樣本違約,02是正常樣本違約概率分布密度與違約樣本違約概率分布密度交點,如圖1~4。且從圖中可以看出,選取02作為閾值可以對違約客戶有較好的識別,若選另外兩個曲線交點為閾值則對違約客戶誤判升高),該模型對于訓(xùn)練樣本的辨識度如表3所示。特別地,對于違約客戶的辨識高達88%。而對于檢測樣本,辨識度如表4所示,對于違約客戶的辨識達83%。
4結(jié)束語
本文將信息論中的證據(jù)權(quán)重方法與經(jīng)典的邏輯回歸相結(jié)合,應(yīng)用于國內(nèi)商業(yè)銀行的真實數(shù)據(jù)并且建立了信用風(fēng)險評級模型,此外通過比較經(jīng)典邏輯回歸模型,驗證了證據(jù)權(quán)重邏輯回歸方法的功效與可行性。且該模型在國內(nèi)多家商業(yè)銀行已經(jīng)成功上線,使得評級模型對違約概率有了精準(zhǔn)的刻畫。
作者:甘信軍楊維強單位:山東大學(xué)數(shù)學(xué)學(xué)院山東大學(xué)金融研究院