本站小編為你精心準備了醫學統計分析方法選擇探討參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
醫學統計是進行醫學研究的重要工具,被廣泛地應用于實驗設計、資料收集及數據分析等方面,正確應用統計學方法對有效開展科學研究和提高醫學科技論文學術質量有著極其重要的意義和作用[1]。統計學的基本方法一般不難掌握,但是能否正確運用仍是較普遍的問題。為幫助廣大醫務工作者提高統計分析水平,本文將介紹醫學論文中常用統計分析方法的選擇原則及應用過程中的注意事項。
1t檢驗
t檢驗是英國統計學家W.S.Gosset1908年根據t分布原理建立起來的一種假設檢驗方法,常用于計量資料中2個小標本均數的比較。理論上,t檢驗的應用條件是要求標本來自正態分布的總體,兩標本均數比較時,還要求兩總體方差相等。但在實際工作中,與上述條件略有偏離,只要其分布為單峰且近似正態分布,也可應用[2]。
常用的t檢驗有如下3類:(1)單個標本t檢驗:用于推斷標本均數代表的總體均數和已知總體均數有無統計學意義。當標本例數較少(n<60)且總體標準差未知時,選用t檢驗;反之當標本例數較多或標本例數較少、總體標準差已知時,則可選用u檢驗[3]。(2)配對標本t檢驗:適用于配對設計的兩標本均數的比較,在選用時應注意兩標本是否為配對設計資料。常用的配對設計資料主要有如下3種情況:兩種同質受試對象分別接受兩種不同的處理;同一受試對象或同一標本的2個部分,分別接受不同的處理;同一受試對象處理前后的結果比較。(3)兩獨立標本t檢驗:又稱成組t檢驗,適用于完全隨機設計的兩標本均數的比較。與配對t檢驗不同的是,在進行兩獨立標本t檢驗之前,還必須對兩組資料進行方差齊性檢驗。若為小標本且方差齊,則選用t檢驗;反之若方差不齊,則選用校正t檢驗(t′檢驗),或采用數據變換的方法(如取對數、開方、倒數等)使兩組資料具有方差齊性后再進行t檢驗,或采用非參數檢驗[4]。此外,當兩組標本例數較多(n1、n2>50)時,這時應用t檢驗的計算比較繁瑣,可選用u檢驗[5]。
2方差分析
方差分析適用于兩組以上計量資料均數的比較,其應用條件是各組資料取自正態分布的總體且各組資料具有方差齊性。因此,在應用方差分析之前,同樣和成組t檢驗一樣需要對各組資料進行正態性檢驗、方差齊性檢驗。
常用的方差分析有如下幾類:(1)完全隨機設計的方差分析:主要用于推斷完全隨機設計的多個標本均數所代表的總體均數之間有無顯著性差別。完全隨機設計是將觀察對象隨機分為兩組或多組,每組接受一種處理,形成2個或多個標本。
(2)隨機區組設計的方差分析:隨機區組設計首先是將全部受試對象按某種或某些特性分為若干區組,然后區組內的每個研究對象接受不同的處理,通過這種設計,既可以推斷處理因素又可以推斷區組因素是否對試驗效應產生作用。此外,由于這種設計還使每個區組內研究對象的水平盡可能地相近,減少了個體間差異對研究結果的影響,比成組設計更容易檢驗出處理因素間的差別。(3)析因設計的方差分析:將2個或2個以上處理因素的各種濃度水平進行排列組合、交叉分組的試驗設計。它不僅可以檢驗每個因素各水平之間是否有差異,還可以檢驗各因素之間是否有交互作用,同時還可以找到處理因素的各種濃度水平之間的最佳組合。此外,還有正交設計、拉丁方設計等多種方差分析法,實驗者在應用時可以參考相關的統計學著作。
目前,某些醫學論文中有這樣的情況,就是用t檢驗代替方差分析對實驗數據進行統計學處理,這是不可取的。t檢驗只適用于推斷2個小標本均數之間有無顯著性差別,而采用t檢驗對多組均數進行兩兩比較,會增加犯I型錯誤的概率,即可能把本來無差別的2個總體均數判為有差別,使結論的可信度降低[6]。對多個標本均數進行比較時,正確的方法是先進行方差分析,若檢驗統計量有顯著性意義時,再進行多個標本均數的兩兩(多重)比較。
3χ2檢驗
χ2檢驗是一種用途比較廣泛的假設檢驗方法,但是在醫學論文中常用于分類計數資料的假設檢驗,即用于2個標本率、多個標本率、標本內部構成情況的比較,標本率與總體率的比較,某現象的實際分布與其理論分布的比較。但是當標本滿足正態近似條件時,如標本例數n與標本率p滿足條件np與n(1-p)均大于5,則可以計算假設檢驗統計量u值來進行判斷[5]。
常用的χ2檢驗分為如下幾類:(1)2×2表χ2檢驗。適用于2個標本率或構成比的比較,在應用時,當整個試驗的標本例數n≥40且某個理論頻數1≤T<5時,需對χ2值進行連續性校正。因為T值太小,會導致χ2值增大,易出現假陽性結論。此外,若標本例數n<40,或有某個T值小于1,此時即使采用校正公式計算的χ2值也有偏差,需要用2×2表χ2檢驗的確切概率檢驗法(Fisher確切檢驗法)。(2)配對資料χ2檢驗。適用于配對設計的2個標本率或構成比的比較,即通過單一標本的數據推斷兩種處理結果有無顯著性差別。在應用時,如果甲處理結果為陽性而乙處理結果為陰性的標本例數n1與甲處理結果為陰性而乙處理結果為陽性的標本例數n2之和<40,需要對計算的χ2值進行校正。(3)R×C表χ2檢驗。適用于多個標本率或構成比的比較。在R×C表χ2檢驗中,若檢驗統計量有顯著性意義時,還需要對多個標本率或構成比進行兩兩比較,即分割R×C表,使之成為非獨立的四格表,并對每兩個率之間有無顯著性差別作出結論。
2×2表資料在應用時可分為如下幾種類型:橫斷面研究設計的2×2表資料、隊列研究設計的2×2表資料、病例-對照研究設計的2×2表資料、配對研究設計的2×2表資料。研究者應注意不同類型的2×2表資料的統計分析方法略有差別,比如在分析隊列研究設計的2×2表資料時,如果用χ2公式計算得到P<0.05,研究者則應再計算相對危險度(RR)并檢驗總體RR與1之間的差異是否具有統計學意義[7]。
此外,在進行R×C表χ2檢驗時,還有如下2個主要的注意事項:首先,T值最好不要小于5,若有1/5的T值小于5,χ2檢驗結論是不可靠的,解決的辦法有3種:增大標本量;刪去T值太小的行和列;將T值太小的行或列與性質相近的鄰行或鄰列的實際頻數合并[2,8]。其次,不同類型的R×C表資料選擇的統計分析方法是不一樣的。(1)雙向無序的R×C表資料:可以選用一般的χ2公式計算。(2)單向有序的R×C表資料:如果是原因變量為有序變量的單向有序R×C表資料,可以將其視為雙向無序的R×C表資料而選用一般的χ2檢驗公式計算,但如果是結果變量為有序變量的單向有序R×C表資料,選用的統計分析方法有秩和檢驗、Radit分析和有序變量的logistic回歸分析等。(3)雙向有序且屬性不同的R×C表資料:對于這類資料采用的統計分析方法不能一概而論,應根據研究者的分析目而合理選擇。如果研究者只關心原因變量與結果變量之間的差異是否具有統計學意義時,此時,原因變量的有序性就顯得無關緊要了,可將其視為結果變量為有序變量的單向有序R×C表資料進行分析。如果研究者希望考察原因變量與結果變量之間是否存在線性相關關系,此時需要選用處理定性資料的相關分析方法如Spearman秩相關分析方法等。如果兩個有序變量之間的相關關系具有統計學意義,研究者希望進一步了解這兩個有序變量之間的線性關系,此時宜選用線性趨勢檢驗。如果研究者希望考察列聯表中各行上的頻數分布是否相同,此時宜選用一般的χ2公式計算。(4)雙向有序且屬性相同的R×C表資料:這類資料實際上就是配對設計2×2表資料的延伸,在分析這類資料時,實驗者的目的主要是研究兩種處理方法檢測結果之間是否具有一致性,因此常用的統計分析方法為一致性檢驗或Kappa檢驗。
4非參數檢驗
非參數檢驗可不考慮總體的參數、分布而對總體的分布或分布位置進行檢驗。它通常適用于下述資料[2]:(1)總體分布為偏態或分布形式未知的計量資料(尤其標本例數n<30時);(2)等級資料;(3)個別數據偏大或數據的某一端無確定的數值;(4)各組離散程度相差懸殊,即各總體方差不齊。該方法具有適應性強等優點,但同時也損失了部分信息,使得檢驗效率降低。即當資料服從正態分布時,選用非參數檢驗法代替參數檢驗法會增大犯Ⅱ類錯誤的概率。因此,對于適用參數檢驗的資料,最好還是用參數檢驗。
秩和檢驗是最常用的非參數檢驗,它包括以下幾類[2,5]:(1)配對資料的符號秩和檢驗(Wilcoxon配對法):是配對設計的非參數檢驗。當n≤25時,可通過秩和檢驗對實驗資料進行分析;當n>25時,標本例數超出T界值表的范圍,可按近似正態分布用u檢驗對實驗資料進行分析。(2)兩標本比較的秩和檢驗(WilcoxonMann-Whitney檢驗):適用于比較兩標本分別代表的總體分布位置有無差異。如果標本甲的例數為n1,標本乙的例數為n2,且n1<n2;當n1≤10、n2-n1≤10時,可通過兩標本比較的秩和檢驗對實驗資料進行分析;當n1、n2超出T界值表的范圍時,同樣可按近似正態分布用u檢驗對實驗資料進行分析。(3)多個標本比較的秩和檢驗(WilcoxonKruskal-Wallis檢驗):適用于比較各標本分別代表的總體的位置有無差別,它相當于單因素方差分析的非參數檢驗,計算方法主要有直接法和頻數表法等。此外,在進行上述3類秩和檢驗(前兩類秩和檢驗實際上已經被u檢驗替代)時,如果相同秩次較多,則需要對計算的檢驗統計量進行校正。