本站小編為你精心準備了醫學統計方法常見問題探析參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
醫學期刊是宣傳和傳播生物醫學科研成果重任的載體,正確評價期刊來源稿件的好壞是保證期刊質量的重要一環。考量稿件質量主要是從2個方面來評價,即專業水平和統計學分析是否恰當;具有創新性、實用性和先進性是高質量論文的前提,而經準確統計學分析得出的經得起時間考驗的結論是保證[1]。在科研成果公布于眾的最后一步中,對資料的正確統計分析顯得格外重要。我們調查《蚌埠醫學院學報》2009年作者的原始稿件發現,統計學方法應用錯誤達20.40%[2]。提高醫學期刊中統計學應用的質量是一項長期而艱巨的工作,它涉及到作者、編者、審者及讀者等多個方面,需要大家共同的努力,才能逐步減少以至消除統計學誤用現象,提高醫學論文的科學性[3];為此,我們就近幾年編輯稿件中幾種常見的統計學分析方法錯誤使用案例進行辨析,以期對讀者有所幫助。
1χ2檢驗的常見誤用
1.1誤用χ2檢驗替代秩和檢驗例1稿件題目《皖北礦區嬰幼兒氣質特點調查分析》,表1為作者調查不同性別嬰幼兒氣質類型分布比較的原表。
該例作者將不同性別的嬰幼兒氣質分為易養型、中間偏易養型、中間偏難養型、難養型、發動緩慢型,這5種類型實質上是一個等級分類,從易養型到難養型,再到發動緩慢型,是結果變量(氣質類型)為有序變量的單向有序列聯表資料。要觀察此2組分布的差異,不能使用χ2檢驗,應使用成組設計兩樣本比較的秩和檢驗(Wilcoxon兩樣本比較法),得uc=1.05,P>0.05。但是,有學者會認為作者使用的方法雖然不恰當,但是結果都是一樣的,不必小題大做。實際上2×C列聯表的χ2檢驗,與結果變量的是否有序沒有關系,用χ2檢驗分析得出的結果是男女不同氣質類型的頻數是否相同,而得不出男女不同氣質類型的差異是否有統計學意義的結論。
例2稿件題目《無創機械通氣聯合硝普鈉治療急性心源性肺水腫》,作者分別采用無創機械通氣聯合硝普鈉(A組)、單純硝普鈉治療(B組)和常規治療(C組)急性心源性肺水腫患者,并統計分析3組的治療效果,見表2。由于例2是多組單向有序資料的分析,應采用成組設計多個樣本比較的秩和檢驗(Kruskal-Wallis法),得Hc=6.50,P<0.05,3組療效差異有統計學意義。
1.2誤用χ2檢驗替代四格表確切概率法例3作者觀察白細胞介素-6(IL-6)在正常卵巢組織和卵巢癌組織中的表達情況,見表3。當四格表最小理論頻數<1或n<40,宜用四格表確切概率法分析;由于本例n=30,故不能采用一般四格表χ2檢驗,應使用四格表確切概率法分析,得P=0.000。
1.3誤用χ2檢驗替代配對χ2檢驗例4稿件題目《超聲彈性成像及陰道超聲檢查在子宮頸占位性病變診斷中的對比研究》,其中一項觀察是作者應用陰道超聲聯合縱、橫切面彈性成像診斷子宮頸占位性病變,并與病理學診斷比較得出表4結果。
作者在作統計學分析時采用一般四格表資料χ2檢驗進行分析,得出差異均有統計學意義,說明陰道超聲聯合彈性成像診斷的假陽性率高。正確統計學方法是采用配對四格表χ2檢驗分析,要注意是:當b+c<40時用校正配對χ2檢驗,正如表5,得出差異均無統計學意義,說明陰道超聲聯合彈性成像診斷與病理診斷一致。
1.4誤用χ2檢驗處理相關性分析
例5作者為觀察凋亡抑制基因Livin及PTEN在卵巢上皮性癌組織中表達的相關性,作了表6統計學分析,得出卵巢上皮性癌組織中Livin與PTEN表達無相關性。作者誤用χ2檢驗分析雙向有序且屬性不同列聯表資料;而作者的意圖是分析2種基因的蛋白表達是否有相關關系,所以應用Spearman等級相關分析,得r''''s=-0.336,P<0.01,卵巢上皮性癌組織中Livin與PTEN的表達呈負相關關系的結論。
2t檢驗的常見誤用
2.1誤用兩兩t檢驗替代方差分析和q檢驗
例6《缺血性腦血管病患者同型半胱氨酸和基質金屬蛋白酶-9與頸動脈粥樣硬化的關系》一文,作者分別觀察比較了正常對照組和缺血性腦血管病患者有斑塊組及無斑塊組的同型半胱氨酸(Hcy)和基質金屬蛋白酶-9(MMP-9)水平,原稿統計學方法中采用兩兩t檢驗,見表7。
該例研究實際上是檢驗3個相互獨立樣本均數差異有無統計學意義,屬于單因素方差分析;而t檢驗只能用于2個成組樣本均數差異有無統計學意義的檢驗,故應采用單因素方差分析進行檢驗。若差異有統計學意義,則可進行多個樣本的兩兩比較,如q檢驗等。本例若直接通過t檢驗作兩兩比較,會增加犯第一類錯誤的概率α,如本例犯第一類錯誤的概率α為0.1426,比0.05大多了,所以應在方差分析的基礎上進行q檢驗,改正后見表8,還要有標記標注各組間差異有無統計學意義。
2.2誤用t檢驗替代配對t檢驗例7稿件題目《單束重建聯合脛骨嵌入重建后交叉韌帶》,作者采用Lysholm膝關節功能評分評定手術前后的膝關節功能,見表9。
本例作者采用自身對照研究,比較治療前后變化觀察療效,而錯誤地采用隨機t檢驗進行統計學處理。隨機t檢驗的應用是完全隨機設計的計量資料,是研究者觀察2樣本x±s差異有無統計學意義。配對t檢驗是適用于配對設計的計量資料,包括自身對照和配對對照研究。由于配對t檢驗最大程度地減少了個體變異對處理間變異的可能影響,用較少樣本可得較多的信息,提高了檢驗效能;但其數據處理主要是研究者對觀察對象處理前后觀察指標的差值平均數和差值標準差的處理。正確處理見表10。例8《醒腦靜治療急性腦出血的臨床觀察》一文,作者分對照組和治療組分別采用常規治療和常規治療基礎上加用醒腦靜治療,于治療14天后評價2組的臨床神經功能缺損程度評分。作者在同組和組間治療前后比較中均采用了成組設計定量資料的t檢驗,見表11。
從臨床應用角度來講,該例中的對照組為臨床常用的有效治療方案,而作者研究的目的是觀察2組治療后的療效誰更好。本例作者對組內治療前后指標變化比較直接采用原始數據計算各自x±s,并作成組比較的t檢驗分析,此時擴大了樣本例數,如治療組由80例擴大到160例,易得出假陽性結果;另外,表11對2組治療后x±s作成組t檢驗只能反映治療組治療后的水平較對照組治療后低,并未能真實反映療效,因為2組治療前的基本數據不完全一樣。欲真實反映療效需作2步分析:第一,每組作治療前后的自身對照分析,評價每組治療是否有效,此時各組樣本數仍各為80例;第二,在2組自身對照差異均有統計學意義的情況下,欲知道治療組的效果是否真正優于對照組,需比較2組的d±sd差異是否有統計學意義。通過計算得出2組治療均有效,但治療組效果更好于對照組,見表12。
醫學計數資料和等級資料中常用的統計學分析方法為χ2檢驗和秩和檢驗,計量資料常用方法為方差分析、q檢驗和t檢驗,但是論文中t檢驗和χ2檢驗既是應用最多的,也是誤用最多的[5]。出現以上問題主要還是醫學科研工作者對最基本的統計學方法使用范圍掌握得不夠,未能結合實際情況和統計分析的目的來正解選用統計學方法,未能充分理解研究資料是否滿足參數檢驗的條件,以及不能正確判斷計量資料所對應的實驗設計類型。所以,醫學科研工作者應進一步學習和掌握最基本統計學分析方法的概念和經典統計學方法使用的應用要求。醫學期刊也應加大對稿件中統計學分析方面的審查,不僅要聘請統計學專家審稿,而且還要提高期刊編輯人員的醫學統計學知識,以便于在編輯加工稿件中及時發現統計學應用方面的問題;只有這樣,才能使醫學論文中統計學方法應用上的缺陷和錯誤得以彌補和改正,保證論文的科學性和結論的可靠性。多年來,我刊一直嚴把統計學審稿關,保證了刊出后論文的學術質量。
本文承蒙衛生統計學教研室周純先教授悉心指導,特此致謝!