本站小編為你精心準備了大數據時代的循證醫(yī)學論文參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
循證醫(yī)學(EvidenceBasedMedicine,EBM)是一門重視證據制作的學科,其基礎是數理統(tǒng)計學,它要求隨機對照實驗(RandomizedControlledTrail,RCT)的樣本及環(huán)境一致。在現有條件下,由于樣本的差異性和稀少性,很難滿足EBM的RCT要求。例如,要達到敏感度90%、特異度85%、顯著水平0.05、允許誤差0.05,需要采集的正負樣本分別達552例及783例。為了彌補樣本不足而導致的證據可信問題,Meta分析試圖綜合不同研究人員的研究結果。但是,樣本的時空及環(huán)境差異仍然使Meta分析結果備受質疑。
只有在同一時間同一地區(qū)大量采集樣本,才有可能滿足RCT隨機對照實驗的樣本要求。RCT樣本問題可望在大數據時代得到解決,隨著泛在隨時采集樣本的大數據時代的到來,以及不間斷采集醫(yī)療數據的可佩戴設備出現,樣本數據的稀缺等問題將隨巨量數據消失。而隨著新型大數據分析挖掘工具的出現,特別是深度學習技術的不斷發(fā)展和應用,證據及其結論的準確可信性必將大大提高。目前,深度學習識別5749個人臉的精度已達99.15%,其準確程度已經超過人眼和大腦。因此,深度學習必將為循證醫(yī)學帶來一場新的革命。本文將分析循證醫(yī)學在數據證據獲取、分析、制作等方面所面臨的挑戰(zhàn),介紹醫(yī)療大數據時代的數據采集、整合、分析和處理方法,介紹面向醫(yī)療大數據的深度學習技術自動提取疾病特征的原理和方法,以及醫(yī)療大數據及基于云計算的深度學習對循證醫(yī)學所帶來的各種變革。面向大數據的深度學習將特征提取與決策分析過程合二為一,大大降低了醫(yī)生在臨床及醫(yī)學研究中應用循證醫(yī)學的勞動強度。結合醫(yī)療大數據、云計算和深度學習的循證醫(yī)學,將克服過去數據證據稀少、偏頗、失信、不公、過時等不足,將具有更加廣闊的推廣應用前景和發(fā)展動力。
1循證醫(yī)學與數據證據
循證醫(yī)學,簡之就是“遵循證據的醫(yī)學”,又被稱為實證醫(yī)學。循證醫(yī)學重視醫(yī)生的臨床經驗,即傳統(tǒng)意義上的經驗醫(yī)學,同時又強調診斷、治療等決策應在臨床證據最為符合病癥的基礎上作出[1]。在循證醫(yī)學的創(chuàng)立、發(fā)展與傳播方面,英國的科克倫(ArchiebaldL.Cochrane)、美國的費恩斯坦(AlvanR.Feinstein)以及薩克特(DavidL.Sackett)做出了重大貢獻,成為循證醫(yī)學的奠基人??瓶藗悘娬{大規(guī)模隨機臨床試驗的重要性。他認為只有在大規(guī)模臨床試驗中使用隨機分組策略,才能避免因樣本分組而產生的選擇性偏差,保持對照組和試驗組樣本的背景因素平衡,從而才能做出最終正確的比較與評價。他建議及時將切實醫(yī)學證據傳播給使用者,接受專家評估并對可信度進行適當分級,以使醫(yī)學證據能被及時整理、歸納與更新。費恩斯坦奠定了現代流行病學的數理統(tǒng)計與邏輯基礎。從1970年到1981年,他在美國《臨床藥理學與治療學》雜志(ClinicalPharmacologyandTherapeutics)上,以“臨床生物統(tǒng)計學”(ClinicalBiostatistics)為題連續(xù)發(fā)表了57篇論文,將數理統(tǒng)計學和邏輯學導入到臨床流行病學,科學系統(tǒng)地建立了臨床流行病學的有關理論體系。薩科特則為循證醫(yī)學的傳播與發(fā)展做出了巨大貢獻。他發(fā)起并主編了與循證醫(yī)學有關的兩本著名雜志:《美國內科醫(yī)師學會雜志俱樂部》和《循證醫(yī)學》。
1997年,他還主編出版了《循證醫(yī)學》一書,該書被譯為多種文字并在世界上廣為傳播。正是在《美國內科醫(yī)師學會雜志俱樂部》上,加拿大蓋亞特(rdonH.Guyatt)于1991年首次提出了循證醫(yī)學一詞[3]。從循證醫(yī)學與數理統(tǒng)計和邏輯學的淵源,便可以看出循證醫(yī)學注重證據的內涵。它是一門非常強調證據制作的學科,同時又非常重視醫(yī)學證據的傳播和評估,這正是它區(qū)別于以往醫(yī)學的特點。通過評估產生可信證據,通過傳播發(fā)揮證據價值。醫(yī)生在診斷與治療過程中,不僅基于經驗直觀判斷,而且結合證據科學決策,更加客觀地進行診斷與治療。短短十多年的時間,在世界各國醫(yī)學研究與臨床實踐中,循證醫(yī)學得到了廣泛深入的應用。科克倫最初創(chuàng)建的世界循證醫(yī)學協(xié)作網已經包括約50個專業(yè)協(xié)作小組,所收集的醫(yī)療證據幾乎覆蓋所有臨床醫(yī)學領域。1996年,我國華西醫(yī)科大學建立了中國循證醫(yī)學中心,并于1999年正式加入世界循證醫(yī)學協(xié)作網;2001年,中國循證醫(yī)學中心創(chuàng)辦了《循證醫(yī)學》雜志,發(fā)表在各類雜志的循證研究論文達45842篇。但是,循證醫(yī)學也有其面臨的問題,如對證據進行科學評價等問題。臨床證據目前還沒有完整、科學的定義,證據評價標準及推薦級別尚未完全統(tǒng)一,不同國家不同疾病的證據質量分級不盡相同。而且,隨著人類對疾病認識的加深以及診療手段的革新,評價標準還會隨這些因素的變化而變化。
循證醫(yī)學的基礎是數理統(tǒng)計學,要求RCT的實驗樣本及環(huán)境一致,以便排除個體差異及環(huán)境干擾,但這在現有條件下近乎不可能實現。號稱大規(guī)模隨機對照實驗的樣本偏少,對照組和試驗組難有條件一致的個體,環(huán)境隨時間空間變化造成實驗對照控制困難。目前,大規(guī)模的醫(yī)學樣本采集困難,幾百個樣本已經算是比較大的樣本了;而根據統(tǒng)計理論如要達到90%的敏感度,至少需要約1300個的數據樣本。為了克服RCT樣本不足的問題,Meta分析方法得到了廣泛應用:通過綜合已有研究多個樣本集的結果,可以推得大規(guī)模樣本集的綜合結果。Meta分析取得了很多有價值的研究成果,但是,Meta分析的基礎也是數理統(tǒng)計學,其運用的前提是樣本及實驗環(huán)境一致,正是在這一點上它備受質疑。首先,不同樣本集的權重控制難于完全公正,因為其實驗環(huán)境難于恰當評價和把控,實驗結果難免有過度包裝和偏頗之嫌。Meta分析存在的另一個問題是:它所依賴的數據往往不是最新的即時案例,制作的證據可能因環(huán)境與氣候的變化而失去應用價值??傊?,循證醫(yī)學所面臨的問題包括:證據的稀缺性、偏倚性、可靠性、及時性、公正性,以及環(huán)境的一致性等方面的問題。由于證據的一致性和及時性存在問題,基于歷史數據進行Meta分析備受質疑。2014年,《英國醫(yī)學雜志》在名為《循證醫(yī)學瀕臨破產》的文章中指出[5]:循證醫(yī)學的證據屬于間接證據,基礎建立在已經發(fā)表的研究文獻上,利益沖突容易影響證據的公正性,證據環(huán)境與臨床決策環(huán)境存在距離;循證醫(yī)學助長了過度診斷、過度治療,并可能存在淪落為利益集團代言人的危險。
2大數據對循證醫(yī)學的影響
大數據(Bigdata)又稱巨量或海量數據,是指數據規(guī)模巨大以至在合理時間內,無法通過當前主流軟件工具,獲取、處理、分析以便決策的結構復雜的數據[6]。大數據如下具有4V特點:Volume(巨量)、Velocity(瞬速)、Variety(多樣)、Value(價值)。巨量是指已經不能再用GB(即1024MB)和TB(即1024GB)為單位,來衡量大數據的存儲容量或規(guī)模,而要以PB(即1024TB)、EB(即1024PB)乃至ZB(即1024EB)為單位來計量數據容量。在巨量的醫(yī)療大數據中,各種條件的樣本都會存在,因此,證據的稀缺已經不是問題。瞬速是指兼具方向的快速變化,即數據隨時間和空間快速變化。大數據中的樣本通常是全空間的、多維度的、全時間的及瞬時變化的。由于大數據地域環(huán)境廣,數據樣本量巨大、正反樣本齊全,證據的“制作”已不再必要,而是隨時隨地客觀地存在。瞬速性通過可佩戴健康監(jiān)測設備體現,這為及時獲取病患信息提供了極大便利。多樣是指數據的種類繁多、結構復雜、因果并存、甚至同一數據表現出不同形式。數據的多樣性對數據的理解和分析是一個巨大挑戰(zhàn),但同時也為樣本分析結果的驗證帶來便利。因此,在醫(yī)療大數據環(huán)境下,不僅隨時可以采集樣本進行分析處理,還能對分析得到的結果馬上進行驗證,從而能夠保證醫(yī)學證據的可靠與可信。
價值是指相比小規(guī)模、歷史數據而言,大數據具有更高的研究和使用價值。由于任意時刻任意地點都有大量樣本,樣本的稀缺性和及時性已經不是問題,這為醫(yī)學研究掃清了采樣障礙;同時由于樣本豐富冗余多樣,也為研究結果的驗證提供了便利;大數據除具有巨量歷史數據外,還有不同地域環(huán)境的巨量即時數據,這使循證決策更具應用價值和時效性。大數據將首先改變醫(yī)學數據的采集方式。大數據的形成往往依靠自動采集技術,隨著可佩戴監(jiān)測設備如iWatch等的出現,醫(yī)學數據的采集及積累速度將出現爆炸性的增長。以往的數據同大數據相比,如同滄海之一粟。且以往的數據往往靠手工采集完成,普遍存在稀缺、偏倚、可靠、及時、公正等問題,這樣采集的證據必然會影響醫(yī)學研究的結論?;谑止ぷC據進行決策,其結論未必準確及時公正可靠。醫(yī)療大數據不間斷地在不同地點同時采集,不僅包含歷史數據以及即時數據,甚至還可能包含未來需求信息,例如,ogle就是通過人們對感冒藥品的搜索來預測流感的。大數據的出現將改變醫(yī)學數據的管理方式。在網絡數字化高度發(fā)達的今天,盡管已經出現了電子病歷,但紙張病歷在數據管理中仍然重要。然而,紙張病歷有其固有缺陷,如容易破損或丟失、整理歸檔的周期過長、借閱的時間成本極高、研究采樣的工作量巨大等等。伴隨大數據出現的數據融合技術能將不同醫(yī)院的電子病歷整合在一起,并同可佩戴健康監(jiān)測設備的數據及時集成,大大減少了電子病歷的整理、借閱和數據采集時間,這不僅對病人的疾病診斷和預警監(jiān)控更加有利,同時也對醫(yī)生的臨床及醫(yī)學研究更有幫助。通過語音和可視眼鏡等現代化的數據瀏覽設備,醫(yī)生在查房間隙就能獲知下一病人既往病情,從而能大大減少醫(yī)生的勞動強度,使醫(yī)生有更多時間治療病人,有更多的時間進行醫(yī)學研究。
大數據的出現將改變醫(yī)學數據的分析方式。以往在收集樣本數據以后,通常使用SAS或SPSS等軟件,對采集的數據進行統(tǒng)計分析,發(fā)現相關病因或建立決策模型。這些軟件受計算能力及內存容量的限制,只能處理樣本量不大的數據,并且處理的數據維數有限,例如,SPSS不能超過40維,而醫(yī)療大數據的維數成千上萬。通過手工或統(tǒng)計軟件的計算方法,將無法滿足醫(yī)療大數據的分析需要。
當維數超過30個致病因素時,可能要考慮230種因素組合,普通統(tǒng)計軟件已無法計算和處理,必須依靠內存及速度“無限”的云計算。必須研究與開發(fā)基于大數據和云計算的分析與挖掘技術如深度學習技術,使其能夠自動完成高維病因數據的分析與主要病因的提取??傊?,醫(yī)療大數據的采集、整合、分析、處理、研究完全靠人工完成已極其困難,沒有利用云計算的統(tǒng)計分析軟件也難于完成醫(yī)療大數據的分析和處理。在大數據時代,必須借助深度學習等技術完成醫(yī)療大數據的分析和挖掘。雖然醫(yī)療大數據能夠彌補數據樣本的不足和不公,但只有借助更為先進的分析工具和軟件,才能為循證醫(yī)學帶來進一步的變革和發(fā)展。
3大數據對循證醫(yī)學的變革
證據制作是循證醫(yī)學的核心,證據能為醫(yī)生的診治提供參照,因此,循證醫(yī)學得到了快速發(fā)展。但是,矛盾、偏頗、過時的證據也使循證醫(yī)學備受質疑。首先是證據及其結論存在大量的矛盾,使人們對循證醫(yī)治的結果產生懷疑;其次是證據偏頗使其成為利益代言人的工具;其三是證據時過境遷使醫(yī)治達不到預期效果。而醫(yī)療大數據的出現恰好能夠彌補以往證據采集與制作的不足。首先,醫(yī)療大數據使證據的稀缺問題得到解決;其次,隨大數據廣泛匯集的醫(yī)生及病人評價,可有效避免證據成為利益代言人的工具;其三,可穿戴等自動采集設備可保證證據的時效性。這將有助于循證醫(yī)學同中醫(yī)的結合。中醫(yī)的治療過程通常比西醫(yī)長,其證據采集及療效評估存在很大問題,而隨著可穿戴健康監(jiān)測設備等技術的發(fā)展,長期持續(xù)采集治療證據及療效將不再困難,從而有助于循證醫(yī)學在中醫(yī)等領域發(fā)展壯大。此外,隨大數據興起的先進數據分析與挖掘技術,將對循證醫(yī)學起到巨大的推進作用。臨床決策分析評價是確定循證治療方案的關鍵步驟,現有的決策分析評價模型包括決策樹、Markov過程等一系列模型,這些模型在面臨高維大數據時力不從心,難于繼續(xù)提供較高的決策精度,使醫(yī)生對醫(yī)治方案是否有效失去信心。隨著大數據深度學習技術的出現,病因的分析和提取已完全自動化,且大大降低了建立決策分析模型的工作量,提高了治療方案的決策精度。對于任何疾病診治方案,考慮的疾病致病因素越多,即證據或特征維數越多,得到的參考信息就越多,診治的準確性就會相應提高。但是,醫(yī)生在遇到大量高維的證據數據時,往往面臨從中選擇少數有效證據的難題。例如,假定要考慮30個致病因素或檢驗指標,建立決策模型就要考慮230種因素組合,從中篩選一個最優(yōu)因素組合作為模型輸入的工作量是巨大的。因此,要得到由若干最優(yōu)證據構建的最佳決策分析模型,醫(yī)生們所投入的研究精力可想而知。
篩選最優(yōu)因素組合是醫(yī)生們最費精力的工作,目前這項工作可以被深度學習自動完成了。深度學習最早由Hinton等人在2006年提出,它是一種無監(jiān)督的特征學習和提取技術,它通過低層特征的組合構建更加抽象的高層特征。2012年,Lecun等人利用卷積神經網絡真正實現了高效的多層深度學習。傳統(tǒng)的神經網絡學習只有單向認知過程,通常只包含一個隱含層,因層數較少而被稱為淺層學習。深度學習則包含認知和生成兩個過程,并且每個過程都包含多個隱含層,其模型的總體框架如圖1的虛框部分所示。如圖1所示,深度學習的“輸入層”可以理解為各種致病因素以及各種檢查化驗結果,例如遺傳環(huán)境因素以及肝功全套指標等;自底向上的箭頭表示認知過程,自頂向下的箭頭表示生成過程,即深度學習由兩個互逆的過程構成;認知權重向量WnT和生成權重向量Wn表示深度模型的知識。原始“輸入層”經“隱含層H0”認知得到輸出,輸出又經“隱含層h0”生成得到新“輸入層”,如果原始“輸入層”和生成的“輸入層”完全一致,則說明認知產生的輸出是完全正確的。根據信息論的有關理論,學是會產生損失,新舊輸入不可能完全一致。因此,只要兩者近乎一致就可以了。認知和生成權重同隱含層的每個輸出相關聯(lián),wake-sleep深度學習算法用于雙向調節(jié)權重:(1)利用下層輸入和認知權重向量WiT產生輸出表示,然后使用梯度下降法調節(jié)生成權重向量Wi;(2)利用輸出表示和生成權重向量Wi產生輸入表示,然后使用梯度下降法調節(jié)認知權重向量WiT。通過逐層學習最終得到頂層的認知和生成權重向量WnT、Wn。在深度學習完成后,如果要建立決策分析模型,只需將頂層輸出即自動提取的特征,作為分類模型如支持向量機的輸入,并用類別標記如肝硬化分級訓練支持向量機,就可以得到用于決策分析的精確分類模型,分類模型如圖1的虛框外部所示。2014年,香港中文大學湯曉鷗教授領導計算機視覺研究組(mmlab.ie.cuhk.edu.hk),開發(fā)了一個名為DeepID的深度學習模型,在LFW數據庫上識別5749個人臉的準確率已達99.15%,其精細和準確程度已經超過了人眼和大腦。醫(yī)療大數據及深度學習必將為循證醫(yī)學帶來一場新的革命。不僅數據缺失、偏頗以及過時等問題會被迎刃而解,而且證據收集、制作以及診治方案的決策都將會自動化,這將擴大循證醫(yī)學在所有領域包括中醫(yī)等領域的應用范圍,大大降低醫(yī)生在證據制作、治療方案決策與療效評估等方面所付出的精力,推動循證醫(yī)學向更深更廣更加現代化的方向發(fā)展。
4總結
醫(yī)療大數據帶來的變革將是全方位的,它不僅為醫(yī)學研究和證據制作帶來便利,同時也將促進中醫(yī)等替代和補充醫(yī)學的發(fā)展。作為大數據采集的一項關鍵技術——便攜式/可佩戴健康數據自動采集技術,將大大提高醫(yī)療數據采集以及證據制作的效率,解決中醫(yī)等療效數據需要長期采集觀測的難題,彌補循證醫(yī)學存在的證據偏頗、不公、過時等缺陷,促進循證醫(yī)學更加客觀、公正、可靠地在臨床治療中應用。在循證醫(yī)學的證據評估以及利用方面,伴隨大數據出現的云計算能夠提高證據分析與處理的效率,大大節(jié)省醫(yī)生臨床應用和醫(yī)學研究所需要花費的時間;面向大數據的深度學習能夠從浩瀚的高維醫(yī)療數據中,自動完成疾病致病因素及環(huán)境因素等的篩選與提取工作,并能建立精度遠遠超過人腦的決策分析模型,從而大大提升醫(yī)生建立和應用循證治療方案的信心,有助于循證醫(yī)學被各科醫(yī)生更加廣泛地接受和應用。盡管深度模型包含更多的隱含層,其學習時間要遠遠長于淺層學習,但兩種模型的決策時間相差不大,因此,這并不妨害深度模型的有效應用。特別值得一提的是,深度學習將證據提取與決策分析兩個過程合二為一,大大降低了醫(yī)生在臨床及醫(yī)學研究中應用循證醫(yī)學的勞動強度。基于大數據、云計算和深度學習的循證醫(yī)學,由于能夠降低勞動強度、提升工作效率、提高決策精度,因而將具有更加廣闊的應用前景和發(fā)展方向。
5展望
大數據和云計算時代的到來,將推進循證醫(yī)學的研究和發(fā)展,并為其提供深度學習等先進手段。醫(yī)療大數據將不再稀少、偏頗、過時以及不公,將避免循證醫(yī)學成為利益代言人的工具;便攜式/可佩戴健康設備作為大數據自動采集數據的工具,將有助于解決循證醫(yī)學證據采集的難題,促進循證醫(yī)學在包括中醫(yī)在內的更廣領域推廣應用;自動整理大數據的數據融合技術、以及自動提取證據并建立決策模型的深度學習技術,將大大提高醫(yī)學證據提取及醫(yī)治方案決策分析的效率,推動循證醫(yī)學被臨床醫(yī)生及研究者更加廣泛地接受和應用??傊?,大數據/云計算和深度學習將為循證醫(yī)學帶來一個嶄新的春天。
作者:馬光志 張曉祥 周彬 左秀然 聶慶華 單位:華中科技大學醫(yī)學圖像信息研究中心 華中科技大學附屬同濟醫(yī)院 華中科技大學附屬協(xié)和醫(yī)院 武漢市中心醫(yī)院 武漢僑亞百老匯信息技術有限公司