本站小編為你精心準備了生物資源庫的建設、開放與共享參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
傳統生物資源是指自然資源的有機組成部分,包括基因、物種及生態系統3個層次。生物資源庫即收藏、保存各種生物資源,為現在或將來對生物資源的深入認識、開發利用服務。最早的生物資源庫是動、植物化石標本館及博物館,例如倫敦自然歷史博物館(NaturalHistoryMuseum)、北京自然博物館等。首先,博物館為科學家的研究工作提供了極大幫助,包括物種之間的親緣關系和生物進化等理論問題,以及醫藥、農業、林業、漁業、礦業和石油勘探等方面的實際問題。其次,博物館、標本館也是公眾科學活動的主要場所,在傳播和普及自然科學知識方面起到了重要作用。各類博物館、標本館的生物樣品以非活體樣品為主。后來,全球范圍內陸續建立了很多活體樣品生物資源庫,例如菌種庫、種子庫等。這些活體樣品庫一方面為相關科學研究、育種提供了寶貴資源,另一方面也是人類未雨綢繆,為避免大規模災害時生物資源遭受毀滅性打擊的必要手段。例如,斯瓦爾巴全球種子庫(SvalbardGlobalSeedVault)是挪威政府為保存全世界農作物種子資源,在北冰洋斯瓦爾巴群島建造的一個貯藏庫,該種子庫能夠承受海嘯、地震和核武器攻擊。近年來,隨著分子生物學和基因組學的快速發展,存儲基因、蛋白質等生物分子實物樣本的資源庫和樣品數據資料的數據庫在數量上成為生物資源庫的主流。這些資源庫為相關學科的研究人員帶來了極大便利,促進了相關研究的進展。本文重點介紹分子資源庫,尤其是國內、外重要生理功能和重大疾病相關蛋白質研究公共資源庫的建設現狀,便于讀者認識和利用這些資源。
1cDNA克隆文庫
自20世紀80年代分子生物學興起以來,cDNA克隆工作是國內、外生命科學和醫學實驗室的主要研究內容。近年來,大規模的文庫制備及獲得全序列克隆已相對容易。一些系統生物學的研究實驗室,例如Snyder實驗室(酵母ORF的表達克隆文庫)、Vidal-Hall實驗室和日本RIKEN研究所(人類cDNA克隆文庫)等,以及目前已具有相當規模的cDNA克隆庫;工業界以Invitrogen和Origen等公司為代表擁有各自的cDNA克隆文庫,通過商業運作模式供研究者使用。隨著后基因組時代的到來和各項生物技術的發展,克隆人類及模式生物基因閱讀框的cDNA愈加普遍。以哈佛醫學院及其附屬Dana-FarberCancerInstitute的Vidal實驗室領銜的人類cDNA克隆庫為例,該庫是目前世界上最大的人類cDNA克隆庫(humanORFeome)。縱觀人類cDNA克隆庫建設的過程,可以發現,2004年人類ORFeome第1版本V1.1[1],包含8076個人類基因閱讀框的cDNA,涵蓋約7263個人類基因;2007年發表了人類ORFeome第3版本[2],包含12212個人類基因閱讀框的cDNA,涵蓋約10214個人類基因。根據該人類cDNA克隆庫網站最近公布的數據,目前已儲備有15483個人類基因閱讀框的cDNA,涵蓋約12794個非重疊的人類基因cDNA。通過數據分析不難發現,在收集cDNA克隆的最初3年(2004~2007年)內,非重疊的人類基因cDNA急劇增加近3000個,而在項目后期3年中,盡管項目資助強度和人員等投入空前加大,非重疊的人類基因cDNA在3年內也只增加了1580個,增幅明顯放緩。這是由于容易克隆的基因都在項目早期易于獲得,而后期制備的難度很大。中國科學院、軍事醫學科學院、中國科技大學及清華大學等高校在系統收集、制備人類cDNA及蛋白質大規模表達方面具有良好的研究基礎和資源儲備,分別建立了各自研究領域的全長cDNA庫和cDNA亞克隆庫,均以與重大疾病相關或重要生理功能相關途徑中關鍵蛋白的cDNA為主。
2蛋白質及多肽文庫
蛋白質組學研究領域主要是發現和鑒定能夠用于疾病早期診斷的蛋白質生物標志物,探索疾病的發病機制、發現藥物靶標、系統研究蛋白質的生物學功能等。基于蛋白質生物標志物疾病早期診斷技術,除了通過制備抗體及相關試劑盒用于臨床檢測外,通過合成(同位素標記)肽段,建立基于MRM精確定量技術的臨床檢測技術方法是目前質譜技術用于臨床檢測的一個趨勢。因此,建立與蛋白質生物標志物及相關疾病的重要蛋白質相對應的多肽庫,將會加速蛋白質組學技術和質譜技術在臨床中的應用。首次由我國科學家賀福初院士領導的國際重大科研合作項目———人類肝臟蛋白質組計劃,圍繞人類肝臟蛋白質組的表達譜、修飾譜及其相互作用的連鎖圖等九大科研任務,成功測定出6788個高可信度的中國成人肝臟蛋白質,系統構建了國際上第1張人類器官蛋白質組“藍圖”;發現了包含1000余個“蛋白質-蛋白質”相互作用的網絡圖;建立了2000余株蛋白質抗體。
在結構基因組學方面,其研究目標主要是闡明蛋白質相互作用的分子機理及創新藥物的設計與篩選。中國結構基因組計劃于2000年正式啟動,重點研究與人類重大疾病及重要生理功能相關的蛋白質結構與功能的關系。在遺傳病致病基因,白血病、肝癌、鼻咽癌等腫瘤相關基因,造血干(祖)細胞、下丘腦-垂體-腎上腺軸系統、胎肝、心血管和神經系統等組織cDNA方面的研究成果已達國際前沿水平,共發現新基因全長cDNA1000多個,解析了200多個蛋白質的結構,為深入開展基因功能研究奠定了良好基礎[3]。在禽流感、SARS等重大傳染病的蛋白質結構與功能研究方面也取得了重大成果,為我國生物技術和醫藥產業的發展提供了強大的技術支撐。
3蛋白質抗體庫
在重要生理功能和重大疾病相關蛋白質抗體庫建設方面,2004年10月召開的國際人類蛋白質組學會議上,成立了由瑞典科學家Dr.Uhlen負責的人類抗體項目(humanantibodyinitiative,HAI),計劃在35年內研制針對30000種人類蛋白質的抗體。美國NIH創建的developmentalstudieshybridomabank(DSHB)資源庫包括專業的抗體雜交瘤細胞株庫。目前我國在此方面尚無規模化、系統化、標準化制備抗體的組織。我國研究用抗體試劑90%以上仍依賴進口產品,幾乎被SantaCruz、R&D、SIGMA、Roche、Beckman、Abbott等國際公司瓜分,尤其是精加工的標記抗體,如流式細胞儀用熒光抗體、時間分辨免疫分析技術的稀土元素標記抗體等高附加值抗體,幾乎完全依靠進口。國內大多數抗體銷售商也均以國外廠家抗體產品為主。進口抗體產品價格高、進貨時間長、運輸過程中易失活,難以滿足我國研究機構對抗體的大量需求。
4蛋白質配體庫
蛋白質配體的發現伴隨著新藥研發成為熱點之一。蛋白質配體的發現和結構優化是藥物化學的主要研究內容之一[4]。在早期的藥物研究中,藥物靶標的發現往往滯后于其在臨床上的應用。沒有靶標的藥物或者說靶標不明確的藥物,其作用機制或藥物副作用研究會受到一定限制,在某種程度上也可能錯失藥物的主要作用或用途。例如阿司匹林,該藥物是德國科學家費利克斯•霍夫曼(FelixHoffman,1868-1946)發現的,于1899年德萊塞介紹臨床上市,最初用于治療感冒、發熱、頭痛、牙痛、關節痛、風濕病等。隨著分子生物學的發展,研究人員發現了其詳細的作用機制,阿司匹林通過與環氧化酶(cyclooxygenase,COX)COX-1活性部位多肽鏈第530位絲氨酸殘基的羥基發生不可逆的乙酰化,導致COX失活,繼而阻斷了AA轉化為血栓烷A2(TXA2)的途徑,抑制PLT聚集,因此阿司匹林被廣泛用于預防和治療缺血性心臟病、心絞痛、心肺梗塞、腦血栓形成,以及血管形成術和旁路移植術等[5]。隨著分子生物學和結構分子生物學的發展,大量與疾病相關的蛋白質被發現,特定蛋白的分子配體被大量鑒定,如針對微管蛋白的天然分子配體就有許多,如Taxol、Vinblastine、Epothilone等[6]。收集現有的蛋白質配體分子對發現新配體有重要參考價值,同時也為發現蛋白質配體的新功能提供重要資源。構建化合物庫,通過高通量虛擬篩選和實驗篩選,快速發現活性化合物,是當今發現新藥和蛋白質配體的重要途徑[7]。
構建蛋白質及其配體信息庫、資源庫能夠幫助化學家和生物學家在化學基因組研究和新藥開發中節省精力。美國NIH及其合作者建立的公共資源信息庫PDB、DrugBank和ChemBank提供了大量蛋白質及配體信息,其中PDB提供了6253個蛋白質配體信息,DrugBank提供了1492個批準的藥物信息(91%的藥物有1個或幾個已知藥物靶標信息)[8],ChemBank則是研究發現蛋白質配體的重要信息資源庫[9]。在小分子配體庫建設方面,美國MDL公司利用專業數據庫軟件ISISBASE構建了諸如ACD-3D、綜合醫藥化學數據MDDR、美國癌癥研究所化合物三維數據庫NCI-3D等。在中國,較具影響力并已商業運作的數據庫有中國科學院藥物研究所與創騰科技公司合作開發的中國天然產物數據CNPD,該庫目前共收集了57000多個天然產物。另一較具影響力且商業運作的是中國醫學科學院與創騰科技合作開發的微生物天然產物數據庫MNPD,該庫目前共收集了15000個微生物天然產物的相關數據。但上述化合物庫均為信息庫,在沒有相應實體庫,特別是天然產物實體庫的支持下,所起的作用相對有限。在實體庫構建方面,國際上諸如諾華、輝瑞等知名藥物公司均建立了小分子配體庫與信息庫,但這些均為內部資源,不對研究機構及個人開放。然而,構建何種類型的化合物庫才能最大限度地滿足蛋白質配體的發現與研究需求,同時滿足藥物發現與化學生物學研究需求,這是研究中的首要問題。同時滿足藥物發現和化學生物學研究,必須建立通用化合物庫(general-purposelibrary)[10],而針對特定類型蛋白質尋找配體,則需要構建聚焦化合物庫(focusedlibrary)。多樣性導向合成(diversit-yorientedsynthesis)是以尋找新的蛋白和探索蛋白質功能為目的,利用單一化合物為原料,盡量合成骨架多樣的特異性分子,這樣的化合庫稱為預期庫(prospectinglibrary)[4]。
大型制藥公司長期致力于構建通用化合物庫(general-purposelibrary),從事新藥發現和化學生物學研究團隊則更多地構建聚焦化合物庫和預期庫。組合化學能高效合成化合物庫,組合化學技術能提供結構類似的分子,為構效關系提供省時省力的平臺,但組合化學提供的化合物結構多樣性不夠,組合化合物庫提供的化學空間沒有天然產物庫大。近20多年新藥發現歷史表明,組合化合物庫并沒有提高新藥發現的效率。因此,天然產物及其衍生物化合物庫仍是發現蛋白質配體的有效資源。Novartis長期在全球范圍內收集天然產物,在化合物庫構建方面積累了豐富經驗,并提出了一系列在化合物收集標準、化合物保存、化合物篩選等方面的規范[11]。在構建化合物庫基礎上如何篩選以快速發現蛋白質配體,是配體發現的關鍵科學問題。在研究策略上采用2種策略結合,通過計算機虛擬篩選是首要的一步,通過蛋白質分子和小分子虛擬對接可高效獲得初篩結果,這些結構可以有效指導實驗篩選以避免盲目性[12]。除了計算機虛擬篩選、實驗驗證篩選,綜合運用各種知識和工具,如類藥性、成藥性等知識是發現蛋白質配體和新藥的捷徑[13]。
5重要蛋白缺失或過表達細胞庫
有關重要蛋白缺失或過表達細胞庫建設。近年來,很多重要蛋白質功能性研究成果的獲得,得益于一些遺傳背景相同但個別基因突變的成對或系列的細胞株。這使得功能和表型方面的改變能與特定基因或蛋白快速建立連接,避免了漫無邊際的搜尋。但迄今為止,多數此類的細胞模型僅在個別實驗室保存和使用。國際上,2007年建立了基因敲出小鼠國際資源庫(InternationalKnockoutMouseConsortium,IKMC),專門致力于在C57BL/6小鼠上進行系統性基因敲出。目前在美國德州農工大學(A&M)、加拿大和歐盟3個中心進行,并得到NIH(Grantnumber:NIHHG004074)和歐盟(Projectnumber:223592)的基金支持,這些機構均為非營利性質,但資源一般仍為有償提供。截至2010年6月,可提供的基因敲出干細胞有3250株,相關工具載體5851種,并在持續和迅速增加中。例如加拿大的Watson教授等[14]利用S100A7蛋白表達缺失和高表達的一對乳腺癌細胞系(原位乳腺癌細胞MDA-MB-231和MDA-MB-486),發現高表達S100A7可促進乳腺癌細胞的增殖和轉移。國內近年來也開展了相關工作,但其中大多采用國外建立的特異細胞模型。中國醫學科學院協和腫瘤研究所詹啟敏教授課題組以p53野生型及p53缺失型結腸癌細胞HCT116P53+/+和HCT116P53-/-為實驗對象,研究了UV照射對這2株細胞蛋白變化的影響,分析受p53調控的信號傳導通路等。
6生物信息資源庫
近幾十年來,隨著生物信息學、基因組學、蛋白質組學等學科的快速發展,基因組和分子水平的數據信息資源以幾何級數快速增長。國內、外建立了大量對生物學信息資源進行存儲、整理、分類、加工的數據庫。目前,最具影響力的生物信息資源數據庫是GenBank,它是美國國家生物技術信息中心(NationalCenterforBiotechnologyInformation,NCBI)建立并維護的DNA序列數據庫(www.ncbi.nlm.nih.gov),匯集并注釋了所有公開的核酸及蛋白質序列,每個記錄代表1個單獨、連續并帶有注釋的DNA或RN段。該數據庫是對全球開放共享的生物學資源數據庫,得到了全球生命科學工作者的廣泛認可。此外,歐洲分子生物學實驗室(EMBL)、日本DNA數據庫(DDBJ)也是國際核苷酸序列數據庫合作成員。NIH人類遺傳多樣性的研究開展了哺乳動物基因收集項目(MammalianGeneCollection,MGC),由NIH的多個研究所參與,提供人和小鼠克隆全長的開放閱讀框(FL-ORF),所有序列都收錄在著名的基因數據庫GenBank中。目前已經克隆得到了11542個人的和8855個小鼠的基因序列。鑒于生物信息資源和相應數據庫的快速發展,自2004年以來,國際學術期刊《NucleicAcidsResearch》每年都出版數據庫專刊,介紹國際上最新的生物信息資源數據庫并說明數據庫的重要更新。2009年,牛津大學出版社創立了生物信息資源的專業期刊《Database:TheJournalofBiologicalDatabasesandCuration》。
7我國生物資源庫的建設現狀
近10年來,我國科學工作者積極開展了例如人類基因組研究計劃、黑猩猩基因組研究計劃、人類基因單體型圖譜研究計劃及微生物基因組合源基因組研究計劃等,獲得了海量的科學數據,就基因組學而言,獲得的相關科學數據已經高達幾百萬億字節。在蛋白質科學研究領域,我國在重要生理功能和重大疾病相關蛋白質的發現、結構解析、功能研究方面已積累了一定基礎,在一些領域已經領先于世界先進水平。經過多年的發展,在科技部、基金委和科學院知識創新工程等項目支持下,中國科學院、軍事醫學科學院、中國醫學科學院及高校系統等國內科研單位的科學家,在蛋白質研究領域取得了一些國際一流水平的研究成果。以服務人類健康與疾病的生物醫學基礎研究和國家生物醫藥新興戰略產業發展為導向的國家重大項目———“重要生理功能和重大疾病相關蛋白質研究公共資源庫建設”項目,以重要生理功能和重大疾病相關蛋白質功能基因庫、抗體庫、蛋白質配體庫和重要蛋白缺失或過表達的細胞資源庫建設為主要內容,通過5年的建設,公共資源庫將包含約40000個功能基因,2000種擁有自主知識產權的功能蛋白抗體,10000個蛋白質配體(包含天然化合物及其衍生物)及2500個重要蛋白缺失或過表達細胞庫。目前,可以通過訪問網站申領資源庫的部分樣品,該資源庫的建立將為研究重要生物體轉錄組學、代謝組學、蛋白質組學、結構生物學、計算生物學及各類重大疾病防治和創新藥物研發提供基礎資源和信息服務,將為我國蛋白質科學不斷產出具有國際水準的原創性成果提供強有力的物質及服務保障,也為我國生物醫藥產業的發展提供實現源頭創新的實物性資源基礎。同時,該資源庫的建立也將成為我國生命科學領域的科普資源,為生命科學研究和生物學教育與實踐提供實質性的寶貴資源。在科普、講解演示,甚至教學實驗中,都希望大家能有意識地關注和采用相關資源庫的內容和存品,獲得事半功倍的效果。公共資源庫的5年任務存量約1萬個具有重要生理功能和重大疾病相關蛋白質多肽庫:其中包括人類疾病相關蛋白質和重要生理功能靶標蛋白質約7500個,結核病、病毒性肝炎等傳染性疾病關鍵蛋白質1000個左右,模式生物重要蛋白質約1500個;單克隆抗體庫達2000~3000株細胞株,多克隆抗體庫容達800種,1.5萬個蛋白質配體與配體資源化合物庫。
作者:翟永功 李雪梅 王婭 何大澄 單位:北京師范大學生命科學院 國家973項目辦公室