您所在的位置:首頁(yè) > 腫瘤科醫學(xué)進(jìn)展 > 科學(xué)家發(fā)布人類(lèi)蛋白質(zhì)組草圖里程碑成果
日前,兩個(gè)國際小組均在《自然》雜志上公布了人類(lèi)蛋白質(zhì)組第一張草圖,這些在大部分非患病人體組織和器官中表達的精選蛋白,為更好的理解疾病狀態(tài)下發(fā)生的機體變化,奠定了堅實(shí)的基礎。這兩項最新研究揭示了人類(lèi)基因組的更多復雜性,并從之前認為屬于非編碼區域的基因組中發(fā)現了新蛋白。
波士頓兒童醫院蛋白質(zhì)組學(xué)主任Hanno Steen(未參與這項研究)表示:“雖然之前其它一些大型蛋白質(zhì)組數據集也收集了接近上萬(wàn)個(gè)蛋白數據,但是這兩項成果確實(shí)是真正的突破性成果,全面覆蓋了超過(guò)80%的人類(lèi)預期蛋白質(zhì)組,其中還有一些之前未曾被發(fā)現的蛋白。這些成果清楚地表明,想要達到這樣的蛋白覆蓋率深度,就需要探索許多不同的組織類(lèi)型。”
在第一篇文章中,來(lái)自約翰霍普金斯大學(xué)的蛋白質(zhì)組研究員Akhilesh Pandey,與來(lái)自印度生物信息學(xué)研究所等處的研究人員合作,分析了30種不同的組織類(lèi)型,編撰了由84%所有預期編碼蛋白的人體基因翻譯得到的蛋白。
這項研究識別出17, 294個(gè)蛋白編碼基因,并通過(guò)表達分析證明了組織和細胞特異性蛋白的存在,并且研究人員還通過(guò)從注解的假基因、非編碼RNA和未翻譯的區域識別翻譯的蛋白,表明了“蛋白基因組”分析的重要性。
研究人員在線(xiàn)公布了這些人類(lèi)蛋白質(zhì)組圖譜發(fā)現,相關(guān)數據將很快可以通過(guò)美國生物技術(shù)信息數據中心(the National Center for Biotechnology Information database)查詢(xún)得到,Pandey說(shuō)。
同時(shí)另外一篇文章中,來(lái)自德國研究人員慕尼黑工業(yè)大學(xué)的Bernhard Küster等人創(chuàng )新性的推出了一個(gè)搜索性公共數據庫:ProteomicsDB,這一數據庫公布了18, 097個(gè)基因獲得的蛋白,占目前預計人類(lèi)蛋白總數(19, 629)的92%。這種數據能用于識別數百個(gè)翻譯的lincRNAs,對藥物敏感的標記,以及用于發(fā)現mRNA和組織中的蛋白水平之間的定量關(guān)系等。
這兩個(gè)研究組都利用了質(zhì)譜方法分析人類(lèi)組織,Pandey研究組分析的是全新的數據,針對了多種不同健康人體組織的數據,其中包括七種胎兒組織和六種血細胞類(lèi)型。
而Küster研究組則采用了稍微有些不同的方法,他們匯集了已有質(zhì)譜分析數據,以及同事的一些成功,這些大約占據ProteomicsDB數據的60%。為了填補這些數據間的空白區域,Küster實(shí)驗室構建了自己的質(zhì)譜數據,分析了60個(gè)人類(lèi)組織體液,13個(gè)體液,以及147個(gè)的癌細胞系。Küster表示,他們只挑選了高分辨率的公共數據,這些數據具有嚴格的計算過(guò)程,高質(zhì)量控制標準。
“這兩項研究可以互補”,加拿大多倫多Lunenfeld-Tanenbaum研究院的 Anne-Claude Gingras(未參與該項研究)評價(jià)道,“前者霍普金斯大學(xué)的研究真正發(fā)現了之前蛋白質(zhì)組學(xué)的缺陷所在,從單一來(lái)源進(jìn)行了人體蛋白質(zhì)的研究,有助于通過(guò)他們的數據進(jìn)行簡(jiǎn)單比對”,而后者ProteomeDB的研究,則將新內容與原有蛋白質(zhì)組數據聯(lián)系在了一起,正如Küster所說(shuō),就是發(fā)展和完善原有數據庫,進(jìn)一步從蛋白研究中匯集更多資源。
此外Küster實(shí)驗室通過(guò)比較每個(gè)蛋白與mRNA水平的比例,發(fā)現翻譯比例對于每種mRNA轉錄來(lái)說(shuō)是一個(gè)恒定特征。“這是一個(gè)令人驚訝的發(fā)現,具有重要意義”Gingras說(shuō)。
Steen表示贊同,“如果這個(gè)觀(guān)點(diǎn)正確的話(huà),那么將會(huì )給原有的法則提出新的內容。之前研究人員發(fā)現轉錄組合蛋白質(zhì)組數據好似一個(gè)硬幣的兩面,”他說(shuō),“但這一分析又進(jìn)一步表明,至少在穩定狀態(tài)下,一旦一對mRNA/蛋白比例被計算出來(lái),那么蛋白水平就能從特定的mRNA水平中估算出來(lái)。”
這兩項研究提出的證據表明之前被認為不能翻譯的DNA區域其實(shí)能進(jìn)行翻譯,這其中包括Küster 研究組發(fā)現的400多個(gè)基因間非編碼RNAs(lincRNAs),以及Pandey研究組發(fā)現的193個(gè)新蛋白。但是這些新發(fā)現的蛋白質(zhì)的生物學(xué)意義還不清楚。
“目前的基因組注釋主要基于計算運算法則,”約翰霍普金斯大學(xué)研究員,人類(lèi)蛋白質(zhì)組圖譜作者之一Min-Sik Kim說(shuō),“這些預測可能并不完全準確,這就是為什么需要直接分析蛋白的原因。”
Pandey研究組目前正在分析進(jìn)一步分析胎兒蛋白質(zhì)組,以及將蛋白質(zhì)翻譯后修飾數據添加到數據庫中。這一研究組還希望能深入探索人腦器官,這一部分是目前公布的蛋白質(zhì)組圖譜中不包含的部分。
“我們一般認為,信息的傳遞是從基因組到轉錄組,再到蛋白質(zhì)組。這些最新研究卻表明,這其實(shí)是一個(gè)雙向的途徑——蛋白質(zhì)組也可以用于注釋基因組。其重要性在于利用這些數據集,我們能進(jìn)一步注釋基因組,改進(jìn)預測轉錄和翻譯的運算法則”,Steen說(shuō),“基因組學(xué)領(lǐng)域將從蛋白質(zhì)組學(xué)數據中獲益良多。”
肺癌已成為我國惡性腫瘤發(fā)病率和死亡率之首,分別占比19.59%和24.87...[詳細]
在我國,肺癌發(fā)病率位居惡性腫瘤首位,約為46.08/10萬(wàn),占所有惡性腫瘤...[詳細]
意見(jiàn)反饋 關(guān)于我們 隱私保護 版權聲明 友情鏈接 聯(lián)系我們
Copyright 2002-2025 Iiyi.Com All Rights Reserved