
2025年6月12日,美國麻省理工和博德研究所Pardis C.Sabeti團(tuán)隊在Science上發(fā)表了一篇題為“Pan-viral ORFs discovery using massively parallel ribosome profiling"的論文,結(jié)合寡核苷酸合成文庫和Ribo-seq核糖體印跡分析,開展泛病毒ORF挖掘,本研究旨在建立一種高效、無偏的泛病毒ORFs發(fā)現(xiàn)方法。
盡管病毒基因組測序技術(shù)已有很大進(jìn)展, 但病毒基因組的功能注釋長期滯后于測序進(jìn)展。除了已注釋的經(jīng)典開放閱讀框(ORFs)之外,尤其是不符合傳統(tǒng)ORF的定義的非經(jīng)典ORFs(如非ATG起始、長度<100aa)在感染、免疫調(diào)控中的作用尚未系統(tǒng)探索。
傳統(tǒng)的病毒基因組注釋方法主要依賴于生物信息學(xué)預(yù)測,存在假陽性率高、無法區(qū)分功能性和非功能性O(shè)RFs等局限性。更重要的是,許多高致病性病毒(如埃博拉病毒、尼帕病毒等)難以在實驗室條件下培養(yǎng),需要在生物安全三級(BSL-3)或四級(BSL-4)設(shè)施中操作,極大限制了對這些病毒基因組的深入研究。
核糖體印跡分析也稱為Ribo-seq,此項技術(shù)的發(fā)展極大提升了檢測基因組翻譯區(qū)域的能力。該技術(shù)利用對核糖體結(jié)合的RNA片段進(jìn)行深度測序,確定核糖體占位情況,從而以單核苷酸分辨率揭示翻譯區(qū)域。它已經(jīng)在哺乳動物細(xì)胞、酵母、細(xì)菌和病毒中發(fā)現(xiàn)了許多非經(jīng)典ORFs,包括5′非翻譯區(qū)(5′UTRs)中的上游ORFs(uORFs)和上游重疊ORFs(uoORFs)、非編碼RNA中的短ORFs以及已注釋編碼序列中的重疊內(nèi)部ORFs(iORFs)。
然而,傳統(tǒng)核糖體圖譜技術(shù)在病毒研究中面臨三大瓶頸:病毒培養(yǎng)困難、安全要求高、遺傳多樣性強(qiáng)。每種病毒需要特定的培養(yǎng)系統(tǒng),部分病毒無法在實驗室培養(yǎng);高致病性病毒需要高等級生物安全設(shè)施;單一病毒株分析無法覆蓋變異譜系,導(dǎo)致多數(shù)病毒的翻譯圖譜仍是"黑箱"。
為解決這些挑戰(zhàn),博德研究所的Shira Weingarten-Gabbay和Pardis C. Sabeti團(tuán)隊開發(fā)了大規(guī)模平行核糖體圖譜(MPRP)技術(shù)。該技術(shù)創(chuàng)新性地將高通量寡核苷酸合成與核糖體圖譜技術(shù)相結(jié)合,在一次實驗中可同時分析數(shù)百種病毒的翻譯事件,無需病毒培養(yǎng)或高生物安全等級設(shè)施,極大降低了實驗門檻。這一技術(shù)突破為病毒基因組研究提供了全新的方法學(xué)工具,有望改變我們對病毒蛋白質(zhì)組的認(rèn)知。
MPRP技術(shù)的核心原理是利用合成寡核苷酸文庫替代活病毒,通過Ribo檢測病毒基因組片段的翻譯活性。
1.文庫構(gòu)建:研究團(tuán)隊設(shè)計了包含20,170個合成寡核苷酸的文庫,覆蓋679種人類相關(guān)病毒基因組的3,976個基因的5'非翻譯區(qū)(5'UTR)和編碼區(qū)起始區(qū)域。每個寡核苷酸包含60個核苷酸的5'UTR和140個核苷酸的編碼區(qū),確保能夠捕獲翻譯起始位點和上游調(diào)控序列。
2.并行檢測:將文庫轉(zhuǎn)染至HEK293T/A549細(xì)胞,在病毒感染相關(guān)應(yīng)激條件(如poly(I:C)、內(nèi)質(zhì)網(wǎng)應(yīng)激)下進(jìn)行核糖體分析,使用抑制劑區(qū)分起始/延伸核糖體。
3.數(shù)據(jù)處理:采用PRICE(Probabilistic Ribo-seq Inference of Coding Exons)算法從核糖體足跡數(shù)據(jù)中推斷ORFs,并通過免疫肽組學(xué)驗證HLA-I呈遞。
4.跨平臺驗證:對比MPRP數(shù)據(jù)與HCMV、VSV等天然感染細(xì)胞的Ribo-seq結(jié)果,確保可靠性。
3.1 病毒ORFs的大規(guī)模發(fā)現(xiàn)
MPRP技術(shù)在679種病毒中實現(xiàn)了數(shù)量級的發(fā)現(xiàn)突破,共鑒定出5,381個病毒ORFs,其中4,208個為非經(jīng)典ORFs,覆蓋皰疹病毒、冠狀病毒、絲狀病毒等21個病毒家族。這些新發(fā)現(xiàn)的ORFs極大擴(kuò)展了我們對病毒蛋白質(zhì)組的認(rèn)知邊界,揭示了病毒基因組中存在大量此前未被注釋的翻譯區(qū)域。
ORF類型的多樣性令人矚目。研究發(fā)現(xiàn)了多種類型的非經(jīng)典ORFs:上游ORFs(uORFs)位于5'UTR區(qū)域,如HCMV UL45 5'UTR的uORF可導(dǎo)致核糖體停滯,抑制主CDS翻譯;內(nèi)部重疊ORFs(iORFs)如IAV M1基因+1框架的iORF,在H5N1等6種流感毒株中保守存在;非ATG起始ORFs如HCMV中以GUG、UUG起始的ORFs,編碼20個氨基酸以下的微蛋白。這些不同類型的ORFs可能在病毒生命周期中發(fā)揮多樣化的功能。

技術(shù)性能評估顯示,在3,976個注釋的病毒CDS中,PRICE算法成功捕獲了1,136個(28%)在注釋起始密碼子處起始的ORFs,錯誤發(fā)現(xiàn)率為0.05。雖然捕獲率看似不高,但考慮到實驗系統(tǒng)的復(fù)雜性和病毒基因組的多樣性,這一結(jié)果仍具有重要意義。更重要的是,PRICE檢測到的CDS在兩個生物學(xué)重復(fù)中的核糖體占用率顯示出高相關(guān)性(R=0.93),證明了檢測結(jié)果的可靠性。

3.2 非經(jīng)典ORFs的免疫原性驗證
研究的一個重要發(fā)現(xiàn)是非經(jīng)典ORFs具有顯著的免疫原性。通過分析感染細(xì)胞的免疫肽組數(shù)據(jù)集,研究團(tuán)隊發(fā)現(xiàn)MPRP鑒定的非經(jīng)典ORFs能夠產(chǎn)生人類白細(xì)胞抗原I類(HLA-I)相關(guān)肽段。在HCMV中發(fā)現(xiàn)了4個非經(jīng)典ORF來源的5種肽段,如UL4 5'UTR uORF的VLSAKKLS、UL135 5'UTR uoORF的YPAPRPQAI;在VACV中發(fā)現(xiàn)了2種肽段,如L3L iORF的HRNKIINAEK,這些肽段均被HLAthena預(yù)測為高親和力HLA-I結(jié)合者(MSi rank ≤2)。
免疫貢獻(xiàn)的量化分析揭示了非經(jīng)典ORFs的重要性。將MPRP鑒定的ORF納入HCMV注釋后,HLA-I呈遞肽段數(shù)量增加7.4%,且非經(jīng)典ORF的單位長度產(chǎn)肽量顯著高于經(jīng)典ORF(P<10?3)。這一發(fā)現(xiàn)表明,非經(jīng)典ORFs不僅能夠編碼功能性肽段,還具有更高的免疫原性密度,可能在病毒免疫逃逸和宿主免疫應(yīng)答中發(fā)揮重要作用。
3.3 uORF對病毒翻譯的調(diào)控機(jī)制
研究揭示了上游ORFs(uORFs)對病毒蛋白翻譯的精細(xì)調(diào)控機(jī)制。在正常條件下,2,418個病毒基因中37%的核糖體聚集在5'UTR(uORF區(qū)域),抑制主CDS翻譯;Na?AsO?誘導(dǎo)eIF2α磷酸化后,核糖體向CDS轉(zhuǎn)移,5'UTR聚集比例降至19%,證實uORF通過eIF2α通路調(diào)控翻譯起始。
功能保守性證據(jù)表明uORF的調(diào)控作用在不同實驗條件下具有一致性。HCMV UL4 5'UTR的uORF在MPRP和天然感染細(xì)胞中均導(dǎo)致核糖體停滯,其編碼的核糖體停滯肽(RAP)可抑制主蛋白翻譯。三核苷酸周期性分析顯示,在5'UTR區(qū)域檢測到的uORFs具有活躍的核糖體翻譯特征,且在LTM抑制劑存在下,這些uORFs的起始密碼子處顯示強(qiáng)烈的起始核糖體信號。
研究還發(fā)現(xiàn),在應(yīng)激條件下(如eIF2α磷酸化),核糖體更容易繞過5'UTR中的uORFs,在主CDS處起始翻譯,這與抑制性uORF的預(yù)期行為一致。這一發(fā)現(xiàn)為理解病毒如何在不同細(xì)胞環(huán)境中調(diào)控蛋白合成提供了重要見解,也為開發(fā)針對病毒翻譯調(diào)控的治療策略提供了潛在靶點。
MPRP技術(shù)為病毒基因組研究帶來了范式轉(zhuǎn)變,通過揭示病毒基因組中大量"隱藏"的ORFs, 不僅擴(kuò)展了病毒蛋白質(zhì)組的邊界,更為疫苗開發(fā)、藥物研發(fā)和疫情防控提供了重要機(jī)遇。 這一技術(shù)突破是科學(xué)技術(shù)的進(jìn)步。