SboM-AG3 基因組的一般特征
基因組序列以單個重疊群形式獲得,代表了 19 倍覆蓋度的共識讀取。基因組大小約為 158,091 bp,G+C 含量為 50.4%;后者與其宿主細菌鮑氏志賀氏菌(51 mol%)幾乎相同。由于脈沖場凝膠電泳表明噬菌體基因組約為 165 kb,該噬菌體基因組是末端冗余的,具有 3.5 kb 的冗余區(qū)域。為了與沙門氏菌噬菌體 ViI 進行比較,SboM-AG3 基因組在注釋前在 rIIA 同源物上游處打開。
開放閱讀框(ORFs)的鑒定和分析
序列中沒有通過 BLASTX 分析證明存在的移碼。基因組使用 AutoFACT 進行自動分析,輔以 tRNA 分析;并通過使用 Kodon 結(jié)合每個蛋白質(zhì)的 BLASTP、PFAM、TMHMM 和 Phobius 分析進行手動注釋。
基因組中共鑒定出 216 個 ORFs(圖 3;附加文件 1,表 S1)。共有 146,356 個核苷酸(基因組的 92%)參與編碼推定蛋白質(zhì)。使用了四種不同的起始密碼子:ATG、GTG、CTG 和 TTG,頻率分別為 95.4%、3.2%、0.9% 和 0.5%。在 2009 年初首次注釋時,只有 107 個 ORFs 的產(chǎn)物與 NCBI 非冗余數(shù)據(jù)庫中的蛋白質(zhì)具有同源性。使用 CoreGenes 進行的詳細比較蛋白質(zhì)組學分析顯示,該噬菌體與原綠球藻噬菌體 P-SSM2 共享 46 個同源物,與大腸桿菌噬菌體 T4 共享 57 個,與氣單胞菌噬菌體 Aeh1 共享 60 個,有趣的是,與德爾夫特菌噬菌體共享 69 個(該噬菌體基因組大小為 8,006 bp,G+C 含量為 42.9%),這表明 SboM-AG3 是有尾噬菌體目 T4 超家族的一個外圍成員。
最近的分析顯示,該噬菌體編碼的大多數(shù)蛋白質(zhì)(179 個或 82.8%)與沙門氏菌噬菌體 ViI 顯示序列相似性。另一個與 SboM-AG3 共享序列相似性的病毒是大腸桿菌 O157:H7 噬菌體 PhaxI,其在 GenBank 中由六個片段代表(HQ259285-HQ259290)。
密碼子使用和 tRNAs
發(fā)現(xiàn) ΦSboM-AG3 基因組包含四個 tRNA 基因,對應(yīng)三種氨基酸,即絲氨酸(反密碼子:TGA 和 GCT)、天冬酰胺(GTT)和酪氨酸(GTA)。雖然描述沙門氏菌噬菌體 ViI 基因組的稿件表明存在五個 tRNAs,但這些數(shù)據(jù)未包含在其 GenBank 提交中(FQ312032)。這兩種病毒共享 tRNA-Asn、tRNA-Tyr 和 tRNA-Ser(GCT),但不同之處在于 ViI 額外有兩個 tRNA,分別是 Met(CAT) 和 Gln(TTG) 的 tRNA,而 SboM-AG3 擁有第二個絲氨酸-tRNA。在這兩種病毒中,tRNA 基因在基因組上的相對位置相同。SboM-AG3 tRNAs 的 GC 含量在 53.9% 到 56.2% 之間。將這些 tRNAs 添加到 ORFs 中,SboM-AG3 基因組的總編碼容量為 146,481 bp 或 92.7%。將噬菌體的密碼子使用模式與其宿主(鮑氏志賀氏菌)進行比較表明,這些 tRNA 都不太可能增強翻譯。我們鑒定了六個在噬菌體基因中顯著過表達的密碼子(頻率≥30% 且增加≥1.5 倍)(苯丙氨酸[UUC]、異亮氨酸[AUG]、脯氨酸[CCU]、賴氨酸[AAG]、天冬氨酸[GAC] 和精氨酸[CGU]),然而噬菌體并未指定相應(yīng)的 tRNA。
在以下部分,我們將簡要討論一些噬菌體編碼蛋白的作用。
核苷酸代謝、DNA 復制和重組
ΦSboM-AG3 基因組包含許多參與核苷酸代謝、DNA 復制和重組的基因。在前一類中,有 dNTP 二磷酸酶(orf063)、一個推定的煙酰胺磷酸核糖基轉(zhuǎn)移酶(orf149)、NrdA(orf093)、NrdB(orf090)和谷氧還蛋白(orf088)同源物,以及胸苷酸合成酶(orf066)。至少鑒定出九個基因在大腸桿菌噬菌體 T4 的 DNA 復制中發(fā)揮重要作用,包括 DNA 聚合酶(orf236)、引物酶(orf102)、三個被定義為具有解旋酶活性的蛋白質(zhì)(gp orf041/059/125)和 DNA 連接酶(orf045)。重組蛋白包括兩個拓撲異構(gòu)酶(orf014/017)、一個 T4 gp46/47 重組酶對(orf119/121)和 UvsWXY 同源物(orf168/061/170)。
裂解
在基因組中未檢測到編碼溶菌酶或裂解酶的基因。Holin 通常是小蛋白質(zhì),其特征在于存在兩個或三個跨膜(TM)結(jié)構(gòu)域。這些標準排除了基因 9.1、78、117、244 或 246,它們分別具有 65、103、54、65 和 61 個氨基酸。由于 holin 基因通常在噬菌體基因組上相鄰排列,對基因 10、11、79、80、243 和 247 進行的詳細 PSI-BLAST 檢查未能揭示溶菌酶同源物或結(jié)構(gòu)域。
轉(zhuǎn)錄和調(diào)控序列
在沙門氏菌噬菌體 ViI 的基因組序列中未鑒定出任何轉(zhuǎn)錄調(diào)控位點。基于與由 Sigma 70 識別的共識管家大腸桿菌啟動子(TTGACA(N15-18)TATAAT)的序列同源性,初步鑒定了八個啟動子(附加文件 2,表 S2),它們可能用于早期轉(zhuǎn)錄。
T4 相關(guān)噬菌體中晚期基因的轉(zhuǎn)錄起始涉及核心 RNA 聚合酶、噬菌體編碼的 sigma 因子(gp55)、一個輔助蛋白(gp33)和滑動夾蛋白 gp45 之間的復合物,該復合物“促進轉(zhuǎn)錄延伸”。這適用于 SboM-AG3 的產(chǎn)物。SboM-AG3 編碼所有三種蛋白質(zhì)的同源物:gp55(Orf122)、gp33(Orf076)和 gp45(Orf165)。基于晚期啟動子的序列(TATAAATA)并允許一個錯配,在 SboM-AG3 的基因組中鑒定了 17 個推定的晚期啟動子。在三種情況下,推定的啟動子可能導致被推定為晚期產(chǎn)物的表達:P orf072(T4 樣 gp2 DNA 末端保護蛋白上游)、P orf084(gp5 基板中心亞基)和 P orf217(gp6 基板楔形亞基)。構(gòu)建了一個 WebLogo,從中得出的共識序列 TNT(N3)A(N10)C(N2)ATNAATA 被用于搜索基因組中其他潛在的晚期啟動子,允許一個錯配。鑒定出了三個。
發(fā)現(xiàn)了四十個基因間 ρ-非依賴性終止子,這種情況讓人聯(lián)想到大腸桿菌噬菌體 T1(附加文件 2,表 S2)。
相關(guān)新聞推薦
1、牛皮膚結(jié)節(jié)病毒分離鑒定、生長曲線、免疫熒光、TCID50測定(三)
