利用分析Unigene在转录组中表达模式的方法拼接盐角草铵转运基因/Assembling of an ammonium transporter gene in Salicornia europaea by expression pattern analysis of Unigene in transcriptome[J]

Abstract

RNA-seq技术能够全面快速地获得物种在某一状态下的转录本序列信息,但测序并组装后的大量Unigene往往不包含完整ORF (Open reading frame).转录组库具有一定的冗余性,存在着属于同一个转录本的Unigene,这些Unigene因为无重叠区不能拼接而存在转录组库中.基于这种情况,为了拼接铵转运蛋白家族Unigene,首先挑选注释为AMT (Ammonium transporter)且ORF不完整的所有Unigene(5条),通过分析Unigene在4个转录组的表达模式,其中2条Unigene (Uni4和Uni5)具有相同的表达模式,推测可能来自同一转录本.然后通过NCBI blastx将这2条Unigene与参考物种的AMT蛋白质比对,确定其在转录本的位置及序列相互间没有交叠(如果两条编码序列相互交叠则不能组成同一个转录本).结果发现Uni4和Uni5分别位于参考转录本5 '端和3'端位置,因此假定它们属于同一个转录本,中间空缺约120 bp未知序列.通过试验验证,分别在Uni4和Uni5上设计单正向引物和单反向引物,PCR扩增得到约800 bp片段,将其测序并与两条Unigene比对,证实Uni4和Uni5属于同一转录本且获得了缺失的未知序列.最终拼接得到1 667 bp序列,包含l 482 bp完整ORF,编码494个氨基酸,通过系统进化分析将其归类为amt1亚家族,命名为Seamt1.生物信息学手段预测SeAMT1蛋白与已知的其他物种AMT性质相似.本研究采用转录组Unigene表达模式聚类的方法挖掘潜在的同一转录本Unigene,并且通过另外两组Unigene检验了该方法的可行性.这一便捷方法有助于转录组中Unigene的延伸和拼接,有助于完整ORF的获得及后期基因功能研究

    Similar works