更全的杂志信息网

基于RNA-seq技术的甘蓝型油菜新转录本的鉴定

更新时间:2009-03-28

转录组是特定时间特定组织内由基因转录产生的全部RNA转录本,包括编码蛋白质的RNA和非编码RNA。转录组测序(RNA-seq)是借助于近年来发展迅速的高通量测序技术对特定细胞在某一功能状态下几乎所有转录出来的RNA进行测序的一种技术方法[1]。随着二代测序技术通量高、成本低、准确度和灵敏度高等优势,RNA-seq近年来成为揭示基因转录和表达调控规律的有效手段,在植物发育、抗病抗逆、分子标记开发和系统发生等方面得到了广泛的应用[2-6]。同时RNA-seq在基因结构变异、低丰度转录本和未知转录本的检测方面也发挥了重要的作用[7-13]

三是聚焦打仗导向。战斗力是军队建设唯一的根本的标准。军民融合发展的质效如何,最终落脚点要看在军地资源双向互动互促的过程中,军队战斗力建设能否得到显著提升。为此,必须始终坚持一切为战的根本指向,牢固树立战争观念、备战意识,真正以能打仗打胜仗这个指挥棒来统筹谋划军民融合、协调推动军民融合。通过促进经济发展方式转变和经济结构调整,找准生产力和战斗力的最佳契合点,使国防和军队建设深度融入经济社会大体系,依托整个国家力量全面提升我军备战打仗能力。

甘蓝型油菜(Brasscia napus)是世界四大油料作物之一,是我国重要的食用油来源和植物蛋白饲料资源之一,在国民经济和人们日常生活中占有重要地位。甘蓝型油菜基因组(AACC) 是白菜(B.rap)基因组(AA)与甘蓝(B.oleracea)基因组(CC)杂交后经过染色体加倍形成的[14],其基因组参考序列于2014年公开发布,为油菜功能基因组学的研究奠定了良好的基础[15]。测序发现,油菜基因组大小为849.7 Mb,由101 040个基因组成,但是由于其基因组极其复杂和注释方法的局限性,油菜基因组还存在基因组组装不完整、注释信息不完善、新转录本的遗漏等问题。目前,利用RNA-seq研究甘蓝型油菜发育、抗逆等的报道较多[16-18],但是甘蓝型油菜中新转录本的鉴定尚缺乏深入的研究。鉴于RNA-seq技术的优点和甘蓝型油菜基因组注释的不完整性,利用RNA-seq和生物信息分析技术预测甘蓝型油菜基因组中尚未注释的转录本,并通过RT-PCR(Reverse transcription-PCR)和克隆测序的方法来验证,以期进一步完善油菜基因组和转录组注释信息,为进一步挖掘油菜基因组中优良的功能基因提供数据基础。

1 材料和方法

1.1 试验材料

本研究以甘蓝型油菜W系为试验材料。选取试验基地生长3周的油菜幼苗,取叶片于液氮中,置于-80 ℃ 冰箱中保存。

K1+160—K1+310边坡设计开挖6级,坡高52.9 m,土层至上而下以此为坡积粉质黏土、全风化花岗岩、碎块状强风化花岗岩,为超高路堑边坡。具体施工方案见表1,具体设计断面图见图4。

1.2 试验方法

式中:μf为引导决策函数,当个体满足要求时取0,否则取1;μci为惩罚因子,由于惩罚因子的指数规律变化优于线性动态变化[14],基于SA原理将惩罚因子改良为

1.2.5 新转录本的RT-PCR和测序验证 从鉴定的候选转录本中选取一部分,以Primer Premier 5.0根据其序列设计引物(表1);提取甘蓝型油菜叶片RNA,反转录成cDNA,进行PCR扩增,将扩增产物用琼脂糖电泳检测,然后纯化回收,连接T载体,转化DH5α感受态细胞,挑选阳性克隆,送公司测序。

应用Illumina HiSeq 2500 高通量测序平台对构建好的文库进行测序,测序读长为双端125 bp。

将每个样品比对得到的bam文件,借助Cufflinks软件与甘蓝型油菜参考基因组的注释文件进行位置信息的比较和整合,初步建立每个样品的转录本文库;通过cuffmerge命令的合并功能对得到的每个样品的转录本文库进行整合,得到1个完整的基因组注释文件merged.gtf;然后用cuffcompare命令与甘蓝型油菜已知的转录本信息进行比较,从而鉴定候选的新转录本。

第三届“跨越太平洋——中国艺术节”于2016年9月8日至10月23日在旧金山湾区、拉斯维加斯及西雅图等地展开,13项中美文化交流活动,各项音乐舞蹈、歌剧和戏曲表演、艺术品展览、电影节和文学讲座等相得益彰。“绘意中国—百年老店西泠印社名家作品美国展”“寂寞修正果-刘振夏人物画展”“弘艺敦谊、情系中华——两岸四地当代名家书画展”“跨越太平洋——新丝路美国邀请展”等,及著名作家王蒙在旧金山总图书馆所做的“这边风景——我的新疆十六年”演讲,都吸引了大批观众和听众。

1.2.3 测序数据的质控及比对 对测序得到的raw data,去除含有adapter的reads、去除N碱基比例大于5%的reads、去除低质量的reads得到clean data。从http://plants.ensembl.org/index.html下载已公布的甘蓝型油菜参考基因组序列,用Bowtie 2软件对油菜参考基因组序列建立索引[19],用Tophat 2软件将得到的clean data与参考基因组序列进行mapping[20],mapped reads以bam格式文件输出。

1.2.2 cDNA文库构建和测序 样品RNA检测合格后,进行cDNA文库构建,主要流程如下:用带有Oligo(dT)的beads富集mRNA;加入fragmentation buffer将mRNA打断成短片段;以mRNA为模板合成第一链cDNA,后加入buffer、dNTPs和DNA Polymerase Ⅰ合成第二链cDNA;随后利用AMPure XP beads纯化双链cDNA;纯化的双链cDNA再进行末端修复、加A尾并连接测序接头;然后用AMPure XP beads进行片段大小选择;最后通过PCR扩增富集得到最终的cDNA文库。

 

表1 甘蓝型油菜新转录本及其PCR扩增引物

  

转录本ID基因组位置/bp引物名称引物序列(5′—3′)XLOC_028977chrA08[+]10 119 272—10 120 776XLOC_028977_FAGAAAAGAAAAAAAGACAAAACAAGXLOC_028977_RCATAAAAACTTCACCAAGAAAACAAXLOC_056607chrC03[+]28 934 120—28 935 330XLOC_056607_FTCCATAGGAAGAAAACCAGAGAAGXLOC_056607_RGCTCTTTTTCAGGACAGTCTTCAAXLOC_009511chrA03[+]19 494 095—19 495 225XLOC_009511_FCTGCGGAATCCAAATCTCTCTCTXLOC_009511_RAGATGATGCCTACAATGAGACCAXLOC_042556chrAnn_random[+]45 765 184—45 766 938XLOC_042556_FCTCGCCCGATAAAGAAAGAAAGXLOC_042556_RTTCCAAGACTTCCGTGTCCTGAXLOC_097486chrCnn_random[+]78 214 471—78 215 875XLOC_097486_FCTCTAATGGATTTTATGGTCTGAXLOC_097486_RCAACAAGTTCTCGTTATTACAATXLOC_095366chrCnn_random[+]32 804 280—32 805 072XLOC_095366_FTTTTTTTCTGTCCGATCTAGTTTCXLOC_095366_RACGAAGGCCCAAATACAACAXLOC_097244chrCnn_random[+]72 956 386—72 957 297XLOC_097244_FCTTTCGGACAGACTACGCATXLOC_097244_RTCCAAACAAGGATGGGGTAGXLOC_017634chrA05[+]14 408 523—14 410 413XLOC_017634_FAGCGGTCACTCACCCTCTGGXLOC_017634_RGTGCCGAGAGCAAAGGACAA

 

续表1 甘蓝型油菜新转录本及其PCR扩增引物

  

转录本ID基因组位置引物名称引物序列(5′—3′)XLOC_015102chrA04[-]858 276—859 958XLOC_015102_FGCTTCTTTGTCATCAGGGCAGTXLOC_015102_RATAAAACCAGCTCCATTCGATTXLOC_066937chrC04[-]41 254 741—41 255 800XLOC_066937_FTTGTTTGGACCACTGAGAAGATAATXLOC_066937_RGATGATGACAAACACCACTACAAAAXLOC_092505chrC09[-]40 330 932—40 331 531XLOC_092505_FTGCGTTTCTGCTGAGCGTCTXLOC_092505_RACAAGCTCACCAAACAGGAAXLOC_073270chrC05_random[-]1 922 470—1 923 829XLOC_073270_FAGATACCACCAGCATTACCAGCXLOC_073270_RATCCTCTCTACCCACGCCTCATXLOC_046341chrC01[+]26 732 008—26 735 192XLOC_046341_FAATCATCGTCTTTTCTCTTTTGXLOC_046341_RATCTAAAACCTTACACAAACGGXLOC_100972chrCnn_random[-]65 472 367—65 473 578XLOC_100972_FGTGATTTCCTCCAACTAAGACAXLOC_100972_RTGACACAGAGGTGATTATCCAGXLOC_041903chrAnn_random[+]32 362 114—32 366 099XLOC_041903_FAAAGGAAATCAAAAACAAATAAATXLOC_041903_RATAGTTCCCATCTCCTGGTAATCC

2 结果与分析

2.1 甘蓝型油菜RNA质量的检测

经过质量控制后总计得到848 866 766条clean reads,与甘蓝型油菜参考基因组序列进行比对。从表2可以看出,各样品的reads与其参考基因组序列的比对率在65.00%~85.40%,说明测序数据的比对率正常。

2.2 甘蓝型油菜RNA测序数据处理和分析

经检测,17个甘蓝型油菜叶片RNA均符合cDNA文库构建的标准:OD260/OD280为1.8~2.2、28S rRNA/18S rRNA≥1.5、OD260/OD230≥1.96、RIN值≥9.7,表明RNA纯度和完整性较好。

 

表2 clean data与参考基因组序列比对结果

  

样品编号测序序列总数/条多位点比对率/%单位点比对率/%比对上的测序序列占比/%156 222 4167.2060.0067.20249 212 3507.8076.6084.40345 146 3668.3077.1085.40448 821 7708.4075.2083.60554 208 5027.9061.6069.50655 237 3267.1061.1068.20738 546 0848.0073.2081.20860 197 8027.5061.8069.30939 271 2268.5074.9083.401057 124 5167.2060.0067.201141 957 3328.4076.4084.801242 562 2148.4075.8084.201347 347 1748.9074.2083.101449 824 6708.3074.4082.701562 958 9247.6063.6071.201658 006 3447.5061.8069.301742 221 7507.1057.9065.00

2.3 甘蓝型油菜新转录本的识别

通过Tophat/Cufflinks一系列流程的分析,将比对成功的序列进行组装整合。然后与已知甘蓝型油菜参考基因组注释转录本信息进行比较,最终获得了由612 085个外显子与467 743个内含子组成的103 310个基因位点(包含158 004个mRNA),其中137 756个转录本是有多个外显子组成的。其中,甘蓝型油菜已知注释的101 040个基因位点全部包含在内。新鉴定的外显子有33 811个,新鉴定的内含子有26 839个。

对于鉴定到的158 004个转录本,可划分为6类(表3):与内含子链匹配的转录本; 潜在的新转录本; 与已知外显子重叠的转录本;内含子与反义链上已知内含子重叠的转录本; 未知的基因间隔区转录本;外显子与反义链上已知转录本重叠的转录本。 其中,未获得注释的7 720个转录本被划分为未知的基因间隔区转录本。

1.2.4 转录本的表达丰度计算和新转录本的鉴定 转录本的丰度通过计算FPKM(Fragments per kilobase per million mapped reads)值来度量。通过Cufflinks软件包中的cuffdiff命令来实现对每个样品表达丰度的计算[21]

1.2.1 RNA提取及检测 油菜叶片RNA的提取采用Trizol法,按照说明书严格操作。利用Nanodrop检测RNA的纯度,Agilent 2100检测RNA的完整性。

 

表3 新鉴定的甘蓝型油菜转录本和已知转录本的比较结果

  

标志符转录本类型转录本数/个=与内含子链匹配的转录本96 258j潜在的新转录本51 350o与已知外显子重叠的转录本2 013s内含子与反义链上已知内含子重叠的转录本11u未知的基因间隔区转录本7 720x外显子与反义链上已知转录本重叠的转录本652

2.4 甘蓝型油菜新转录本的鉴定及验证

根据转RNA-seq预测的转录本单元及其表达丰度,本研究选取了18个平均表达丰度在100以上的新鉴定的转录本进行RT-PCR扩增并测序验证,结果发现15个新转录本扩增条带很清晰(图1)。

为了验证结果的准确性和可靠性,将15个转录本PCR扩增产物进行克隆,挑选转化子送公司测序,结果发现,测序得到的序列和转录组数据分析组装出来的序列是一致的(图2)。

 

M:Marker;1:XLOC_028977; 2:XLOC_056607;3:XLOC_009511;4:XLOC_042556;5:XLOC_097486;6:XLOC_095366;7:XLOC_097244;8:XLOC_017634;9:XLOC_015102;10:XLOC_066937;11:XLOC_092505;12:XLOC_073270;13:XLOC_046341;14:XLOC_100972;15:XLOC_041903

图1 新转录本RT-PCR扩增电泳检测结果

  

Sequencing表示PCR产物测序序列,XLOC_095366表示通过转录组分析预测的转录本序列图2 XLOC_095366转录本比对结果

3 结论与讨论

本研究利用RNA-seq和生物信息学技术对甘蓝型油菜叶片转录组文库中的新转录本进行了挖掘和鉴定,并采用RT-PCR和克隆测序对鉴定到的新转录本进行了验证。研究结果表明,在甘蓝型油菜基因组已知基因的间隔区发现了7 720个新转录本,通过RT-PCR扩增验证了15个新鉴定的转录本,为油菜基因组提供了补充性的注释信息,为进一步挖掘甘蓝型油菜基因组中优良的功能基因提供数据基础。

通过思想政治理论课教学能使教师自身的教学指导能力与科研能力得到不断提高;促使教师更加全面、深入地接触和了解社会,拓宽了教师的视野,以便他们能够寻找更具有价值的科研和教研课题,进一步增强广大高校教师的科研意识,全面提高他们的科研能力。目前,我们的许多思想政治课教师只做到了“教书”,却忽视了“育人”。而在理论课教学过程中,教师不仅能够在教学中发现问题,还能够根据学生的反馈不断地完善自身的教育教学,继而明确教学的方向,加快创新步伐,并最终切实地提高思想政治理论课教学的实效性。

同一个基因通过可变剪接后形成多种mRNA成熟体即不同的转录本,经翻译产生结构和功能不同的蛋白质或者具有调控功能的非编码RNA。从PCR扩增检测的电泳图中可以看出,新鉴定的转录本有部分扩增的条带不是单一的,说明这些转录本可能存在不同的可变剪接体。那么需要进一步深入研究这些转录本的特点,区分每个转录本是编码蛋白质的基因还是具有调控功能的非编码RNA。对于具有编码功能的转录本,要深入研究其功能并挖掘可能存在的不同剪接体。对于在植物生长发育、逆境胁迫等方面发挥着重要作用的非编码RNA,要克隆这些非编码RNA并研究它们对功能基因的调控机制。因此,深入挖掘和研究这些新转录本及其作用机制对完善甘蓝型油菜基因组注释、为分子育种提供丰富的基因信息具有重要的理论意义。

参考文献:

[1] Wang Z,Gerstein M,Snyder M.RNA-Seq:A revolutionary tool for transcriptomics[J].Nature Reviews Genetics,2009,10(1):57-63.

[2] Schlueter U,Denton A K,Braeutigam A.Understanding metabolite transport and metabolism in C4 plants through RNA-seq[J].Current Opinion in Plant Biology,2016,31:83-90.

[3] Martin L B,Fei Z,Giovannoni J J,et al.Catalyzing plant science research with RNA-seq[J].Frontiers in Plant Science,2013,4:66.

[4] Kakumanu A,Ambavaram M M,Klumas C A,et al.Effects of drought on gene expression in maize reproductive and leaf meristem tissue revealed by RNA-Seq[J].Plant Physiology,2012,160(2):846-867.

[5] Wei L,Li S,Liu S,et al.Transcriptome analysis of Houttuynia cordata Thunb.by Illumina paired-end RNA sequencing and SSR marker discovery[J].PLoS One,2014,9(1):e84105.

[6] Wei Z,Sun Z,Cui B,et al.Transcriptome analysis of colored calla lily (Zantedeschia rehmannii Engl.) by Illumina sequencing:De novo assembly,annotation and EST-SSR marker development[J].Peer J,2016,4:e2378.

[7] Chettoor A M,Givan S A,Cole R A,et al.Discovery of novel transcripts and gametophytic functions via RNA-seq analysis of maize gametophytic transcriptomes[J].Genome Biology,2014,15:414.

[8] Alasoo K,Martinez F O,Hale C,et al.Transcriptional profiling of macrophages derived from monocytes and iPS cells identifies a conserved response to LPS and novel alternative transcription[J].Scientific Reports,2015,5:12524.

[9] Du Z Q,Eisley C J,Onteru S K,et al.Identification of species-specific novel transcripts in pig reproductive tissues using RNA-seq[J].Animal Genetics,2014,45(2):198-204.

[10] Roberts A,Pimentel H,Trapnell C,et al.Identification of novel transcripts in annotated genomes using RNA-Seq[J].Bioinformatics,2011,27(17):2325-2329.

[11] Weirick T,Militello G,Mueller R,et al.The identification and characterization of novel transcripts from RNA-seq data[J].Briefings in Bioinformatics,2016,17(4):678-685.

[12] Zhao J,Song X,Wang K.lncScore:Alignment-free identification of long noncoding RNA from assembled novel transcripts[J].Scientific Reports,2016,6:34838.

[13] Weikard R,Hadlich F,Kuehn C.Identification of novel transcripts and noncoding RNAs in bovine skin by deep next generation sequencing[J].BMC Genomics,2013,14:789.

[14] Allender C J,King G J.Origins of the amphiploid species Brassica napus L.investigated by chloroplast and nuclear molecular markers[J].BMC Plant Biology,2010,10:54.

[15] Chalhoub B,Denoeud F,Liu S,et al.Early allopolyploid evolution in the post-neolithic Brassica napus oilseed genome[J].Science,2014,345:950-953.

[16] Yan X,Dong C,Yu J,et al.Transcriptome profile analysis of young floral buds of fertile and sterile plants from the self-pollinated offspring of the hybrid between novel restorer line NR1 and Nsa CMS line in Brassica napus[J].BMC Genomics,2013,14:26.

[17] Gill R A,Ali B,Cui P,et al.Comparative transcriptome profiling of two Brassica napus cultivars under chromium toxicity and its alleviation by reduced glutathione[J].BMC Genomics,2016,17:885.

[18] Lu K,Peng L,Zhang C,et al.Genome-wide association and transcriptome analyses reveal candidate genes underlying yield-determining traits in Brassica napus[J].Frontiers in Plant Science,2017,8:206.

[19] Langmead B,Salzberg S L.Fast gapped-read alignment with Bowtie 2[J].Nature Methods,2012,9(4):357-359.

[20] Kim D,Pertea G,Trapnell C,et al.TopHat2:Accurate alignment of transcriptomes in the presence of insertions,deletions and gene fusions[J].Genome Biology,2013,14(4):R36.

[21] Trapnell C,Roberts A,Goff L,et al.Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks[J].Nature Protocols,2012,7(3):562-578.

 
徐文,安素妨,王艳,贾琳琳,鲁丹丹,张莹莹,刘建丰,李保全
《河南农业科学》 2018年第04期
《河南农业科学》2018年第04期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号