更全的杂志信息网

一串红全基因组调研及SSR特征分析

更新时间:2016-07-05

一串红(Salvia splendens)是唇形科鼠尾草属植物。从一串红花中提取出的天然红色色素,水溶性好、颜色艳丽、气味香甜,在食品、饮料、果酒等的调色上应用广泛,也应用于日用化工产品中[1]。一串红种子油无毒,硬脂酸含量低,含有大量不饱和脂肪酸(不饱和脂肪酸的质量分数为91.24%),其中亚麻酸质量分数高达63.17%,超过亚麻籽油,可以作为一种优质的营养保健植物油源开发[2]。一串红全株可入药,具有清热、凉血、消肿的功能[3],具有较大的开发利用价值。

有关一串红基因组大小及全基因组测序方面的研究还少见报道,且在基因组水平上对一串红进行SSR查找及特征分析也少有报道。Feulgen分光光度计法[4]和流式细胞术(FC,flow cytometry)[5]是常用的基因组大小的测定方法。目前,高通量测序技术的发展,加快了植物全基因组测序的进程。由于植物基因组的复杂性,不同的植物的基因组可能具有较高比例的重复序列和不同的杂合度,从而使基因组的组装存在一定的困难,此外,较大基因组如 < 10 Gb 的拼接,对测序技术以及组装方法提出了更高的要求。在实际组装过程中较高的杂合度会使组装误差偏大,而杂合度高于1%的基因组则很难组装出来,且不利于后续的生物学分析[6-8]。因此,为了降低这种基因组信息的不确定性,在高通量测序前,一般都要做一个基因组调研。有关一串红的分子标记,目前已知的有田晔林等[9]利用RAPD技术对8个一串红品种进行聚类分析,筛选亲缘关系较近的品种。杨建玉等[10]利用AFLP标记对株型突变体BN35-1、野生型BN35及4个商品种进行亲缘关系分析以确定不同品种间的亲缘关系。傅巧娟等[11]利用SRAP分析标记分析了18个一串红主载品种的遗传多样性。SSR是一种简单重复序列,它是由1~6个核苷酸组成的[12]。SSR广泛分布于原核和真核生物基因组中[13]。在不同个体和群体间SSR序列都表现出很高的变异性[14]。在鉴别植物种类、遗传连锁分析以及遗传多样性分析等方面SSR分子标记应用广泛[15-16]。因此一串红的SSR的开发对其后续亲缘关系分析、物种鉴定等都具有重要意义。本研究在一串红全基因组测序的基础上,利用生物信息学方法查找SSR并进行SSR特征分析,对于一串红的遗传多样性分析以及探究其遗传资源或种质资源保护策略具有应用价值,为以后大规模测序、组装提供理论依据。

1 材料与方法

1.1 试验材料及样品提取

试验材料来自东大地温室(北京农学院)培养的一串红品种白马王子。剪取1株生长状况良好的开花前期的一串红的幼嫩叶片(顶端的新叶),立即用液氮速冻,放入-80 ℃冰箱中保存备用。

“请大家回到座位,继续我们的演出,”声音再次响起,“现在,舞台上的椅子只剩下十把,没有抢到座位的人,将接受我们的惩罚。”

使用天根植物基因组DNA提取试剂盒(DP305-02,TIANGEN,中国)提取一串红基因组DNA,通过电泳仪(PowerPac,Bio-rad,美国)用琼脂糖凝胶电泳和紫外分光光度计(NanoDrop 2000,Thermo Scientific,美国)对DNA进行检测:琼脂糖的质量分数1.5%,电压140 V,电泳时间90 min。用NanoDrop 2000进行定量,为后续建库需要,DNA至少达到2 μg的总量。

1.2

1.2.1 构建文库 为避免超声断裂片段化基因组DNA的方法带来的不同GC含量的片段不均一性,采用了酶切法进行基因组的片段化。采用NEB dsDNA Fragmentase(货号:M0348)进行片段化。采用两步磁珠纯化法对片段化后的基因组进行初步选择(200~700 bp间)。在3'→5'核酸外切酶、聚合酶的共同作用下修复带有突出末端的DNA片段。将单个碱基“A”引入到修复后的DNA片段3'端,与3'端的“T”通过互补配对相连接同时防止DNA插入片段互相连接。通过连接酶,孵育带有标签的接头和DNA片段,将其相连。

纯化大小合适的DNA片段,用于后续的簇生成反应。在此步骤基础上再进行一次精细的片段选择,将连接上接头的片段长度定在300~550 bp之间。

1.2.2 文库质控 使用 PE Labchip 对文库片段进行质量控制,验证DNA文库的片段大小及分布。使用Roche Light Cycler 480 进行文库摩尔浓度定量。

1.2.3 上机测序 将混合好的文库(8.2 nM)逐步稀释定量至20 pM后使用Illumina HiSeq PE150平台进行上机测序。

1.3 数据预处理及质控

对于滤除了接头序列和低质量序列的数据使用ABySS[21](version 1.5.1)程序进行基因组从头拼装。初步组装所选的K值为64,其余参数选用默认参数。

使用vsearch[18]软件进行测序质量评估,评估的内容包括测序数据质量评估和测序错误率评估。

1.4 基因组特性评估及初步组装

[34] Tóth G, Gáspári Z, Jurka J. Microsatellites in different eukaryotic genomes: survey and analysis[J]. Genome Research, 2000, 10 (7): 967-981

177 3D 打印辅助微创接骨板内固定术(MIPO)改善胫骨旋转不良的前瞻性随机对照研究 张 磊,房 雷,陈 晓,史 萌,周 琳,徐盛明,苏佳灿

采用skewer[17]软件去除接头污染序列和低质量序列,获到clean reads,用于后续的基因组特性评估时的信息分析以及用于评估测序质量。采用的参数为:-xAGATCGGAAGAGCACACGTCTGAA CTCCAGTCACATTCCTTTATCTCGTATGCCGTCT TCTGCTTG-yAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCA TT -r 0.2 -Q 20 -q 9 -z -t 24 -o ych CV-11_HJNJNALXX_L3_1.fq.gz CV-11_HJNJNALXX_L3_2.fq.gz。

1.5 一串红基因组SSR位点的查找

过滤掉序列长度小于1 000 bp的scaffolds后,利用MISA软件对一串红组装后的其余scaffolds进行SSR查找,设置的参数一、二、三、四、五、六核苷酸各重复单元重复次数最小值为:10、6、5、5、5、5次,复合型SSR的两个SSR之间的距离小于等于100 bp。

(5)成效慢.白猿通背拳需要日积月累的练习才能达到一定的效果,但反观现在发展的比较出色的跆拳道、空手道等,其基本内容略微简单,训练体系较为明晰,学生学上数月,便可看出成效.但白猿通背拳的练习则要以年来计算,并且对身体协调性与力量有着极高的要求,若没有足够的时间练习,则很难收获想要的成绩.

SSR密度计算方法:D=N/LL为物种基因组中重叠群的总长(Mb);N为各重复单元的微卫星个数(个);D为不同微卫星密度(个·Mb-1)。

2 结果与分析

2.1 构建文库及文库质控

琼脂糖凝胶电泳图如图1所示。图2为DNA文库的片段大小及分布情况,DNA文库的片段大小大部分在427 bp左右,测得的质量浓度为1.28 ng/uL,摩尔浓度为8.1875 nmol/L,文库构建结果合格可以开展后续工作。

作为一种非竞争性的NMDA受体拮抗剂,有效剂量的氯胺酮可以抑制NMDA受体活性,对电针刺激不反应的Nep模型进行逆转,并联合脊髓电针对疼痛治疗,可以进一步将疗效增强。最新研究也显示[4],将低于1 mg/kg的氯胺酮应用在缺血性疼痛与癌痛治疗中,容易取得较为明显的疗效,可以减少阿片类镇痛药物的用药,从而将不良反应减少,达到减轻患者痛苦。其他非选择性NMDA受体拮抗剂,包括美金刚、去甲右美沙芬等灯光,这些对于NeP患者也可以发挥显著的镇痛效果。

a:切胶前电泳图;b:切胶后电泳图;序号1:Takara DL1000;序号3:Takara DL2000,序号2;打断后的DNA片段;最亮的条带分别对应400 bp和750 bp的长度 a:Pre gel electrophoresis;b:Electrophoretic map after cutting;No 1:Takara DL1000;No 3:Takara DL2000;No 2:Broken pieces of DNA;The brightest bands correspond to the lengths of 400 bp and 750 bp 图1 琼脂糖凝胶电泳图 Fig.1 Agarose gel electrophoresis diagram

图2 DNA文库的片段大小及分布 Fig.2 Size and distribution of the fragment of DNA Library

2.2 测序数据量统计及质量评估

2.2.1 测序数据量统计 通过Illumina HiSeq PE150 测序平台对构建的DNA文库进行双末端测序,测序所得raw date (pairs) 为142 993 780,去掉低质量片段后clean data (pairs) 为142 980 418,GC含量为38.50%。

2.2.2 测序数据质量评估 测序质量信息用碱基质量值对应的ASCII编码表示。Illumina HiSeqTM 的碱基质量值 Qphred 的具体定义为:Qphred = int (-10log10e),其中e是错误率。合法的 Q 值通常在2至40之间,因此可以对应到一个可见字符的ASCII码。在Illumina Casava 1.8版本中测序错误率、质量值及对应编码的简明对应关系如下:

原始数据的质量分布图如下:原始数据的质量分布大部分在30以上,属于比较好的测序质量。

经过滤除接头和低质量序列后,得到的clean reads的比例占到99.9%以上。使用vsearch[18]软件进行clean reads的质量评估,得到Q值分布如下:

新接班不久就遇到了一个很特殊的学生—小睿。说他特殊一点也不过分:用板凳打同学;拿尖尖的铅笔扎同学的脑袋;咬人;往别人脖子领子里塞沙子;解小便常常排在别人身上……“斑斑劣迹”使小睿在班里没有一个朋友,更得不到同学们的喜欢。而最让人头疼的是小睿偷偷拿别人的东西,他这种行为已经引起了公愤。

表1 测序错误率质量值及编码对应关系

Tab.1 Relationship between the Sequencing error,rate Quality Values and the ASCII coding

测序错误率Sequencingerrorrate/%质量值QualityValues对应编码ASCIIcoding1010+513.12050.130?0.0140I

图3 原始数据的质量分布 Fig.3 Quality distribution of raw data

表2 reads1和reads2质量分布 Tab.2 Quality distribution of reads1 and reads2

ASCIIQread1read2PeNPct/%AccPct/%PeNPct/%AccPct/%J410.000081696826483779.479.40.000081191115092855.855.8F370.00020228379085410.790.10.00020345408337216.272.0A320.0006310474916464.995.00.0006318566064168.780.6<270.002004000079231.996.90.0020012175238875.786.37220.006312738051251.398.20.0063110375207654.991.2-120.063103744145211.899.90.0631017060278188.099.2)80.15849112174440.1100.00.158491696740220.8100.0#20.6309611188900.0100.00.6309618816000.0100.0

综合Reads1和Reads2算出的总的Q32比例为87.8%,属于比较高质量的测序数据。

2.3 基因组大小杂合度及重复序列比例预估

2.3.1 K-mer分析及基因组大小预估 使用过滤后的一串红有效数据进行17-mer分析,分布图如图4所示。在45左右有一个明显的峰即K-mer的期望深度,在90左右有1个次峰,对应于重复度为2的重复区域。主峰的1/2处无杂合峰,可以初步判断所测样品的杂合度很低,为理想的测序对象。17-mer分布图有比较粗的拖尾,说明一串红的重复序列比较多。

图4 17-mer分布图 Fig.4 Distribution of 17-mer

使用estimate_genome_size.pl 估计基因组大小及测序深度的结果为:TOTAL_NTS:4 270 996 530,Estimated Coverage:50.775 527 722 309 7,Estimated Genome Size:841 152 563.486 486,即基因组大小为841 Mbp左右,此次基因组调研的测序深度约为51×。作为验证,通过查询植物基因组C-value数据库Kew,得到的一串红1C值为0.85 pg[22],由此推断一串红的(单倍体)基因组大小约为:0.85 pg×978 Mbp/pg≈831 Mbp。

2.3.2 基因组杂合度评估 在用K-mer分布图进行杂合度评估时,需要考虑目标物种的倍性。由于一串红是二倍体,故在基因组杂合度很低时,基因组的kmer频谱图表现出单倍体的特性,除去测序错误外的最高峰为纯合峰,基因组大小估计时也估计的是单倍型基因组的大小;相反,如果基因组的杂合度高到一定程度,则纯合峰对应的平均测序深度的1/2测序深度的位置将会有杂合峰,当杂合度超过1/3时,会出现杂合峰超过纯合峰的情况。

[9] 田晔林, 刘克锋, 石爱平, 等. 一串红品种(系)遗传多样性RADP分析[J]. 中国农学通报, 2006, 22 (5): 76-78

2.4 基因组初步组装

利用K-mer=64进行contigs和scaffolds组装得到的基因组初步组装的结果见表3。

表3 基因组初步组装结果 Tab.3 Preliminary results of the genome

TotalSequenceNumberShortest/bpLongest/bpN50GCcontent/%GenomeSize/bpUnitigs65337720078591122037.45476956611Contigs37583020078591284037.56521830301Scaffolds32637420078591284037.43522504637

2.5 一串红基因组微卫星特征分析

2.5.1 一串红基因组SSR位点查找及分布情况 对一串红基因组中1~6核苷酸重复完整型和复合型SSR进行查找分析。从当前组装的一串红基因组中查找的序列总长度为438 155 920 bp(有效读长),总序列数为142 300个,其中58 525个序列中共查找到95 982个SSR位点,平均每4 565 bp出现1个SSR,其中有22 807个序列包含的SSR位点数大于等于2个。95 982个SSR位点中复合型的SSR为13 281个。其中部分微卫星信息见表4。

表4 一串红基因组SSR数据库的部分结果 Tab.4 Part of the Salvia splendens genomic SSR database

ScaffoldIDSSR类型SSRtype重复单元RepeatunitSSR长度SSRlength3418_2826_71836单核苷酸(A)1010115520_1394_7163单核苷酸(T)6161109489_1958_36717二核苷酸(AT)1530267435_1868_45955二核苷酸(GA)612261251_2340_57353三核苷酸(TAT)195718416_2433_64101三核苷酸(ATC)5155973009_3793_96654_2242720+,...,3452594+四核苷酸(AGAT)16645973100_1403_41366_2244752+,4875269-,5552518-四核苷酸(CACT)5205973075_3601_101861_2244129-,...,1084355+五核苷酸(GGAGA)630112100_3442_92707五核苷酸(TTCGG)7355973040_1595_40839_2243522+,...,5755866+六核苷酸(TTTTAT)5305901698_2939_83062_650827-,...,3035214-六核苷酸(GATGGA)201205901907_4288_121725_655120+,2092662+,2426828-复合模式(A)10caattaatg(AAT)1564144928_6562_166207复合模式(AG)15tgtagagagatggcaaagcaagtctttgctt(AG)673

2.5.2 一串红基因组微卫星组成分析 在一串红基因组数据库中从总长为438 155 920 bp的序列中共查找出95 982个SSR位点,平均4 565 bp出现1个SSR。单碱基重复单元的SSR含量最多,占总数的41.6%,其次为二碱基重复(25.9%),复合型(13.8%),三碱基重复(13.6%),六碱基重复(1.9%),五碱基重复(1.6%)和四碱基重复(1.6%)(表5)。每种碱基重复单元包含不同种类的重复碱基,其中单碱基重复SSR由4种不同的重复碱基组成,二碱基、三碱基、四碱基、五碱基、六碱基核苷酸重复SSR组成类型分别为12种、63种、149种、470种、993种,不同重复基元类型SSR的重复碱基组成数据库部分结果见表6。

表5 不同长度重复单元SSR所占比例及分布密度 Tab.5 Proportion and density of repeat types in SSR database

重复类型RepeattypesSSR数量SSRquantity所占比例proportion/%密度density(SSR/Mb)单碱基mononucleotide3990341.691.1二碱基dinucleotide2482025.956.6三碱基trinucleotide1303013.629.7四碱基tetranucleotide15411.63.5五碱基pentanucleotide15921.63.6六碱基hexanucleotide18151.94.1复合碱基compound1328113.830.3总数total95982100218.9

表6 不同重复基元类型SSR的重复碱基组成数据库部分结果 Tab.6 Part of the repeated base coposition database

单碱基mononucleotide二碱基dinucleotide三碱基trinucleotide四碱基tetranucleotide五碱基pentanucleotide六碱基hexanucleotideSSR组成类型SSRtypeAACAACACTAAATGAAATCTACAGCTGCATTCCACACAGGTG数量quantity41263149470993

2.5.3 优势重复单元碱基在一串红基因组微卫星中的组成 对一串红不同类型重复单元微卫星中各重复单元数量的变化情况进行统计。单碱基重复微卫星中A/T为主要的重复单元,占单核苷酸重复的95.04%,且A(20 742):T(20 401)接近1:1。二碱基重复微卫星中AG/CT为主要重复单元,共12 468个,占40.1%;其次为AT/AT,共12 101个,占38.87%。三碱基重复微卫星中AAT/ATT重复次数最多,共6 997个,其次为AAG/CTT,共2 249个,占比分别为44.26%和14.23%。四碱基重复微卫星中AAAT/ATTT(42.24%)共738个,AATT/AATT(11.22%)共196个。五碱基重复微卫星中重复次数最多的是AAAAT/ATTTT(25.54%),共472个,其次为AAATT/AATTT(8%),共148个。六碱基重复微卫星中重复次数最多的是AAAAAT/ATTTTT(8.5%),共184个,其次为AATTCC/AATTGG(5.7%),共122个。

Trypsin has potent proteolytic activity, and its inappropriate activation may lead to peritoneal dissemination of infiltrative gastric cancer by defoliation of cancer cells from the surface of advanced primary tumor, attachment and invasion to extracellular matrix under the mesothelium[46].

(2)合同主义的立法,即需征得生母的同意之立法。在英国,依据1989年《儿童法》,任意认领的生效要件是:夫妻双方达成协议;协议必须“采用规定的形式”(in the prescribed form);向法院登记。“法院的功能是行政性的,而非司法性的;法院在登记时并不调查儿童的福利。”㉑在德国,“承认自己为父的男子,须按照规定的形式作出单方的、无需受领的意思表示。承认父的身份必须获得母的同意(《德国民法典》第1595条第1款)。”㉒另一方面,根据“承认”而“被认定为父的男子,有可能并非子女的生父。为了矫正这种偏差,法律允许通过法院裁判撤销父的身份”㉓。

3 结论与讨论

毛竹(Phyllostachys edulis)[23]、五节芒(Miscanthus floridulus)[24]等植物都是用流式细胞术法来测定基因组大小。Feulgen分光光度法[25]和脉冲场电泳法[26]等也可被用来估计物种基因组大小。高通量测序技术为基因组大小的测定提供了更加可靠的方法。通过测序得到大量的数据可以用来进行植物基因组注释,植物比较基因组学的进化分析以及用来研究基因家族进化的功能性基因及其代谢产物。然而植物基因组的复杂性决定了在做深度测序前需要对植物基因组做一个评估。K-mer分析法是根据全基因组测序片段的K-mer深度分布[27]来估计物种基因组大小的方法,通过这种方法,估算出了一串红物种的基因组大小、杂合度、GC含量等结果,为一串红的进一步研究提供了详细的序列信息。

本研究首次评估出了一串红基因组大小为841 Mbp左右,基因组杂合度较低,有一定的重复序列。采用K-mer=64进行基因组初步组装,获得contigs总数量375 830,N50为2 840 bp;scaffolds总数量为326 374,N50为2 840 bp。根据对一串红基因组的评估,在一串红后续的大规模测序时可以采用二代+三代(Illumina+PacBio)相结合的测序策略,同时可辅以Hi-C技术,再应用合适的拼接软件进行一串红的全基因组测序研究,从而获得高质量的全基因组图谱。

[27] Havlak P, Chen R, Durbin K J, et al. The atlas genome assembly system[J]. Genome Res, 2004, 14 (4): 721-732

[17] Jiang H, Lei R, Ding S W, et al. Skewer: a fast and accurate adapter trimmer for next-generation sequencing paired-end reads[J]. BMC Bioinformatics, 2014, (15): 182

本研究为一串红SSR标记的进一步开发以及物种进化、遗传多样性分析等方面的研究奠定了基础,对于进一步利用SSR分子标记进行一串红遗传多样性、遗传图谱构建、品种鉴定等提供了应用价值。

参考文献

[1] 张应鹏, 杨云裳, 李彬. 一串红红色素的提取研究[J]. 印染助剂, 2009, 26 (6): 23-25

[2] 刘世彪, 吕江明, 刘祝祥. 一串红种子油的提取、成分分析及其急性毒性研究[J].中国粮油学报, 2011, 26 (9): 56-59

[3] 李凤兰, 刘荣梅, 胡国富, 等. 一串红的研究进展[J]. 东北农业大学学报, 2008, 39 (8): 131-135

[4] Du B, Wang D. C-values of seven marine mammal species determined by flow cytometry[J]. Zool Sci, 2006, 23 (11): 1017-1020

[5] Mishiba K, Ando T, Masahiro M.Nuclear DNA contents as an index character discriminating taxa in the genus Petunia sensu Jussieu (Solanaceae)[J]. Annals of Botany, 2000, 85 (5): 665

[6] Feuillet C, Leach J E, Rogers J, et al. Crop genome sequencing: lessons and rationales[J]. Trends in Plant Science, 2011, 16 (2): 78-89

[7] Edwards M A and Henry R J. DNA sequencing methods contributing to new directions in cereal research[J]. Journal of Cereal Science, 2011, 54 (3): 395-400

[8] Loman N J, Misra R V, Dallman T J, et al. Performance comparison of benchtop high-throughput sequencing platforms[J]. Nature Biotechnology, 2012, 30 (5): 434-439

如果首次出现的峰即为最高峰,为了区分这是杂合度高时的杂合峰还是杂合度低时的纯合峰,可以根据其他的辅助信息来确认。在本研究中有两个辅助证据证明这里的最高峰是纯合峰:首先用来测序的样品是四代自交系,相对来说比较纯,不会出现杂合度超过33.3%(即基因组上1/3以上的kmer中有SNP位点)的情况;其次,通过查询植物基因组C-value数据库Kew得到的一串红基因组的C值为0.85,即单倍型染色体的质量是0.85 pg,对应的基因组大小约为831 Mbp,与这里通过最高峰估算出的基因组大小841 Mbp比较接近。由此可以判断一串红基因组的纯合度比较高。

[10] 杨建玉, 胨洪伟, 刘克锋, 等. 一串红株型突变体AFLP分析[J]. 北京农学院学报, 2010, 25 (2): 1-4

[11] 傅巧娟, 陈一, 李春楠, 等. 中国一串红主载品种遗传多样性的SRAR标记分析[J]. 分子植物育种, 2013, 11 (6): 809-816

[12] Hayden M J, Sharp P J. Sequence-tagged microsatellite profiling (STMP): a rapid technique for developing SSR makers[J]. Nucleic Acids Research, 2001, 29 (8):1-8

[13] MRAZEK J, GUO X, SHAH A. Simple sequence repeats in prokaryotic genomes[J]. PNAS, 2007 (104): 8472-8477

[14] SELKOE K A, TOONEN R J. Microsatellites for ecologists: a practical guide to using and evaluating microsatellite markers[J]. Ecology Letters, 2006, 9 (5): 615-629

[15] 冯锦霞, 张川红, 郑勇奇, 等. 利用荧光SSR标记鉴别杨树品种[J]. 林业科学院, 2011, 47 (6): 167-174

人工智能程序的使用者,或者智能创作机器人的所有者,可以因其对人工智能程序的合法使用权或者对智能创作机器人的所有权,类比孳息的财产权权利归属于原物权利人的原则获得对人工智能生成数据的财产权,①参见袁真富2017年9月2日在“人工智能带来的版权挑战”主题沙龙上题为“人工智能生成内容的著作权五问”的发言。但并不能自动拥有对数据所体现独创性表达的知识产权,除非其也完成了对该独创性表达的挖掘。

[16] 张亚东, 胡兴宜, 宋从文. 利用新型分子标记EST-SSR鉴定湖北省内的主栽黑杨品种[J]. 分子植物育种, 2009, 7 (1): 105-109

在这些微卫星中,重复类型最多的为单碱基重复,占41.6%,这个结果不同于许多物种以二碱基和三碱基重复类型为主[28-29]。张晗等[30]在研究谷子(Setaria italica)基因组微卫星时发现了2 872个SSR,二核苷酸和三核苷酸所占比例分别为63.41%和31.86%;孔凡明[31]等在一些松属物种的SSR研究中,获得最多的重复序列是三核苷酸重复。然而在杜仲(Eucommia ulmoides Oliver)基因组SSR研究中,在所有重复类型中单碱基重复所占比例最高,为54.34%[32],巧家五针松(Pinus squamaia X.W.Li)基因组中单核苷酸所占比例为60.47%也是最高[33],一串红存在相同情况。目前普遍认为,基因组中低级重复单元较多则表示该物种进化水平较高,相反,高级重复单元比例高的物种其进化时间短或变异频率低[34-36]。这种结果有可能是因为一串红变异频率高或进化历史悠久导致的。也有报道表明,基因组越小的物种其单碱基重复序列越多,物种基因组越大,其他类型微卫星就会增多[37-38]。本研究结果为一串红的单碱基重复比例占到41.6%,也很可能跟现在一串红的基因组数据不完全有很大关系。本研究中若不统计单碱基重复的SSR,跟大多数植物一致,一串红基因组SSR重复单元也是以二核苷酸为主。实际在不同物种中优势重复单元分布存在很大差别,比如在油茶(Camellia oleifera)中,其优势重复单元为二碱基重复,水稻(Oryza sativa)和高粱(Sorghum bicolor)以三碱基重复为优势重复单元,玉米(Zea mays)、枣(Ziziphus jujuba)、二穗短柄草基因组(Brachypodium distachyon)却是以六碱基重复单元为优势重复单元[39-43]。在一串红转录组中二核苷酸重复为优势重复单元占比39.9%,其次是三核苷酸重复占比29.3%[44],在一串红基因组数据中,如果不统计单核苷酸和复合模式重复,其结果也是二核苷酸重复(58.0%)和三核苷酸重复(30.4%)占主导地位,这个结果与一串红转录组SSR的优势重复相似。

2)由于社会领域是造成城乡规划非理性化的主要原因,因此,大数据时代可通过对海量数据的高效利用,逐步实现城乡规划社会领域的计量化,为城乡规划中遇到的社会问题的计量处理提供参考信息。

[18] Rognes T, Flouri T, Nichols B, et al. VSEARCH: a versatile open source tool for metagenomics[J]. PeerJ, 2014, 4: e2584

[19] Marcais G, Kingsford C. A fast, lock-free approach for efficient parallel counting of occurrences of k-mers[J]. Bioinformatics, 2011, 27 (6): 764-770

[20] Kim E B, Fang X, Fushan A A, et al. Genome sequencing reveals insights into physiology and longevity of the naked mole rat[J]. Nature, 2011, 479 (7372): 223-227

[21] Simpson J T, Wong K, Jackman S D, et al. ABySS: a parallel assembler for short read sequence data[J]. Genome Res, 2009 (19): 1117-1123

对比两组对服务态度满意度、对周围环境满意度、对服务质量满意度、身体舒适率、焦虑评分、抑郁评分、术后疼痛率、并发症发生率。

[22] Maria J, Olszewska, Regina Osiecka. The Relationship between 2C DNA Content, Life Cycle Type, Systematic Position, and the Level of DNA Endoreplication in Nuclei of Parenchyma Cells during Growth and Differentiation of Roots in some Monocotyledonous Species1[J]. Biochem. Physiol. Pflanzen, 1982 (177): 319-336

[23] 李潞滨, 武静宇, 胡陶, 等. 毛竹基因组大小测定[J]. 植物学通报, 2008, 25 (5): 574-578

[24] 邓果特, 刘清波, 蒋建雄, 等. 五节芒基因组大小测定[J]. 植物遗传资源学报, 2013, 14 (2): 339-341

[25] Ha S H, Kim J B, Park J S, et at. A comparison of the carotenoid accumulation in Capsicum varieties that show different ripening colours: Deletion of the capsanthin-capsorubin synthase gene is not a prerequisite for the formation of a yellow pepper[J]. J Exp Bot, 2007, 58 (12): 3135-3144

[26] 刘艳鸣, 张奇亚. 利用脉冲场凝胶电泳测定东湖浮游病毒基因组的大小[J]. 武汉大学学报:理学版, 2005, 51 (S): 238-240

在一串红全基因组测序的基础上,利用生物信息学方法对一串红全基因组进行了SSR查找,在总长为438 155 920 bp的序列中共查找到95 982个SSR,微卫星分布密度为 219.06 Mb-1,而且重复类型种类丰富,从单碱基重复到六碱基重复,以及复合型重复。利用传统方法查找SSR,覆盖面窄,没有办法全面反映各种微卫星序列的分布情况。因此,在基因组测序的基础上对一串红进行微卫星查找,可为后续SSR标记的研究奠定基础。

[28] 袁阳阳, 王青锋, 陈进明. 基于转录组测序信息的水生植物莕菜SSR标记开发[J].植物科学学报, 2013, 31 (5): 485-492

[29] Aggarwal R K, Hendre P S, Varshney R K, et al. Identification, characterization and utilization of EST-derived genicmicrosatellite and utilization of EST-derived genicmicrosatellite markers for genome analyses of coffee and related species[J]. Theoretical and Applied Genetics, 2007, 114 (2): 359-372

[30] 张晗, 王雪梅, 王东建, 等. 谷子基因组SSR信息分析和标记开发[J]. 分子植物育种, 2013, 11 (1): 30-36

[31] 孔凡明, 王小龙, 陈赢男, 等. 松属编码区微卫星特征和相应基因功能分析[J]. 南京林业大学学报: 自然科学版, 2014, 38 (2):47-51

回顾90例2015年2月-2018年1月基底节区高血压脑出血患者根据手术方法分组。观察组男24例,女21例;年龄32-79岁,平均(55.02±2.41)岁。对照组男23例,女22例;年龄33-79岁,平均(55.41±2.02)岁。

[32] 吴敏, 杜红岩, 乌云塔娜, 等. 杜仲基因组微卫星特征及SSR标记开发[J]. 林业科学研究, 2015, 28 (3): 387-393

[33] 阮桢媛, 王兵益, 欧阳志勤, 等. 极度濒危植物巧家五针松基因组微卫星特征分析[J].植物研究, 2016, 36 (5):775-781

采用jellyfish[19,20]软件构建K-mer频谱图,据此估计杂合度,用estimate_genome_size.pl估计基因组大小。在基因组组装之前,通过K-mer分析,利用clean reads对基因组大小、杂合度和重复序列等基本信息做一个初步评估,将K赋值为17来分析。分析方法:假使从reads中逐碱基取出的所有K-mer可以包含全部基因组信息,并且K-mer的深度频率分布能够服从泊松分布。通过K-mer曲线可以获得深度估计值,从而估计基因组大小。基因组的重复含量也可以通过K-mer分布图反映出来,如果基因组重复含量较高,其分布图会有粗的拖尾现象。作为验证,通过查询植物基因组C-value数据库Kew得到一串红的1C(pg)值,根据1 pg=978 Mbp通过计算来推断一串红单倍体基因组大小。

[35] Harr B, Schlötterer C. Long microsatellite alleles in Drosophila melanogaster have a downward mutation bias and short persistence times, which cause their genome-wide underrepresentation[J]. Genetics, 2000, 155 (3): 1213-1220

[36] 高亚梅, 韩毅强, 汤辉, 等. 根瘤菌基因组内简单重复序列的分析[J]. 中国农业科学, 2008, 41 (10): 2992-2998

[37] Katti M V, Ranjekar P K, Gupta V S. Differential distribution of simple sequence repeats in eukaryotic genome sequences[J]. Mol Bio Evol, 2001, 18 (7): 1161-1167

[38] Karaoglu H, Lee C M Y, Meyer W. Survey of simple sequence repeats in completed fungal genomes[J]. Molecular Biology and Evolution, 2005, 22 (3): 639-649

[39] Wei Wenliang,Qi Xiaoqiong,Wang Linhai,et al. Characterization of the sesame (Sesamum indicum L.) global transcriptome using Illumina paired-end sequencing and development of EST-SSR markers[J]. BMC Genomics,2011,12 (1): 451

[40] Cardle L, Ramsay L, Milbourne D,et al. Computational and experimental characterization of physically clustered simple sequence repeats in plants[J]. Genetics, 2000 (156): 847-854

[41] 郑燕, 张耿, 吴为人. 禾木科植物微卫星序列的特征分析和比较[J]. 基因组学与应用生物学,2011,30 (5): 513-520

受地区间经济发展水平、教育资源不均衡,尤其是高等教育资源分布不均衡的影响,虽然受教育水平的空间分布和聚集性在二十年后的2015年并未发生实质性的改变,但就教育水平的提升而言,西部地区的平均受教育年限提升迅速。实证结果也显示,财政转移支付资金提升了较为落后的中西部地区的教育水平,也进而推动了全国范围内教育水平的趋同。对于经济发达的东部地区而言,经济的发达吸引了大量的人力资本流入,要素聚集效应显著,形成了经济发展与教育水平提升互动。如果对这一地区过多地进行财政转移支付,反而对教育水平的提升产生反效果。

[42] 马秋月, 戴晓港, 陈赢男, 等. 枣基因组的微卫星特征[J]. 林业科学, 2013,49 (12): 81-87

该病主要传播途径是空气、猪与猪之间的接触、污染排泄物或人员传播。猪群的转移或混养,拥挤和恶劣的气候条件(如气温突然改变、潮湿以及通风不畅)均会加速该病的传播和增加发病的危险。

[43] 史洁, 尹佟明, 管宏伟, 等. 油茶基因组微卫星特征分析[J].南京林业大学党报,2012,36 (2): 47-51

[44] Ge X, Chen H, Liu K, et al.De Novo assembly and annotation of Salvia splendens Transcriptome using the illumina platform[J]. PLoS ONE, 2014,9 (3): e87693

王硕,葛秀秀,孔维一,陈洪伟,刘克锋,王红利
《北京农学院学报》2018年第2期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号