双序列比对与多序列比对的比较

多序列比对(multiple sequence alignment)是两个以上DNA序列、RNA序列或蛋白质序列的比对,目标是发现多条序列的共性。双序列比对是序列分析的基础。然而,对于构成基因家族的成组序列来说,我们要建立多个序列之间的关系,这样才能揭示整个基因家族的特征。多序列比对在阐明一组相关序列的重要生物学模式方面起着相当重要的作用。

与双序列比对比较,多序列比对具有更广泛的重要应用,包括以下几个方面:

1.获得共性序列

由多序列比对所得到的与所有序列距离最近的序列称为这些序列的共性序列(consensus sequence),共性序列这一特性使之常用于数据库搜索和芯片探针设计,用于识别具有高相似度的序列。

2.序列测序

如果一个DNA或蛋白质序列被多个机构测序,则测序结果在某些核苷酸或氨基酸上可能存在差异,对这些测序结果进行全局多序列比对可发现这些差异之处,形成的共性序列理论上最为接近真实的序列。其次,对包含重叠区的多个测序序列进行局部多序列比对可发现这些重叠区,实现测序序列的拼接。另外,一个类似的应用是由表达序列标签(expressed sequence tag,EST)组装较长的重叠群(contig)甚至完整的mRNA。

3.突变分析

同一种系不同个体的基因组存在因突变而产生的差异,最常见的是单核苷酸多态性分析,它分析同一种系不同个体基因组中单个核苷酸的包括置换、缺失和插入在内的变异。这些差异可通过多序列比对进行揭示。

4.种系分析

相近种系动植物的基因和基因组由于源自共同的直接祖先而具有高度的相似性,反之,远距种系动植物的基因和基因组由于源自不同的直接祖先而享有更少的相似性,这一事实使得多序列比对常常用于根据基因或基因组序列的差异判断种系关系。多序列比对通常是构造种系树的第一步。

5.保守区段分析

基因组中功能不同的区段在进化中面对不同的选择压力(selective pressure),即重要的区段不易接受突变而非重要的区段易于接受突变。任何基因组都包含大量不同的在选择压力下保持进化上稳定的保守区段。首先,编码具有重要功能蛋白质的基因高度保守,基因中的外显子尤其保守。其次,大量的基因调节单元,例如启动子和增强子,在不同种系中通常高度保守。此外,近年来发现许多非编码RNA也是非常保守的。多序列比对是找出进化上保守的这些区段的基本方法。

6.基因和蛋白质功能分析

分子生物学和发育生物学实验是揭示基因和蛋白质功能的经典方法。在大量基因和蛋白质的功能得以揭示和更多基因和蛋白质的序列得以测定后,根据与功能已知的同源基因和蛋白质进行多序列比对来推断新基因和蛋白质的功能已成为越来越普遍的一个研究手段。

7.RNA和蛋白质结构分析

类似地,可使用多序列比对考察种系相近的RNA和蛋白质家族,通过结构已知的RNA和蛋白质推断未知RNA和蛋白质的结构。需要注意的是,核苷酸序列和氨基酸序列的进化速度比RNA结构和蛋白质结构的进化速度要快,因此仅凭多序列比对仍难以确定RNA和蛋白质的结构。例如,人β球蛋白(beta-globin)和肌球蛋白myoglobin)只有25%的氨基酸序列相同,但两者的三维结构却几乎相同。

8.基因组结构分析

多序列比对可用于整个基因组,揭示基因组的结构特征和进化特征。随着越来越多基因组的测序,多序列比对已频繁用于基因组结构分析中,最典型的应用是UCSC基因组浏览器和Ensembl基因组浏览器。

版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。http://www.apmygs.com/1974.html
返回顶部