什么是DNA序列比对的空位罚分

一般在进行双序列或者多序列比对时为了获得两个或多个序列的最佳比对要对序列插入空位(gap)。空位是指在进行序列比对时,为了获得最佳比对结果,算法权衡后在两条或多条序列中产生的间隔区。引入空位的数量和位置对比对结果有显著影响,因此必须在比对计分时对其罚分。空位罚分(gap penalty)指序列比对分析时为了反映核酸或氨基酸的插入或缺失等情况而插入空位并进行罚分,以控制空位插入的合理性。

除了对应于单字符插入和删除的空位,比对中还经常用到更大的对应于多个连续字符插入和删除的空位。多个连续字符的插入和删除可由多次独立的单字符插入和删除造成,也可由一次多字符插入和删除造成。尽管单字符突变的发生率高于多字符突变的发生率,从概率上说,引起一次多字符插入和删除的概率要大于引起多次独立单字符插入和删除的概率。此外,对于长的空位,它们出现在序列的头、中和尾也常常具有不同意义。最优的序列比对通常具有以下两个特征:尽可能多的匹配和尽可能少的空位。插入任意多的空位可能会产生较高的分数,但找到的并不一定是真正相似的序列。

有2个参数应用于空位罚分设定,一个与空位设置(gap opening)有关,另一个与空位扩展(gap extension)有关(表1-5)。任一空位的出现均处以空位设置罚分,而任一空位的扩大必须处以空位扩展罚分。对于一个空位长度为k的罚分 可用下式表示:

bk

(1-1)

其中 是空位设置罚分, 为空位扩展罚分。这两个参数值设置的变化对联配产生影响。

表1-5 空位设置和空位扩展罚分对联配的影响

版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。http://www.apmygs.com/1963.html
返回顶部