蛋白质二级结构预测相关软件

目前较为常用的二级结构预测软件PSIPRED、Jpred、PREDATOR、PSA和SOMPA等都有在线服务器;进入这些软件的主页,输入Fasta格式的目的蛋白序列,在网页上直接选取适合的蛋白质结构预测算法,点submit运行即可。

1.Jpred Jpred

是一种蛋白质二级结构预测网络服务器,由Barton Group创建于1998年。通过提交单一蛋白质序列或多重蛋白质序列并运行,Jpred就可以预测出蛋白质序列的二级结构:α-螺旋、β-折叠或无规则卷曲。Jpred应用了Jnet神经网络算法,准确率达到了76.4%。其基本原理是:Jpred服务器通过DSC、PHD、NNSSP、PREDATOR、ZPRED和MULPRED六种预测方法进行预测,它们都采用了多重序列的进化信息。NNSSP依据最大同源性,PDH采用神经网络,DSC根据线性识别,MULPRED联合不同的单一序列预测方法,PREDATOR考虑氢键倾向性,ZPRED加权预测。最后将六个结果总结为一个简单的文件格式。

2.SOPMA

位于法国里昂的CNRS(centre national de la recherche scientifique)(http://pbil.ibcp.fr/)使用独特的方法进行蛋白质二级结构预测。它是使用5种相互独立的方法进行预测,并将结果汇集整理成一个“一致预测结果”。这5种方法包括:Garnier-Gibrat-Robson(GOR)方法、Levin同源预测方法、双重预测方法、PHD方法和CNRS自己的SOPMA方法。简单地说,SOPMA这种自优化的预测方法建立了已知二级结构序列的次级数据库,库中的每个蛋白质都经过基于相似性的二级结构预测。然后用次级库中得到的信息去对查询序列进行二级结构预测。

3.nnPredict

nnpredict(http://www.cmpharm.ucsf.edu/~nomi/nnpredict.html)算法使用了一个双层、前馈神经网络去给每个氨基酸分配预测的类型。在预测时,服务器使用FASTA格式的文件,其中有单字符或三字符的序列以及蛋白质的折叠类(α、β或α/β)。残基被分为几类,如α螺旋(H)、β链(E)或其他(-)。若对给定残基未给出预测,则会标上问号(?),这说明无法做出可信的分配。若没有关于折叠类的信息,预测也能在不定折叠类的情况下进行,而且这是缺省的工作方式。据报道,对于最佳实例的预测,nnpredict的准确率超过了65%。

4.PredictProtein

PredictProtein(http://cubic.bioc.columbia.edu/predictprotein/)在预测中应用了略为不同的方法。首先,蛋白质序列被作为查询序列在SWISS-PROT库中搜索相似的序列。当相似的序列被找到后,一个名为MaxHom的算法被用来进行一次基于特征简图的多序列比对。MaxHom用迭代的方法来构造比对:当第一次搜索SWISS-PROT后,所有找到的序列与查询序列进行比对,并构造出一个比对后的特征简图。然后,这个简图又被用来在SWISS-PROT中搜索新的相似序列。由MaxHom产生的多序列比对随后被置入一个神经网络,用PHD的方法进行预测。

5.蛋白质二级结构其他预测软件

目前,还有很多蛋白质二级结构在线预测软件,如APSSP、CFSSP、PROF和PSIPRED等(表4-7)。并非所有的方法都是默认执行的,有些方法,如跨膜螺旋的预测,在自动运行时使用特殊的保守起始值,而在有明确要求时使用不同的起始值。以下方法可选择使用:MaxHom、BLASTP、PSI-BLAST、SEG、PHDsec、PHDacc、PHDhtm,PROFsec、PROFacc、COILS、CYSPRED、ASP、PROSITE、ProDom、CHOP、NORSp、PROFtmb、PROFcon08、LOCkey、LOChom、PredictNLS和LOCnet。使用者可以明确要求使用TOPITS+或用EvalSec评估二级结构预测方法的准确率。注意,某些方法的使用有以下优势:加快执行的速度和简化结果。然而请记住,数据库搜索及其结果是速度和结果字节数的限制因素。

版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。http://www.apmygs.com/1993.html
返回顶部