出类拔萃的同源模建软件——Advanced Protein Modeling
Advanced Protein Modeling提供了蛋白同源性识别,序列比对和比较蛋白模建的功 能。程序可以通过比较序列结构识别远距离同源性并能通过一个或多个同源信息构建蛋 白结构。在整个模建过程中的所有步骤里都会考虑氨基酸在局部结构环境限制下如何取 代的信息,其中这些结构环境都由二级结构、溶剂可及性和氢键状态定义。
问题
许多生物体的完整基因组的应用都集中在基因产物——蛋白质的功能上。这个功能 通常都由蛋白精确的三维结构所决定。蛋白质的结构在实验上可以通过X射线晶体衍射 或NMR分析来确定。这些方法非常花耗时间而且对于某些蛋白经常不起作用。由于蛋白 家族中的三维折叠比起它们的序列来更加保守,因此在计算机辅助药物设计中比较蛋白 模建为从序列信息到确定蛋白结构提供了完整的解决方案。序列-结构同源性识别和比对
蛋白序列与已知结构间的同源性识别提供了理解生物行为的基础同时是比较蛋白模建时预测三维结构的先决条件。
蛋白结构中的氨基酸取代受到它们局部结构环境的限制。主链构象或二级结构,溶剂可及性和氢键状态都被显示出来作为有用的结构特征以描述局部环境。
程序使用64个来自HOMSTRAD数据库结构比对中的环境特殊取代表单。在序列之间的长度有很大不同的时候采用全局-局部算法比对序列-结构,而在其他情况下采用全局算法。程序会自动选择各自的比对算法,比起其他方法它可以自己进行改善。
结构中每个位置上的缺口罚分都根据它的溶剂可及性、相对二级结构元素中的位置和二级结构元素的保守性决定。程序可以同时比对多条序列和多个结构以增加保守与可 变的有关信息。
描述出以上所有的特征就能提高远距离同源性的识别能力和比对精度。
模建结构保守区域
Advanced Protein Modeling采用结构保守簇的概念,对于特殊的蛋白家族尽可能多的 使用可用信息,根据结构保守性的充分条件引入新的几何必要条件。当两个或多个蛋白 中的残基的Cα-Cα分开到某个极限距离以下时,这些区域就是保守的,这时的曲率和扭转条件都能够获得。
通过结构保守簇镶嵌模建的区域不能再通过结构保守区域来模建因为那要求所有 的模板都必须在一个保守区域内出现。

人类Xa因子的晶体结构(PDBID:2BOK,橙色)与同源模建结构(白色)的比较
模建结构可变区域
在比较蛋白模建中,靶序列中总有一些残基相对于模板结构插嵌在其中或者有些区域与模板中相对应的区域结构不同。模建这些可变区域的精确程度是决定在基于受体应 用计算中的比较模型可利用度的主要因素。
Advanced Protein Modeling整合基于知识的方法和从头算的方法来构建结构可变区 域。程序从带有环境限制取代表单的蛋白结构片段数据库和其他一些筛选规则中选择。 从两种方法中得到独立的结果并整合在一起,必须通过一系列规则过滤后再作出一致性 的预测。
模建侧链
Advanced Protein Modeling采用连续性策略先预测骨架的构象再预测侧链的构象。它 采用基于知识的方法使用扭转借代以限定特殊残基的旋转异构体构象,然后从旋转异构 体数据库中列举出剩下的侧链构象。这些侧链的包装通过一个能量函数优化。

蛋白比对的飘带模型
案例
同源模建与分子对接技术联用
Homology modeling of human α1β2γ2 and house fly β3 GABA receptor channels and Surflex-docking of fipronil
Jin Cheng, Xiu-Lian Ju, Xiang-Yang Chen, Gen-Yan Liu
J Mol Model DOI 10.1007/s00894-009-0477-2
为了进一步了解非竞争性抑制剂(noncompetitive antagonist, NCA)fipronil 选择性结合 于 gamma-氨基丁酸受体(GABARs)的机理,以 Torpedo marmorata 的烟碱样乙酰胆碱受 体(nAChR)冷冻电子显微镜结构为模板,通过同源建模搭建了人 α1β2γ2 以及马蝇 β3 GABAR 的三维结构模型。通过 Surflex-Dock 将 fipronil 对接到人 α1β2γ2 以及马蝇 β3 GABAR 的结合口袋中,计算得到的结合亲合力与实验结果一致。比之人的 α1β2γ2 受 体,fipronil 结合到马蝇 β3 受体的结合能力更强。另外,Surflex-Dock 的对接结果分析 显示:fipronil 与 GABAR 第二个跨膜区(TM2)的 Ala2 以及 Thr6 之间形成的氢键相互作用在配体选择性结合中起着非常重要的作用。人 α1β2γ2 以及马蝇 β3GABAR 亚基之间的差异导致了 fipronil 这种选择性结合的差异。


突出特性
1. 用家族结构归类蛋白质数据库
2. 同源结构检测使用结构归类和选择自动比对算法
3. 交互式序列比对编辑器将一维序列和三维结构联系在一起
4. 结构保守簇扩展了结构保守区域的概念
5. 丰富的图形用户界面支持灵活的工作流程
6. 自动生成和捕获项目说明
Biopolymer™:构建、分析以及可视化大分子三维结构
MOLCAD™:可视化对分子识别至关重要的表面特征和物理性质
Surflex-Dock™:基于受体的虚拟筛选和分子对接
RACHEL™:全新药物设计
配套软件
MOLCAD:可视化对分子识别至关重要的表面特征和物理性质
Surflex-Dock:基于受体的虚拟筛选和分子对接
RACHEL:全新药物设计
硬件和软件要求
APM 除了 Bioploymer 还需要一个独立的 License,并且可从 SYBYL 以及系统命令 行中进入。SYBYL,Bioploymer 以及 APM 可以在 IRIX® (SGI®) 或 Linux® (x86)的工 作站下运行。
验证
FUGUE已经在CAFASP2(http://cafasp.bioinfo.pl)和CASP4&5(http://predictioncenter.llnl.gov/)竞赛中中被广泛测试。它也被用于确定一种新型的超家 族酶对修饰冠雉组群的催化研究以及SWIB区域和p53 结合MDM2 区域的起源和进化研 究。
ORCHESTRAR 又在 CASP7 中使用,早期的 ORCHESTRAR 模块已经在 CASP4 中 被测试。
最近,Advanced Protein Modeling又参加了CASP8的同源模建竞赛,表现出色,商业 软件无出其右。
参考文献
1. Shi, J.; Blundell, T.; Mizuguchi, K. “FUGUE: Sequence-Structure Homology Recognition Using Environment-Specific Substitution Tables and Structure-Dependent Gap Penalties.” J. Mol. Biol. 2001, 310, 243-257.
2. Johnson, M.S.;Overington, J.P.; Blundell T.L. "Alignment and searching of common protein folds using a database of structural templates; J.Mol.Biol. 1993,
231, 735-752.
3. Mizuguchi, K.; Deane, C.; Blundell, T.; Overington, J. “HOMSTRAD: A Database of Protein Structure Alignments for Homologous Families.” Protein Sci.
1998, 7, 2469-2471.
4. Montalvao, R.W.; Smith, R.E.; Lovell, S.C., Blundell, T.L. "CHORAL: a differential geometry approach to the prediction of the cores of protein structures." Bioinformatics 2005, 21, 3719-3725.
5. Deane, C.M.; Blundell, T.L. "CODA: A combined algorithm for predicting the structurally variable regions of protein models." Protein Science 2001, 10,
599-612.
6. Smith, R.E.; Lovell, S.C.; Montalvao, R.W.; Blundell, T.L. "ANDANTE." Unpublished data.
7. Shirai, H.; Blundell, T.; Mizuguchi, K. “A Novel Superfamily of Enzymes that Catalyze the Modification of Guanidino Groups.” Trends in Biochemical Sciences 2001, 26, 465-468.
8. Bennett-Lovsey, R.; Hart, S.E.; Shirai, H.; Mizuguchi, K. “The SWIB and the MDM2 Domains are Homologous and Share a Common Fold.” Bioinformatics 2002, 18, 620-630.
