본문 바로가기

Science n Bioinfo

MQAP #1 McGuffin - ModFOLD

 [공부,개발,생물정보학이야기] - CASP8 Model Quality Assessment (MQA) 글에서 MQA 분야에 대해서 소개하고, CASP8 결과를 요약했었습니다. 이번에는 CASP8 에서 좋은 성능을 발위한 서버 중 ModFOLD 논문을 요약해 보겠습니다.




McGuffin 팀에서는 총 3개의 Program 으로 참석을 하였습니다.

  • 199 : ModFOLD server 1.1  : QMODE1 을 위한 Automated Prediction server. Machine-Learning 기법에 기반하여 Global Model Quality 를 측정하는 프로그램 입니다.
  • 031 : ModFOLDclust : Clustering 기법에 기반하여 global 과 local model qualrity 를 측정하기 위한 프로그램. QMODE2 를 담당합니다.
  • 379 : ModFOLD 2.0 : ModFOLDcluster 와 ModFOLD 1.1 의 결과를 조합하여 결과를 예측하는 프로그램 입니다.

위의 3가지 방법중 global model quality 예측에서는 ModFOLDclust 방법이 가장 좋은 성적을 냈습니다.

  ModFOLD 알고리즘은 MODSSEA method, MODCHECK method, 두 개의 ProQ methods 의 값을 TM-score 에 대하여 Neural network Training 을 하여 예측하는 방법입니다. CASP8 에서는 이 4개의 값에 두 개의 Secondary structure score 더 추가하였습니다. 이 값은 Eramian

ModFOLDclust 방법은 본래 Global Model Quality 를 측정하기 위해서 개발된 방법으로 만들어진 모든 모델의 Paired TM-score 를 계산하여 그 평균값을 Score 로 사용하던 방식4입니다(이 계산과정에서 TM-score 0.2 이하의 Pair는 사용되지 않습니다.). CASP8 에서 Local Model quality score 가 추가되었습니다. 이 방법은 S-score 와 유사한 방식으로 계산됩니다. 두 개의 Model 을 TM-score 기반으로 Alignment 한 뒤에 두 Residue 사이의 거리를 d 값으로 S-score 를 계산하는 방식입니다. 여기서 d0 는 3.9 입니다. 각 Residue 에 대해서 AllxAll 계산을 해서 평균값이 Local Model Quality Score 가 됩니다. 이렇게 계산된 residue 의 score 를 단순히 S-score 를 역으로 계산하여 distance 를 알아냅니다. 최대 값은 15Å 로 정합니다

ModFOLD 2.0 은 ModFOLD 1.1 과 ModFOLDclust 을 조합하여 서로간의 단점을 보완하기 위해서 만들어진 방법입니다. ModFOLD 1.1 의 6개 score 와, ModFOLDclust 의 Global score, 그리고 original server ranking 을 neural network 의 입력으로 해서 결과를 예측하게 됩니다. Single Model 의 경우 ModFOLD 1.1 에 의해서 먼저 분석되고, ModFOLDclust protocol을 따라서 nFOLD3 에서 나온 model 과 함께 분석됩니다.

References

Liam J. McGuffin. Prediction of global and local model quality in CASP8 using the ModFOLD server. Proteins. 2009. 77:185-190. [LINK]

David. Eramian, and et al. A composite score for predicting errors in protein structure models. Protein Sci. 2006 July; 15(7): 1653–1666. [LINK]