본문 바로가기

생물정보학

생물정보학 Software #2 PSI-BLAST : Protein Sequence Profile Search 를 하자. 단백질 연구에 있어서 서열은 구조정보에 비해서 중요성이 높지는 않습니다. 하지만 구조를 이용한 DB 찾기는 아직 많은 시간이 필요해서 Homologous Protein 을 찾을때는 여전히 Sequence Search 방법이 이용되고 있습니다. 현재 사용되는 도구중 Homologous Sequence 를 찾는 최고의 도구는 PSI-BLAST 라고 말할 수 있을 정도로 PSI-BLAST 그 성능이나 속도면에서 뛰어납니다. 이번에는 이 PSI-BLAST 를 Local 컴퓨터에 설치해서 Sequence Search 를 하는 방법을 알아 보겠습니다. BLAST 받기 PSI-BLAST 는 NCBI 에서 배포하므로 NCBI's FTP 에서 받을 수 있습니다. 현재 최신 버젼은 2.2.19 버젼 입니다. 이미 컴파일된.. 더보기
생물정보학자를 위한 클러스터 만들기 #6v1 Sun Grid Engine 설치하기 클러스터 이해하기 시스템 구성과 CentOS 설치하기 Perceus 설치하기 Perceus 설정하기 Perseus Node 설정하기 Sun Grid Engine 설치하기 이번에는 Queueing System 을 설치할 차례입니다. Queueing System 은 사용자가 돌리려는 프로그램을 현재 아무런 일도 하고 있지 않는 Node를 찾아서 자동으로 실행시켜 주는 프로그램을 말합니다. Cluster 에 가장 중요한 프로그램이라고 할 수 있는데요. 다양한 Queueing System 이 존재합니다. OpenPBS, Torque, Sun Grid Engine 중 우리는 Sun Grid Engine 를 설치할 것입니다. 알림 : 앞으로 할 모든 내용은 root 권한에서 이루어 진다는 가정을 하고 있습니다. S.. 더보기
생물정보학 Software #1 CD-HIT : Non-redundant Set 을 만들자. CD-HIT 이런 대량의 단백질 서열에서 NR Dataset 을 만들어주는 프로그램입니다. 사실 NR Set 을 만드는 방법들은 정말 많습니다. 이런 다양한 프로그램에서 CD-HIT 이 가지는 장점은 빠른 속도 입니다. 다른 프로그램에 비해서 몇 백배 이상 빠를 수도 있습니다. 기본 사용법 기본 사용법은 아주 간단합니다. $ cd-hit -i nr -o nr100이런 명령을 내리면 CD-HIT 은 word 크기 5, 메모리는 최대 400M까지 사용해서, identity 90% 를 기준으로 clustering 을 실행하게 됩니다. 예제 CD-HIT 을 이용해서 PDB 의 파일중에 identity 75% 를 Cutoff 으로 Set 을 만들어 보겠습니다. 먼저 PDB 에서 SEQRES 에 기반해서 각 단백질.. 더보기
Amber9 설치하기 제가 다니는 대학원에서 Amber 를 사용합니다. 이번에 cluster 를 정비하면서 Amber 를 설치하였는데, 은근히 까다롭더군요. 그래서 설치법을 정리합니다. 여기서는 CentOS 5.1, OpenMPI (1.2.6), Intel Fortran Compiler (10.1.015) , Intel Math Kernel Library (10.0.2.018) 환경에서 Amber 를 설치하도록 하겠습니다. 필요한 Library 설치하기 Amber9 을 정상적으로 설치하기 위해서는 다음 Library 가 필요합니다. libXt-devel libXext-devel note. CentOS 4.x 에서는 "xorg-x11-devel" 을 설치해야 합니다. CentOS 5.0 이상에서는 기본으로 제공하므로 yum 을.. 더보기
Gromacs 설치하기 Molecular Dynamics 에서 많이 사용되는 프로그램을 뽑으면, Amber, Charmm, Gromacs 정도가 있는 것 같습니다. 오늘은 이중에서 Gromacs 를 설치하는 법을 설명드리겠습니다. 설치환경 OS : CentOS 5 (Updated 2008.4.12) Arch : x86_64 설치 경로 /opt/fftw /opt/gromacs 관련 Library 설치 Gromacs 를 설치하기 위해서 필요한 다음 Library 가 설치되어 있어야 한다. libX11-devel libXau-devel libXdmcp-devel mesa-libGL-devel xorg-x11-proto-devel 프로그램 다운 받기 여기서는 Gromacs 를 설치하기 위해서 Gromacs 와 FFTW 를 다운 받습니.. 더보기
이번주에 읽어볼 만한 논문은? 매주 연구실에서 하는 저널 클럽 때문에 논문을 정기적으로 찾게 되는데, 이때 발표는 안해도 읽어볼 만한 논문들이 많습니다. 그래서 생물정보학을 하는 사람이라면 한번쯤 읽어볼 만한 논문들을 매주마다 올려봅니다. PLoS Computational Biology Yeang C, Haussler D (2007) Detecting Coevolution in and among Protein Domains. PLoS Comput Biol 3(11): e211. doi:10.1371/journal.pcbi.0030211Viswanathan GA, Seto J, Patil S, Nudelman G, Sealfon SC (2008) Getting Started in Biological Pathway Construction.. 더보기
생물정보학자를 위한 클러스터 만들기 #4v1 Perceus 설정하기 클러스터 이해하기 시스템 구성과 CentOS 설치하기 Perceus 설치하기 Perceus 설정하기 Perseus Node 설정하기 Sun Grid Engine 설치하기 이제 perceus 설정을 하겠습니다. perceus 의 환경 설정파일들은 /etc/perceus/ 에 위치합니다. 이곳에 있는 파일중 perceus.conf 파일은 perceus 시스템을 설정하는 파일이고 defaults.conf 는 노드에 대한 설정을 하는 곳입니다. perceus.conf 설정 /etc/perceus/perceus.conf 파일을 열어서 다음과 같이 수정합니다. 4 vnfs transfer master = 10.0.0.1간단합니다. 이제 perceus 를 실행합니다. 처음 실행하면 환경 설정을 초기화 할 것인지를 묻.. 더보기
생물정보학자를 위한 클러스터 만들기 #3.1 Perceus 설치하기 --------------------- 다시 쓰여진 글이 있습니다. 다음 글을 보시기 바랍니다. http://blog.neosgen.net/40 --------------------- 클러스터 이해하기 시스템 구성과 CentOS 설치하기Perceus 설치하기 회사 클러스터 메인 하드가 고장이 나서 클러스터를 새롭게 구성했습니다. "CentOS 4.5 + Perceus 1.3.1" 입니다. Perceus 는 이전에 Warewulf 를 만들던 곳에서 Warewulf 를 좀 더 관리하기 쉽게 다시 작성한 Cluster Software 입니다. Warewulf 는 3 이 준비되고 있지만, 언제나올지 잘 모르겠군요. Perceus는 Warewulf 와는 다르게 하나의 실행 파일에서 옵션들을 변경해서 각 노드들을 .. 더보기