강좌
클라우드/리눅스에 관한 강좌입니다.
프로그램 분류

바이오인포매틱스를 위한 phred, phrap, consed 프로그램 인스톨 및 실행

작성자 정보

  • 웹관리자 작성
  • 작성일

컨텐츠 정보

본문


바이오인포매틱스를 위한 phred, phrap, consed 프로그램 인스톨 및 실행

 

1. phred, phrap, consed란 어떤 소프트웨어인가

   


  DNA 염기서열 조각을 맞추는 프로그램

  PHRED : ABI 377, 3100, 3130, 3700, 3730 등의 염기서열 분석기계를 통해

           나온 바이너리 형태의 데이터를 텍스트 형태로 변환한다.

  PHRAP : PHRED 를 통해 나온 텍스트 형태의 염기서열 분석 파일이나, FASTA

           포맷의 염기서열 데이터를 하나의 긴 서열로 이어 붙인다.

  CONSED : PHRAP이 조각


 

2. 프로그램 다운로드 방법

   


  http://www.phrap.org/consed/consed.html#howToGet 

  위 사이트에서 다운 받을 수 있으며, 만약 파일을 다운로드 할 수 없으면, 프로그램을 만든 사람에게 메일을 보내서 파일을 받아야 한다. phred, phrap, consed 프로그램 제작자는 모두 다르다. 메일을 보내는 순서는 아래와 같다.


1)  메일 보내는 형식은 위 사이트의 메뉴 중 How to Get Phred/Phrap/Consed

    클릭

2)  중간 부분의 How to Get Phred/Phrap/Consed에서 ip address. 

    이 부분 클릭

    ip address를 클릭하는 이유는 후에 파일을 다운 받을 컴퓨터가 서버에

    접근 허용하기 위한 것임.

3)  academic user agreement   이 부분을 클릭하면, 메일 보내는 형식이 나오는

    데, 잘 읽어보고 1 ~ 6까지 잘 작성해서  아래 프로그램 제작자에게 메일을
    보낸다.


 Phrap/cross_match/swat: Phil Green, phg (at) u.washington.edu

  Phred: Brent Ewing, bge (at) u.washington.edu

  Consed: David Gordon, gordon (at) genome.washington.edu      

 

3. 프로그램 설치 방법

   


   필자는 다른 분의 도움을 받아 메일을 보내 4개의 파일을 받았다.

   구 버전은 하나의 파일로 되어 있고, 2005년에 필자가 받았던 파일은 4개의

   파일로 이루어져 있었다.


   phred-dist-020425.c-acd.tar :  phred 실행 파일

   phd2fasta-acd-dist.tar : 스크립트 파일 생성

   distrib.tar.z           : phrap 관련 실행 파일 생성

   consed_linux.tar.z    : consed_linux 실행 파일 생성


   일반적으로 프로그램은 /usr/local 디렉토리에 genome 이라는 디렉토리를

   생성하여 그 안에서 모든 파일을 컴파일 한다.

 ex)

   [root@doom root]# mkdir /usr/local/genome

   [root@doom root]# cd /usr/local/genome

   [root@doom genome]# ls

        consed_linux.tar.z  phd2fasta-acd-dist.tar

        distrib.tar.Z       phred-dist-020425.c-acd.tar

   

   [root@doom genome]# mkdir phred phrap consed phd2fasta bin

   [root@doom genome]# mkdir screenLibs lib

   [root@doom genome]# ls

      bin  consed  lib  phd2fasta  phrap  phred  screenLibs


 (1) phred-dist-020425.c-acd.tar


   [root@doom genome]# mv phred-dist-020425.c-acd.tar

   [root@doom genome]# cd phred

   [root@doom phred]# tar xvf phred-dist-020425.c-acd.tar

   [root@doom phred]# make

   

   [root@doom phred]# cp phred ../bin

 

(2) phd2fasta-acd-dist.tar

   

   [root@doom genome]# mv phd2fasta-acd-dist.tar phd2fasta

   [root@doom genome]# cd phd2fasta

   [root@doom phd2fasta]# tar xvf phd2fasta-acd-dist.tar

   [root@doom phd2fasta]# make

   

   [root@doom phd2fasta]# cp phd2fasta ../bin


 

(3) distrib.tar.Z

  

   [root@doom genome]# mv distrib.tar.Z phrap

   [root@doom genome]# cd phrap

   [root@doom phrap]# tar xvzf distrib.tar.Z

   [root@doom phrap]# make

   

   [root@doom phrap]# cp phrap swat loco cross_match ../bin

   [root@doom phrap]# cp cluster phrapview ../bin


(4) consed_linux.tar.z

  

   [root@doom genome]# mv consed_linux.tar.z consed

   [root@doom genome]# cd consed

   [root@doom consed]# tar xvzf consed_linux.tar.z

   [root@doom consed]# make

   

   [root@doom consed]# cp consed_linux consed_linux2.4 ../bin

   [root@doom consed]# cp consed_linux2.6 ../bin

   [root@doom consed]# cd scripts

   [root@doom scripts]# chmod 707 *

   [root@doom scripts]# cp * ../../bin

 

 

4. 환결 설정

   

 

 (1) screenLibs 폴더에 vector.seq 파일을 복사해서 넣는다.

     vector.seq 파일의 역할은 DNA 염기서열을 조립할 때 필요없는 부분 제거하

     기 위한 부분을 vector.seq 파일에 파스타 형식으로 넣는다.

   ex)

UNI00000cbc16fd.gif


UNI00000cbc16ff.gif(2) phredpar.dat 설정

 

phredpar.dat 파일에는 DNA 염기서열을 분석하는 장비에 대한 정보가 있어야 한다.  ABI 377, ABI 3100, ABI 3130 인경우에는 설정할 필요가 없고, ABI 3700, 3730 장비를 사용한 경우에는 아래와 같이 붉은 박스안의 내용을 추가해 준다.



UNI00000cbc1701.gif


(3) .bash_profile 파일에 경로를 지정한다.


# .bash_profile


# Get the aliases and functions

if [ -f ~/.bashrc ]; then

        . ~/.bashrc

fi


# User specific environment and startup programs


PATH=$PATH:$HOME/bin



BASH_ENV=$HOME/.bashrc

USERNAME="root"


export USERNAME BASH_ENV PATH


PATH=/usr/local/genome/bin:$PATH

export PATH


PHRED_PARAMETER_FILE=/usr/local/genome/lib/phredpar.dat

export PHRED_PARAMETER_FILE



위 파란색 부분을 추가한다.

 

 

5. phred, phrap, consed 실행 방법

   

 

 서버 접속 프로그램.


   (1) SSH Secure Shell  : text 환경으로 서버 접속 사용법은 DOS와 비슷하다.

   (2) X manager : 윈도우 환경으로 서버 접속. consed_linux 명령은 X 윈도우

                    환경에서만 실행된다.

UNI00000ba418be.gifUNI00000ba418c0.gif

            그림 1 SSH                                그림 2 X manager


 서버 접속 프로그램.


   (1) SSH Secure Shell  : text 환경으로 서버 접속 사용법은 DOS와 비슷하다.

   (2) X manager : 윈도우 환경으로 서버 접속. consed_linux 명령은 X 윈도우

                    환경에서만 실행된다.

UNI00000ba418be.gif UNI00000ba418c0.gif

                그림 1 SSH                                그림 2 X manager



  ex) 위 예를 계속 들어 /usr/locoal/genome/20061010/chromat_dir 폴더에서

     edit_dir 로 이동한다.


    [root@doom chromat_dir]# cd edit_dir

    [root@doom edit_dir]# phredPhrap

 

UNI00000ba418c2.gif

그림 1) phredPhrap 실행화면 반드시 edit_dir에서 실행한다.

 

UNI00000ba418c4.gif

그림 2) phredPhrap 파일 실행 중 화면

 

phredPhrap 파일을 consed_linux.tar.z 파일을 풀면 그 안의 scripts 폴더안에 있고으며,

이 파일이 실행 안 될 경우  phredPhrap 파일을 열어서 경로를 재설정한다.


(3) consed_linux 실행 결과 확인

UNI00000ba418c7.gif

   phredPhrap이 끝난 후 그림과 같은 많은 파일이 생성된다.

    



X manager 터미널에서 consed_linux를 실행하면 아래와 같은 결과를 볼수 있다..


[root@doom edit_dir]# consed_linux


UNI00000ba418c9.gif

그림 3) X 윈도우에서 consed_linux를 실행한 화면

 


 phred, phrap, consed 프로그램 설치부터 실행까지 알아 보았습니다. 사실 필자는 바이오인포매틱스에 관해 아는바가 거의 없습니다. 다만 프로그램 인스톨 및 실행까지 많은 삽질이 있었으며, 결국은 데이터를 갖고 결과 파일을 생성하고 보여주는 역할밖에 못합니다. 그래서 결과에 대한 해석은 아직 모릅니다. 바이오인포매틱스를 많이 알고 있다면, 프로그램 실행부터 해석까지 많은 도움을 주고 싶지만 현재 필자도 공부하려고 하고 있습니다. 혹시 이 프로그램 결과 파일 해석에 대해 질문에 대한 답은 못하지만, 프로그램 실행까지의 과정은 얼마든지 질문 가능하며, 필요하다면 필자에게 연락하시고, 정말 필요하다면, 직접 찾아 와서 보길 바랍니다.


 

     저자 : 이형구
     메일 :  dd209엣snu.ac.kr

관련자료

댓글 0
등록된 댓글이 없습니다.

공지사항


뉴스광장


  • 현재 회원수 :  60,043 명
  • 현재 강좌수 :  35,850 개
  • 현재 접속자 :  132 명