2019.01.25 10:26 윈도우에서 HGMD Download 파일을 CLC Workbench로 import하여 분석에 이용하는 방법 공유
2019.01.25 10:26 윈도우에서 HGMD Download 파일을 CLC Workbench로 import하여 분석에 이용하는 방법

1. HGMD 홈페이지에서 로그인 후 파일 다운로드 (파일명.tar.gz 형식) 및 압축풀기

이 파일 형식은 리눅스 계열의 압축 파일로, 
리눅스에서 압축을 풀거나,
윈도우에서 압축을 풀 때는 전용 프로그램을 사용하여야 하는데 일반적으로 반디집을 이용하시는 것이 가장 편리할 것입니다.
 

2. CLC Genomics Workbench 열어서 Import

왼쪽 상단 Import > Tracks >
 - 2.1. Type of files to import : VCF 또는 GFF3 선택
 - 2.2. Import 할 파일 선택
 - 2.3. Reference track : hg19 또는 hg38 sequence 선택 (CLC_References > homo_sapiens > sequence > hg19 또는 hg38 > Homo_sapiens_sequence_hg19 또는 Homo_sapiens_sequence_hg38  )
 - 2.4. 파일 저장 위치 선택 > Finish

 * 이 때, 파일 저장위치는 CLC_References 폴더를 제외한 폴더(Ex: External_DB)에 저장하시면 됩니다. (CLC_References 폴더는 Read only)


3. Annotation

- VCF 파일로 annotation : Toolbox | Resequencing Analysis | Variant Annotation | Annotate from Known Variants 툴을 이용
- GFF3 파일로 annotation : Toolbox | Track Tools | Annotate and Filter | Annotate with Overlap Information 툴을 이용해주세요.

목록