1. HGMD 홈페이지에서 로그인 후 파일 다운로드 (파일명.tar.gz 형식) 및 압축풀기
이 파일 형식은 리눅스 계열의 압축 파일로,
리눅스에서 압축을 풀거나,
윈도우에서 압축을 풀 때는 전용 프로그램을 사용하여야 하는데 일반적으로 반디집을 이용하시는 것이 가장 편리할 것입니다.
2. CLC Genomics Workbench 열어서 Import
왼쪽 상단 Import > Tracks >
- 2.1. Type of files to import : VCF 또는 GFF3 선택
- 2.2. Import 할 파일 선택
- 2.3. Reference track : hg19 또는 hg38 sequence 선택 (CLC_References > homo_sapiens > sequence > hg19 또는 hg38 > Homo_sapiens_sequence_hg19 또는 Homo_sapiens_sequence_hg38 )
- 2.4. 파일 저장 위치 선택 > Finish
* 이 때, 파일 저장위치는 CLC_References 폴더를 제외한 폴더(Ex: External_DB)에 저장하시면 됩니다. (CLC_References 폴더는 Read only)
3. Annotation
- VCF 파일로 annotation : Toolbox | Resequencing Analysis | Variant Annotation | Annotate from Known Variants 툴을 이용
- GFF3 파일로 annotation : Toolbox | Track Tools | Annotate and Filter | Annotate with Overlap Information 툴을 이용해주세요.