차세대 염기서열 분석법(NGS: Next Generation Sequencing)은 분석 속도와 비용에 있어 생명과학 분야에 새로운 패러다임을 창조해 내고 있습니다. (주)인실리코젠 Codes사업부는 NGS 데이터를 이용한 다양한 분석 전략을 제시함과 동시에 최적의 결과 도출을 위한 컨설팅을 제공합니다.


Inco_Assembly2012.jpg

Inco Assembly는 high-performance computing 기술을 이용한 Next Generation Sequencing data의 assembly 서비스로 Reference assembly와 de novo assembly를 위한 파이프라인 구축을 통해 정확하고 빠른 서비스를 수행합니다.

SIMD의 분산처리 방식을 이용한 IncoAssembly는 대량의 NGS 데이터를 다루기 위한 최적의 방식으로 보다 빠른 분석 결과를 보장합니다. NGS data의 일차 분석이라할 수 있는 assembly 과정은 이후 다양한 이차분석을 위한 기초 데이터로서 정확하고 빠른 분석 결과를 보장 받아야 합니다. 따라서, 분석 결과에 대한 신뢰를 높이기 위해 (주)인실리코젠에서는 assembly viewer를 제공하고 있으며, 그외 보고서를 통해 서비스를 수행하고 있습니다.


분석 방법

  • assemblyPipeline.png

초기 sequencing 데이터의 특성을 고려한 pre-processing과 assembly 수행을 위해 시퀀싱 platform, paired-end 유무, reads length (35, 75, 100, >100), 유전체의 대략적인 size, 유전체 학명등이 assembly 분석 시 고려되며 이러한 분석 과정은 고객과의 모니터링으로 보다 낳은 결과를 도출합니다.



분석 특징 및 내용

Reference assembly

ReferenceAssembly.jpg

  • 다양한 NGS platform지원: Illumina HiSeq, Roche 454, IonTorrent, SOLiD, ABI-3730의 다양한 sequencing 데이터를 분석.

  • Color Space assembly 지원 : SOLiD sequencing data(.csfasta)의 color space assembly를 지원.

  • short read와 long reads의 assembly 지원 : Roche454의 long reads와 short reads의 통합 assembly 지원.

  • paired-end/single reads assembly 지원 : paired-end reads와 single reads의 통합 assembly 지원


De novo assembly

denovoTable.jpg

  • 다양한 NGS platform지원: Illumina HiSeq, Roche 454, IonTorrent, ABI-3730의 다양한 sequencing 데이터를 분석.

  • 10억개 reads를 한번에 분석 : de novo assembly의 경우 sequencing된 모든 reads를 대상으로 분석 하는것이 가장 올바르나 현재 assembler의 한계로 인해 여러번 분산하여 assembly를 수행했던 것을 개선하여 최대 10억개 reads를 한번에 분석하여assembly의 quality를 높임.

  • short read와 long reads의 assembly 지원 : long reads와 short reads의 상호 보완적인 assembly수행으로 assembly quality를 높임.

  • paired-end/single reads assembly 지원 : paired-end reads와 single reads의 통합 assembly 지원.

  • assembly quality check : assembled contig의 N50, 최소 contig 길이, 최대 contig 길이, 평균 contig 길이 등을 통해 assembled contig의 quality를 보고.


분석 결과

  • Assembly viewer 제공
  • LabKM을 이용한 고객과의 결과 데이터 공유 및 커뮤니케이션
  • 분석 보고서 제공
  • 자세한 분석 결과 및 내용 방문 브리핑 서비스


IncoAnnotation.jpg

Inco Annotation은 유전체 내의 유전자 위치기능해독하는 Genome annotation 분석 서비스 입니다.

NGS 시대를 맞이하여 더욱 가속화된 유전체 프로젝트를 위한 Inco Annotation은 최적의 생물정보 솔루션을 이용하여 고객의 요구사항에 신뢰할 수 있는 서열분석과 신속, 정확한 세계 표준화된 분석 결과를 제공합니다.


분석 방법

GenomeAnnotation_pipeline.png
Inco Annotation은 유전체 내의 유전자에 대한 구조적 정보를 분석하는 structural annotation, 유전자의 기능을 규명하는 functional annotation, 그리고 마지막으로 수학적 알고리즘으로 밝혀지지 않는 부분을 생물학 전문가가 면밀히 분석하는 manual curation 과정으로 크게 구분하여 분석됩니다.


분석 특징 및 내용

{i} Structural Annotation


1. 반복서열 분석
* 반복서열 영역을 우선적으로 선별 및 마스킹 작업
* 반복 서열 데이터베이스와의 유사성 기반 검색
* 단순반복 서열 규명
* 종별로 특이적인 패턴을 가지는 반복서열 분석

2. 유전자 예측
* HMM 모델을 이용하여 서열상의 exon과 intron 예측
* 정확한 유전자 모델 설정 및 Training 과정을 통한 종 특이적 유전자 구조 매트릭스 형성
* 유전자별로 유전체상의 위치와 방향 정보 제공
* 다양한 유전자 예측 프로그램을 동시에 사용하여 예측 모델 생성

3. 유전자 정렬(mRNA, ESTs, protein)
* Evidence data(mRNA, ESTs, protein) 확보 후 유전체 서열과의 유사성 조사 및 위치 파악
* 다양한 파라미터 설정으로 정확한 Evidenced Gene Model(EGM) 제작
* 유전자 모델 정보 GFF3 파일 포맷 지원

4. 유전자 모델 결합
* Predicted Gene Model(PGM)와 Evidenced Gene Model(EGM) 결합

5. Alternative splicing 분석
* 조직 특이적 alternative transcripts 등 생물학적 의미에 초점을 둔 분석 진행

[Structural annotation 워크플로우]
GenomeAnnotation1.jpg

[Alternative splicing 분석]
GenomeAnnotation4.jpg

{i} Functional Annotation


1. 상동성(homology) 기반의 annotation 분석
* 동일한 종의 단백질 서열을 바탕으로 1차 데이터베이스로 구축
* 유연 관계가 가까운 종을 대상으로 2차 데이터베이스 구축
* 단백질 기능 규명을 위한 서열 정보, 도메인 정보, PDB 정보 등을 이용
* 다양한 알고리즘과 데이터베이스, 분석 프로그램들의 네트워크 구축
* 데이터의 효율적인 관리 시스템 연계

2. 비교 유전체 분석
* Ortholog 분석
* 특정 ortholog 그룹의 다수의 종에 대한 프로파일링 분석

[Pedant-pro 유전자 기능 분석]
GenomeAnnotation5.jpg

[Phylogenetic 프로파일링]
GenomeAnnotation6.jpg

{i} Professional Curation


1. 상동성 기반의 annotation 수정
* 수학적 알고리즘으로 발생하는 예외사항 수정
* 유전자 구조 정보 편집 및 필요한 주석 태그 삽입

2. 기능 분석 결과 수정
* 발현정보, 도메인 정보 등을 정보 등을 종합하여 단백질 기능 수정

[Manually curation]
GenomeAnnotation7.jpg


분석 결과

  • 분석 보고서 제공
  • 자세한 분석 결과 및 내용 방문 브리핑 서비스
  • LabKM을 이용한 고객과의 결과 데이터 공유 및 커뮤니케이션


Inco_Comparative2012.jpg

Inco Comparative는 유전체상의 서로 다른 종의 유사성 및 유연 관계 확인을 위한 비교 유전체 분석 서비스 입니다.

Inco Genome 서비스를 기본 바탕으로 하며, 서로 다른 종간의 상응하는 유전자 조합 및 구성을 분석하여 진화론적인 유연관계를 확인할 수 있습니다. 현재 미생물부터 척추동물에 이르기까지 다양한 종의 비교 유전체 분석에 최적의 파이프라인을 제공하고 있습니다.


분석 방법

InCoComparative_pipeline.jpg


분석 특징 및 내용

{i} Ortholog Analysis


* Synteny 구조를 이용한 ortholog 분석
* 특정 category 내의 protein 간의 synteny를 chromosome 상에서 확인

Ortholog.jpg

{i} Positional Linkage


* 오페론 단위의 유전자 그룹을 유전체 상의 위치 정보와 함께 분석
* 미생물의 경우 보통 유사한 기능을 수행하는 단백질들끼리 서로 이웃하여 위치하여 관련 정보 확인

Linkage.jpg

{i} Phylogentic Profiling


* 특정 ortholog 그룹의 유전자들의 존재 유무 파악
* 다수의 종에서 분석하여 프로파일링 수행
* 분석된 phylogenetic tree로 유연관계를 확인

PhylogeneticProfiling.jpg

{i} Context-based Genome Comparative


* 유전체의 유전자정보, 대사회로정보, 실험정보, 문헌정보 등의 통합 관리
* 유전체의 통합 정보로부터 상호 연관관계 생성, 시각적으로 구현
* 각 유전체 데이터의 통합관리를 이용하여 유전체 비교 분석
* 의미모델링 기법을 적용하여 통합 유전체 데이터의 체계적인 지식관리

BioXM.jpg


분석 결과

  • LabKM을 이용한 고객과의 결과 데이터 공유 및 커뮤니케이션
  • 분석 보고서 제공
  • 자세한 분석 결과 및 내용 방문 브리핑 서비스


분석 의뢰






  • Immutable Page
  • Info
  • Attachments