차세대 염기서열 분석법(NGS: Next Generation Sequencing)은 분석 속도와 비용에 있어 생명과학 분야에 새로운 패러다임을 창조해 내고 있습니다. (주)인실리코젠 Codes사업부는 NGS 데이터를 이용한 다양한 분석 전략을 제시함과 동시에 최적의 결과 도출을 위한 컨설팅을 제공합니다.


IncoRNAseq.jpg

Inco RNAseq은 특정 컨디션에서의 유전자 발현 양상을 보는 것에서부터 조직 특이 유전자 분석, house keeping 유전자 분석, 유전자 발현을 이용한 ortholog 분석 그리고 alternative splicing 분석에 이르기까지 다양한 분야에 걸쳐 분석이 가능한 서비스 입니다.

NGS 기술을 이용한 본 분석에서는 어떤 생물종도 연구에 이용할 수 있으며 한 번의 시퀀싱으로 수많은 read를 얻는 높은 coverage를 가지기 때문에 단 시간에 적은 비용으로 전체 염기서열을 결정 할 수 있어 빠르고 다양한 정보를 제공받을 수 있습니다.


분석방법

RNAseq 데이터를 이용한 Expression 분석은 언제, 어디서, 어느 정도로 유전자들이 발현되는지 전사 수준에서 총체적으로 탐색하는 것을 목적으로 합니다. 따라서 원하는 컨디션이 반영된 mRNA를 추출하여 라이브러리를 제작하게 되고, 무작위적으로 시퀀싱하여 얻어진 RNA서열을 클러스터링을 통해 발현 양을 추정하게 됩니다. 클러스터링이 완료되면 각 클러스터 별로 포함되어 있는 NGS reads의 개수를 발현 수치 값으로 환산하여 Digital Expression Profile(DEP)작성합니다. 이렇게 완성된 DEP는 다양한 발현 패턴 분석에서부터 조직특이 유전자 그리고 Ortholog 분석에도 이용됩니다.
InCoExpression_pipeline.png

분석 특징 및 내용

Digital Expression Profile(DEP)

여러 조직에서 다양한 발현 양상을 보이는 유전자의 경우 각 조직마다의 발현량은 시퀀싱된 reads 개수를 계산하는 방법으로 Cluster Member Matrix(CMM)을 바탕으로 두 단계의 normalization 과정을 통해 expression value로 환산하는 방법입니다.

  • Cluster Member Matrix(CMM): Assembly(Reference assembly, de novo assembly)를 통해 각 cluster(gene, consensus sequence)마다의 NGS reads를 조직별로 counting하여 Digital Expression Profile(DEP)의 초기데이터인 cluster member matrix를 완성

  • Library Normalization: 특정 클러서터의 reads 개수에서 그 라이브러리 전체 reads 개수 만큼을 나눠주는 정규화방식으로 각 라이브러리에서의 발현 비율로 unigene(gene, consensus sequence)의 발현 정도를 얻을 수 있음.

  • Unigene Normalization: 늘 많이 발현되는 유전자와 그렇지 않은 유전자의 경우 수치상의 차이가 너무 큰 경우에는 라이브러리별 유전자의 발현 패턴을 보고자 할 때 너무 높은 발현 수치로 인해 상대적으로 낮은 수치로 일정 패턴을 갖는 유전자의 의미가 퇴색되어지는 것을 보정해주기 위해 median value로 나눠주거나 log ratio를 취하여 유전자간 수치적 차이를 최소화

ExpressionPatternAnalysis.jpg

Expression Pattern Anlaysis

DEP를 활용하여 마이크로어레이 분석과 동일하게 다양한 조건에서의 유전자 발현을 분석합니다. Fold change를 이용한 DEG 산출 및 hierarchical clustering, self-organizing maps, K-means clustering, PCA(Principle component analysis) 분석을 통해 의미있는 발현 패턴들을 정교하게 표현하기도 하고 이들 패턴들 간의 관계를 분석하기도 합니다.

Tissue Specific Gene Analysis

조직 특이 유전자는 특정 조직에서 그 유전자의 세포내 평균 발현 양 보다 특이적으로 높게 발현되어 특정 조직의 성격을 결정지을 수 있는 유전자를 선별하는 것을 목적으로 합니다.

  • TissueSpecific_heatmap.jpg TissueSpecific.jpg

  • 무작위적으로 일어나는 사건에 대한 확률값을 계산하는 쁘아송 분포(poisson distribution)를 이용한 Audic's test를 통해 조직 특이 유전자를 선별
  • 다양한 cutoff 파라미터를 통해 확률적으로 유의한 유전자 선별 : p_value, enrichment, frequency, 클러스터내의 miniumum reads count등을 이용
  • 검사의 개수가 증가할 수록 임의로 발생하는 오류 또한 증가하여 p_vaule의 의미가 감소하는 문제점이 발생. 이를 극복하기 위해 Bonferroni correction, False Discovery Rate(FDR), 그리고 Permutation test와 같은 다중 검정을 수행

Ortholog Analysis

Ortholog.jpg

서로 다른 종에서 동일한 기능을 수행하는 ortholog 유전자들은 서열 유사성 뿐만아니라 동일한 발현 패턴으로 조절될 것이다. 따라서 일정 수준 이상의 서열 유사성을 갖는 유전자들끼리의 발현 패턴을 ortholog 유전자 분석에 이용한다. 이때 활용되는 발현 패턴은 DEP를 활용하며 동일 패턴 유무는 Pearson's correlation cofficient를 통해 판단한다.

  • 서열 유사성 검사

    • 단백질 수준으로 BLAST를 수행하여 일정 수준 이상의 homology를 갖는 유전자를 모두 분석 대상으로 함.
    • e-value를 파라미터로 하여 일정 수준을 통과하는 유전자를 2차 분석 대상자로 분류
  • DEP를 활용한 Pearson's correlation coefficient 분석

    • 동일 조직에서 발현되는 DEP(digital expression profile)를 분석에 이용
    • Correlation coefficient value
      • 1 에 가까울수록 동일한 발현 패턴
      • 0 에 가까울수록 관계가 없음
      • -1 에 가까울수록 서로 반대의 발현 패턴


Differentially Expressed Genes(DEGs) Functional annotation

Pathway.jpg

  • Gene Categorization을 이용한 Hypergeometric test: GO, MIPS,MetaCat을 이용하여 DEG와 같은 특정 요건으로 묶인 유전자들의 기능이 어떤 카테고리에 집중되어 있는 지 hypergeometric test를 이용하여 분석

  • Text-mining을 통한 대사회로 분석: 선별된 유전자들(DEGs) 사이에서의 대사회로 분석을 통하여 대사회로 내에서 유전자들의 발현양상에 따른 up-regulation 혹은 down-regulation 분석. Signal 관계의 upstream, down-stream 존재 여부 분석

  • Promoter 영역 분석을 통한 발현 조절 메카니즘 분석: 프로모터를 포함한 유전자의 upstream에 존재하는 전사조절인자 binding site의 예측을 통해 유전자의 발현 조절이 어떠한 메카니즘을 통해 이루어지는지 분석


분석 결과

  • 분석 보고서 제공
  • 자세한 분석 결과 및 내용 방문 브리핑 서비스
  • LabKM을 이용한 고객과의 결과 데이터 공유 및 커뮤니케이션


Inco_Promoter2012.jpg

Inco Promoter는 유전자 내의 promoter 영역 분석을 통한 발현 조절 메카니즘을 확인할 수 있는 분석 서비스 입니다.

유전자의 구조 중에서 특히 유전자의 기능에 중요한 영향을 미치는 부분은 유전자의 발현을 조절하는 프로모터 영역입니다. 프로모터를 포함한 유전자의 upstream에 존재하는 전사인자 binding site의 예측을 통해 유전자 네트워크에서의 생물학적인 의미를 찾을 수 있는 기초 데이터를 제공합니다.


분석 특징 및 내용


Transfac.jpg

  • Promoter 영역 예측

  • Transfactor factor 검색 : TRANSFAC을 활용한 유전자의 upstream에 존재하는 공통된 transcription factor를 탐색

  • Transcription factor 예측 : MatchTM, PatchTM 등의 서브 프로그램을 이용한 미지의 서열에 binding 가능한 transcription factor 예측

  • Transcription factor 프로파일 : 통계적 기법을 통한 유의한 TF 선별 및 특정 TF 데이터베이스화


분석 결과

  • LabKM을 이용한 고객과의 결과 데이터 공유 및 커뮤니케이션
  • 분석 보고서 제공
  • 자세한 분석 결과 및 내용 방문 브리핑 서비스


분석 의뢰






  • Immutable Page
  • Info
  • Attachments