CLC Genomics Workbench V.23 Release Note
New tools coming from plugins
Other new functionality and improvements
RNA-Seq analysis tools
RNA-Seq Analysis
- Transcript Expression(TE) Table에서 유전자 명(중복 제외)이 변경되지 않습니다. 이전에는 유전자 명의 숫자를 더한 이름(예: “BRCA_1”)으로 변경되었습니다. 따라서, CLC Genomics Workbench 23버전의 TE Track을 히트 맵, PCA 플롯, 표현식 등을 생성함에 있어 이전 버전의 TE Track과 함께 사용할 수 없습니다.
- Input Reads가 Biomedical Genomics Analysis Plug in에 의해 UMI로 annotation 되고, Library 유형이 RNA-Seq 분석을 위한 3’ Sequencing으로 설정된 경우 보고서의 Fragment statistics section에 UMI의 수가 포함됩니다.
Heat Map
- 샘플들은 Tree, 샘플 또는 활성 metadata layer options 이나 개별 Metadata 항목별로 정렬할 수 있습니다.
- Features를 재정렬 하여 왼쪽 위에서 오른쪽 아래로 대각선을 만드는 새로운 옵션입니다.
- Metadata 카테고리의 순서를 조정할 수 있습니다.
Expression Browser
- 유전자를 시각화하기 위한 새로운 Plot이 포함되어 있으며, Metadata 카테고리 등은 알파벳순으로 정렬됩니다.
Venn diagrams
- 4개 및 5개의 그룹의 분석을 지원 합니다. (이전까지는 최대 3개 그룹)
PCA for RNA-Seq
- 두 개의 Table이 Output 되며, 첫 번째 Table에는 PCA 데이터 View가 나타나고, 두 번째 Table에는 점의 좌표로 표시 됩니다.
- 2D PCA Plot 의 Metadata 카테고리의 순서를 조정할 수 있습니다.
miRNA analysis tools
Quantify miRNA
- 중복된 이름을 포함하는 데이터베이스(Customize)를 가공합니다.
- 60bp보다 긴 시퀀스를 포함하는 데이터베이스(Customize)를 허용하지 않습니다. (SmallRNAs 와 유사한 시퀀스에 대한 Reads의 잘못된 할당을 방지할 수 있습니다.)
Extract IsomiR Counts
- 여러 inputs를 추가할 때 Expression Tables에는 샘플 중에서 식별된 “Combined set of IsomiRs” 에 대한 항목이 포함되어 Differential Expression in Two Groups 및 Differential Expression for RNA-Seq 분석에 호환됩니다.
Differential Expression for RNA-Seq and Differential Expression in Two Groups
Detect and Refine Fusion Genes
- 이전 Biomedical Genomics Analysis 플러그인에 배포되었던 Detect and Refine Fusion Genes의 업데이트된 버전입니다 .
- Fusion은 overlapping 유전자에 대해 calling 되지 않습니다.
- Novel exon boundary improvements:
- 옵션이 확장되어 Single fusion partner (“Detect with novel exon boundaries”)와 2 fusion partners (“Allow fusions with novel exon boundaries in both genes”)가 있는 융합을 탐지할 수 있습니다.
- “Detect exon skippings” 옵션은 새로운 Exon boundaries와의 fusions 감지를 지원합니다.
- 보고서에서 non-significant breakpoints를 생략하는 옵션이 추가되었습니다.
- Fusion에 대한 증거를 평가할 때 사용할 최소 Z-score를 지정할 수 있습니다.
- "Allow fusions with novel exon boundaries in both genes" 옵션이 false positive Fusion의 수를 줄이기 위해 기본적으로 false으로 설정됩니다. true로 설정하면 새로운 융합을 검색하는 데 유용합니다.
- Changes to the maximum number of equivalent matches to the reference allowed for a single read to be retained:
- Reads를 fusion chromosome으로 재 Mapping할 때 최대 수는 이제 30입니다. (이전에는 10이었습니다)
- unaligned ends를 검색할 때 최대 수는 변경되지 않고 10으로 유지됩니다.
- “Maximum number of hits for a Read” 옵션이 제거되었습니다.
- “Only use fusion primer Reads” 옵션이 활성화된 경우 paired end Reads가 single end Reads 으로 처리되는 문제를 수정했습니다.
- Insertions 및 deletions를 포함하는 Read에 대해 unaligned ends가 너무 길거나 너무 짧을 수 있는 문제를 수정했습니다. 따라서 이전 버전과 비교하여 결과에 약간의 차이가 발생할 수 있으며, 이는 결과의 false positive 와 false negatives의 감소로 인한 것으로 예상됩니다.
Import and export
- VCF Import: Inversions (<INV>), Insertions (<INS>), Deletions (<DEL>) and Tandem duplications (<TANDEM:DUP>)의 Symbolic alleles를 지원합니다. Sequence 정보를 포함하지 않거나 100,000bp보다 긴 Symbolic alleles는 Variant tracks 대신 Annotation tracks로 가져옵니다.
- 동일한 vcf 레코드에 인코딩된 multiple loci가 있는 variants에 대한 처리가 개선되었습니다.
- VCF Export: Insertions (<INS>), Deletions (<DEL>), Tandem duplications (<TANDEM:DUP>)에 대한 Symbolic alleles를 표현합니다. deletions를 제외하고 Annotation tracks 의 Variants는 항상 Symbolic alleles로 내보내집니다. Annotation tracks의 Deletions 및 지정된 크기 이상의 Variants도 Symbolic alleles로 내보냅니다. (기본 크기는 1000 bp이며, 이는 InDels < 1000 bp가 Symbolic alleles로 표현되어야 한다는 QCI Interpret 요구 사항에 해당합니다)
- PacBio의 HiFi Reads를 CLC내로 가져오는 것을 지원합니다.
- fastq 파일로 내보낼 때 Reads 길이가 524,288bp에서 16,777,216bp로 증가했습니다.
- SAM/BAM Mapping Files importer:
- 속도가 개선되었습니다.
- References 의 Circular flag가 나타납니다.
- “GFF3 Export” 에서 헤더의 대소문자를 유지합니다.
- Standard Import의 사용 기록 정보가 자세히 나타납니다. (예: “CSV Table importer”, “Fasta importer” 등)
- Standard Import 는 AWS S3 위치의 파일을 가져오는 데 사용할 수 있습니다.
- 이미지를 Bitmap 기반 형식으로 내보낼 때 지원되는 최대 픽셀 수를 초과하지 않도록 화면 해상도 및 고해상도 옵션이 제한됩니다.
Sequence Lists
- Checkboxes를 활성화 하여 Sequence Lists의 보기 내에서 Sequence를 선택할 수 있습니다. list는 표시 여부에 따라 정렬할 수 있으며 표시된 Sequence를 삭제할 수 있습니다.
- In the Annotation Table view, the following changes have been made to the right-click menu: 선택한 Annotation의 Sequence를 삭제할 수 있습니다.
- 선택한 Annotation이 있는 Sequence의 이름을 클립보드에 복사할 수 있습니다.
- GFF로 내보내는 옵션이 GFF3 형식으로 내보내집니다.
- Table view 에서 선택한 Sequence를 삭제할 수 있고 선택한 Sequence의 이름을 복사할 수 있습니다.
CLC Metadata Tables
- Batch mode에서 분석을 시작하거나 Iterate element로 워크플로를 시작할 때 연결된 데이터가 있는 CLC Metadata Tables을 input으로 직접 사용할 수 있습니다. Workflow를 시작할 때 Batch 단위의 기반이 되는 열을 지정할 수 있습니다.
- 다른 CLC Metadata Table 또는 Excel, CSV 또는 TSV 파일의 콘텐츠 추가를 수행하는 새로운 옵션이 포함됩니다. CLC Metadata Table의 행을 선택하여 새로운 CLC Metadata Table을 만드는 데 사용할 수도 있습니다.
- 데이터를 CLC Metadata Table에 연결하면 미리보기가 표시됩니다.