Release date: 2017-03-02 기준
QIAGEN사에서 Release한 CLC Genomics Workbench 10(Major Upgrade) 업데이트 사항입니다.

New tools for RNA-Seq

• Create Combined RNA-Seq Report - RNA-Seq 분석 결과 후 나온 리포트를 하나의 리포트로 합쳐서 한 번에 보기 쉽도록 만들어 줍니다.

• PCA for RNA-Seq  - 2D 혹은 3D로 샘플을 클러스터링 해주며, metadata를 오버레이시켜 그룹을 만들 수 있습니다.

• Differential Expression for RNA-Seq  - 음이항 GLM기반의 multi-factorial 통계법을 사용합니다.

• Create Heat Map for RNA-Seq - 샘플과 항목을 동시에 클러스터링을 해주고 metadata를 오버레이시킬 수 있습니다.

• Create Expression Browser - 발현값, 통계분석 결과, 유전자 annotation 등을 모두 함께 볼 수 있습니다.

• Create Venn Diagram for RNA-Seq - 발현변화를 확인한 그룹간의 차등발현유전자를 벤다이어그램으로 볼 수 있습니다.

• 'Gene Set Test |  Hypergeometric test'를 사용하여 Differential Expression for RNA-Seq 분석 결과를 검정합니다.

• 'Import | RNA Spike-ins' - RNA spike-in 시퀀스를 import할 수 있습니다.


이전 버전에서 Advanced RNA-Seq이라는 플러그인으로 제공되었던 기능이 기본 RNA-Seq 도구로 들어가며 몇 가지의 기능들이 추가되었습니다. 이 도구들은 자동적으로 시퀀싱의 depth에 대한 차이를 계산하여 별도의 정규화가 필요 없습니다. 


RNA-Seq Analysis

• 품질관리를 위해 RNA-Seq Analysis 도구에서 ERCC나 SIRV같은 RNA spike-ins를 지원하게 되었습니다. spike-in 농도가 알려져 있는 샘플의 transcript의 농도와 비교하여 측정합니다. 

• RNA-Seq Analysis report 수정과 업데이트 :

리드가 맵핑된 바이오타입의 분포 가시화

Transcript의 커버리지 플랏은 5'과 3'커버리지 bias를 감지하고 시각화

paired-end read에서 어댑터 리드를 분석


• RNA-Seq Analysis의 맵핑 도구의 옵션이었던 "Map to gene regions only" 과 "Also map to inter-genic regions"가 사라졌습니다. 이제 모든 분석은 "Also map to inter-genic regions"옵션이 적용되어 맵핑됩니다.

• RNA-Seq Analysis 도구에서 "Expression level"옵션에서 "Use EM estimation (recommended)"으로 발현을 정량화 할 수 있습니다. 이전의 디폴트 옵션보다 더 정확한 결과를 보여줍니다.

•  EM estimation을 이용하여 RNA-Seq결과를 낸다면 더 빠른 속도로 분석이 가능합니다.

• RNA-Seq 분석에서 레퍼런스에 대해서 특이하게 붙은 리드들은 항상 ‘unique’라고 표시됩니다. 이전에는 여러 유전자가 오버랩되는 경우에는 ‘ambiguous’라고 표기 되었지만 이제 모두 ‘unique’로 통일됩니다.

• RNA-Seq 분석 결과인 transcript expression (TE)결과에서 더 이상 Exon ID에 ENSEMBL 컬럼이 포함되지 않습니다. 




Import/Export

• 'Import | PacBio'에서 PacBio 데이터 import 가능합니다.

• 이제는  'Import | Tracks' 도구의 임폴트 포맷이 FASTA 포맷으로 변경되었습니다.

• GFF2/GTF/GVF tracks importer는 GFF3를 지원하지 않으며 GFF3는  새로운GFF3 tracks importer 을 사용해야 합니다.

• 'Import | Tracks' 도구에서 .fna 파일도 불러올 수 있습니다.

• 크로모좀이 많이 포함된 데이터 트랙을 import할 때 속도가 개선되었습니다.

• GFF3포맷으로부터 import한 RNA 트랙파일이 biotype에 따라 색으로 표시됩니다.

• 서열이 트랙의 annotation을 GFF3 포맷으로 export가능합니다.

• BAM 포맷으로 export할 때 인덱스 파일을 생성하는 옵션이 추가되었습니다.


BLAST

BLAST at NCBI 툴에서 사용하던 BLAST 데이터베이스 리스트가 업데이트 되었습니다.

- “RefSeq representative genomes” 데이터베이스 추가

- NCBI에서 더 이상 제공하지 않으므로 “New or revised GenBank sequences (month)” 서비스 종료

- “References mRNA sequences”를 “References RNA sequences”로 변경. 

- “16S ribosomal RNA sequences” 데이터베이스를  “rRNA_typestrains/ prokaryotic_16S_ribosomal_RNA” 데이터베이스로 변경. 


New features and improvements

• 발현분석 도구를 두 가지 폴더로 나누어 재정렬 : "RNA-Seq Analysis" 과 "Microarray and Small RNA Analysis"

• Map Reads to References, Map Reads to Contigs 와 RNA-Seq Analysis같은 맵핑하는 도구들의 퀄리티나 속도가 업데이트되었습니다.

• Local Realignment 도구의Maximum guidance-variant length" 파라미터의 기본 값이 기존 100에서 200으로 변경되었습니다.

• Basic Variant Detection 도구에서 variant의 위치에 모호한 alternative allele을 N으로 보여주는 기능이 제공되지 않습니다.

• Create Statistics for Target Regions 도구를 이용해 생성된 리포트의 ">" 표시가 "≥" 로 바뀌었습니다.

• Create Sequencing QC Report 도구에서 "Additional Reporting",  "Quality analysis" 와 "Over-representation analysis" 옵션이 제거되었고 기본적으로 생성되게 변경되었습니다.

• Search for Reads in SRA 도구에 PubMed 검색옵션이 추가되었습니다.

• 신규 혹은 기존의 시퀀스리스트가 어떤 플랫폼에서 생성됐는지 Element Info view의 Read Group 항목에서 확인할 수 있습니다.

• 테이블 형태의 결과화면에서 셀에서 우클릭을 하면 해당셀을 쿼리로 하여 필터링할 수 있는 "Table filters"를 선택할 수 있습니다. 

• Find Broken Pair Mates 툴에 의해서 생성된 테이블에서 위치정보가 있는 컬럼을 알파벳순서보다 숫자를 우선시하여 정렬합니다.

• Wizard와 튜토리얼창을 동시에 열어 볼 수 있습니다.

• 그 외에 다양한 개선사항이 있었습니다.



Bug fixes and changes

• Circular sequence에서  Create Detailed Mapping Report 의 결과 중 read수가 잘못 나오던 버그가 수정되었습니다.

• Basic Variant Detection, Low Frequency Variant Detection 와  Fixed Ploidy Variant Detection 결과에서 필터링을 진행하면 heterozygous variant는 인식되지만 insertion variant는 인식되지 않는 부분이 homozygous reference insertion이 보고되는 것이 수정되었습니다.

• Identify Known Mutations from Sample Mappings 도구기 워크플로우의 일부로 구성되어 있을 때 input으로 여러개의 mapping 샘플을 넣어주면 분석이 실패되던 버그가 수정되었습니다.

• 프라이머 테이블에서 "Save Primer(s) Fwd, Rev" 이나 "Save Fragment" 옵션을 선택한 후 Cancel 버튼을 클릭해서 작동을 멈추었을 경우 생기던 버그가 수정되었습니다.

• 테이블에 빈 값이 있을 경우 필터링이 되지 않는 버그가 수정되었습니다.

• Advanced filtering 기능을 이용하여 셀에 여러 가지 값이 있을 때 "=" 표시로 필터링을 사용하였을 경우 생기는 버그가 수정되었습니다.

• Export가 포함되어 있는 워크플로우에서 export가 실패했을 경우 아무 메시지도 뜨지 않았던 부분을 문제가 발생한 것을 알려줄 수 있도록 수정되었습니다.

• CLC MLST 혹은 CLC Microbial Genomics Module을 설치하였을 때 나타나는 MLST scheme에서 공란이 포함되어 있을 경우 시퀀스를 정확히 인식하지 못하던 문제가 해결되었습니다. 

• 그 외 다양한 버그가 수정되었습니다.


Retirement

• GFF exporter 도구가 영구히 삭제되었습니다. 새로운 GFF3 exporter로 대체되었습니다.

• The Probabilistic Variant Detection (legacy) 와 Quality-based Variant Detection (legacy) 도구가 영구 삭제되었습니다.

• Expression Profiling by Tags 폴더내에 있던 Extract and Count Tags, Create Virtual Tag List 와 Annotate Tag Experiment 도구가 영구 삭제되었습니다.