CLC Microbial Genomics Module Latest Improvements

CLC Microbial Genomics Module 24.0


New features and improvements

  • New tool: ‘Classify Long Read Amplicons’는 Oxford Nanopore 또는 PacBio long-read 시퀀싱 플랫폼으로 얻은 16S rRNA를 포함한 amplicon 데이터의 profiling을 가능하게 합니다.
  • ‘Create SNP Tree’의 경우, SNP Tree Variants view에서 각 샘플의 allele이 별도의 column에 표시되는 'By sample' SNP representation을 제공합니다.
  • ‘Find Best References using Read Mapping’ : 각 assembly ID를 reference로 취급하는 옵션이 도입되었습니다. 예를 들어 인플루엔자 A 및 B 같은 바이러스 유전체 분석 시 segment를 개별적인 reference로 취급하여 정확한 mapping과 분석을 수행할 수 있습니다.
  • Resistance 분석에 사용되는 The Virulence Factor database (VFDB)를 CLC 내에서 다운로드 할 수 있습니다.

Database and reference data updates and changes

  • Greengenes2. ‘Download Amplicon-Based Reference Database’에서 사용 가능한 Greengenes 16S 데이터베이스가 Greengenes2 버전으로 업데이트되었습니다.
  • ‘Download MLST Scheme’는 Institut Pasteur에서 호스팅하는 MLST schemes의 다운로드를 지원하며 다음과 같은 schemes들이 추가되었습니다:
  • Bordetella pertussis cgMLST, Bordetella MLST, Corynebacterium diphtheriae complex cgMLST, Corynebacterium diphtheriae complex MLST, Corynebacterium ulcerans cgMLST, Klebsiella pneumoniae species complex MLST, Listeria spp. MLST.
  • 다음 PubMLST-hosted scheme가 추가되었습니다: Serratia spp. MLST.
  • ‘Download Resistance Database’에서 사용 가능한 ARG-ANNOT 데이터베이스의 이름이 AR Marker Database에서 ARG-ANNOT Peptide Marker Database로 변경되었습니다.
  • ‘Download Ontology Database’에서 사용 가능한 Enzyme Commission number (EC) 데이터베이스의 이름에는 이제 EC database version이 포함되었습니다.

Bug fixes

  • ‘EC functional profile abundance table’ stacked 시각화에서 데이터가 특성별로 집계될 때 잘못된 label이 표시되는 문제를 수정했습니다.
  • ‘Bin Pangenomes by Sequence’ 및 ‘Taxonomic Profiling’에서 페어링된 reads 시퀀스 목록의 reads 방향을 무시하고 이를 forward-reverse로 사용하는 문제를 수정했습니다. 이제는 도구들은 입력 시퀀스 목록의 읽기 방향 설정을 활용합니다.
  • Reference 데이터베이스에서 sequence에 taxonomy annotation이 없을 경우 ‘Create Taxonomic Profiling Index’가 되지 않는 문제를 수정했습니다.
  • 제공된 데이터베이스의 Phenotype column에 colons이 포함되어 있을 경우 ‘Find Resistance with Nucleotide Database’가 되지 않는 문제를 수정했습니다.
  • ‘Database Builder’, abundance table, PCoA 3D plot, Sunburst plot 및 Identified Pathways Graph의 CLC 표준 설정을 복원하는 데 실패하는 문제를 수정했습니다.
  • ‘Annotate with DIAMOND’가 가끔씩 되지 않는 문제를 수정했습니다.
  • ‘Annotate with DIAMOND’가 잘못된 GO-term link가 포함된 CDS annotation을 생성하는 문제를 수정했습니다.
  • 항균제 내성(Antimicrobial resistance) abundance table을 .biom 형식으로 export 과정에서 되지 않는 문제를 수정했습니다.
  • CLC Genomics Server에서 실행된 ‘PICRUSt2 Multiplication Table’ import 할 때 성공적으로 가져오는데도 불구하고 오류 메시지가 표시되는 문제를 수정했습니다.
  • 동일한 CDS에 두 번 주석이 달린 경우 ‘Build Functional Profile’에서 GO terms를 이중으로 계산하는 문제를 수정했습니다.

Changes

  • ‘SNP Tree Variants view’에서는 Side panel에서 column을 선택/해제 할 수 없게 되었습니다.
  • Nucleotide DB를 사용한 Find Resistance가 ‘Find Resistance with Nucleotide Database’로 이름이 변경되었습니다. 마찬가지로 tool parameter 'DB'가 'Database'로 이름이 변경되었습니다.
  • Tool들의 위치가 바뀌었습니다 :
  • ‘Mask Low-Complexity Region’은 Microbial Genomics Module | Tools 위치에서 Utility Tools 하위로 위치가 바뀌었습니다.
  • ‘Create Result Metadata’, ‘Extend Result Metadata Table’ 그리고 ‘Use Genome as Result’는 Microbial Genomics Module | Typing and Epidemiology | Result Metadata 하위에서 Utility Tools | Result Metadata 하위로 위치가 바뀌었습니다.

Known issue

  • 인텔 프로세서(Intel processor)를 사용하는 Mac 컴퓨터에서는 ‘Sunburst view’에서 abundance 테이블을 열 수 없습니다. 이를 시도하면 Workbench가 종료됩니다.

Functionality retirement

  • Convert Abundance Table to Experiment tool을 더 이상 사용할 수 없게 되었습니다.

Advance Notice

  • Template workflow 'Analyze Viral Hybrid Capture Panel Data'가 Workbench Toolbox의 Legacy Tools로 이동되었으며, 소프트웨어의 향후 버전에서 사용이 중단될 예정입니다. 따라서 'Analyze QIAseq xHYB Viral Panel Data' template workflow를 사용하는 것을 권장합니다.
  • ‘Extract Regions from Tracks'가 Workbench Toolbox의 Legacy Tools로 이동되었으며, 소프트웨어의 향후 버전에서 사용이 중단될 예정입니다. 따라서 'Extract Reads'를 사용하는 것을 권장합니다.