자주 묻는 질문 | ㈜인실리코젠-데이터 바이오 기업

[릴리즈] QIAGEN CLC Genomics Workbench v.26 새로운 업데이트 조회 3,077 2025. 12. 29 - CLC Genomics Workbench Latest release note 2025.12.01.부터 v26.0.1 적용 가능 New features and improvements New Tools ‘Detect Fusion Genes from DNA’는 DNA reads track 으로부터 fusion을 식별합니다. ‘Update Sequence Attributes’는 개별 elements, sequence 목록, 정렬 및 Tree의 sequences 속성을 업데이트 합니다. 위 기능은 Table view 하단에 위치한 ‘Add Attributes’ 버튼을 통해서도 사용할 수 있습니다. ‘Download Taxonomy’는 NCBI Taxonomy Database의 7단계 분류를 서열의 Taxonomy 속성 값으로 추가합니다. ‘Filter Based on Name’은 원하는 이름을 가진 항목만 포함하도록 필터링 할 수 있습니다. ‘Create Motif List from Sequences’은 Input한 Sequence 또는 그 Annotation에서 파생된 simple motifs를 포함하는 motif 목록을 생성합니다. ‘Create Sequence Constructs’은 구성 요소를 결합하여 모든 sequence 조합을 생성하여 DNA 또는 단백질 구성체를 생성합니다. ‘Fusion plots graphics exporter’는 Fusion 유전자 track의 모든 fusion plot을 그래픽 파일로 내보냅니다. Workflow related Workflow authoring functionality Workflow 요소들을 해당하는 Group에 배치하여 확장 또는 축소된 형태로 표시합니다. Workflow의 많이 거치는 경로는 시작 시에 ‘Fork’ 요소를 배치하여 단일 선택으로 지정할 수 있습니다. 새로운 Workflow 요소인 ‘Branch on Item Count’는 특정 항목을 기준으로 흐름을 제어합니다. Workflow에서 특정 도구의 downstream 또는 upstream의 경로를 강조표시할 수 있습니다. Other workflow editor improvements Workflow 편집기를 재구성하여 관련 기능에 빠르게 접근할 수 있도록 개선되었습니다. Workflow 편집기 side panel을 재구성하고 label을 업데이트하였습니다. Validation 메시지를 더 쉽게 확인할 수 있습니다. Workflow의 구성 요소를 추가하는 기능이 개선되었습니다: Workflow의 여러 연결을 단일 작업으로 이동할 수 있습니다. 2개 이상의 데이터 세트를 input으로 필요로 하는 도구가 포함된 workflow는 기본적으로 하나 또는 여러 개의 input을 연결할 수 있습니다. 이전에는 원하는 수의 데이터 세트를 input으로 수행하려면 하나의 input을 연결해야 했습니다. Workflow 편집기에서 기존 workflow의 전체 또는 일부를 복사/붙여넣기를 수행할 때는 기존의 workflow의 순서는 유지됩니다. Workflow에는 도구가 있지만 CLC에는 없는 경우(ex. 현재 설치되지 않은 plugin에서 제공된 도구인 경우) 해당 도구의 정보가 제공됩니다. Existing tools workflow-enabled Workflow에서 활성화된 도구들 Annotate with GFF/GTF/GVF files Extract Sequences Restriction Site Analysis Other workflow related improvements CLC 소프트웨어에서 사용할 수 없는 도구가 포함된 workflow도 설치할 수 있습니다. 이를 통해 필요한 plugin을 나중에 설치할 수 있습니다. 설치된 workflow에 대한 설명은 해당 workflow의 복사본에 포함됩니다. Filtering Filtering ‘Advanced table filtering’과 ‘Filter on Custom Criteria’의 필터링 기능이 대폭 개선되었으며, Filter criteria 정의가 표준화되었습니다. 복잡한 필터링 전략도 한 번에 정의할 수 있으며, 기준을 그룹화하고 각 그룹에 대해 모두 일치 또는 일부 일치로 일치를 개별적으로 정의할 수 있습니다. 모든 기준과 일치하는 항목을 유지하거나 제거하거나, 모든 항목에 일치 상태 정보를 annotation에 추가할 수 있습니다. Filter criteria 정의는 복사/붙여넣기 및 필터 세트를 통해 재사용할 수 있습니다. Simple and advanced table filters에서 사용 가능한 작업이 개선되었습니다. ‘Select Matches’ 작업을 통해 다른 행을 숨기지 않고 기준과 일치하는 행만을 선택할 수 있습니다. ‘Invert Selection’을 통해 선택한 행의 선택을 해제하고 이전에 선택하지 않은 행을 선택할 수 있습니다. ‘Show All’을 사용하면 필터링이 적용된 후 모든 행이 표시됩니다. ‘Clear’을 사용하면 필터링에서 정의된 모든 기준을 제거할 수 있습니다. 기존 작업의 labeling 지정 기능이 개선되었습니다. ‘-’ 또는 ‘:’를 포함한 용어를 따옴표로 묶은 경우, 이제 간단한 표 필터링에서 해당 용어를 사용할 때 따옴표가 적용됩니다. 이전에는 따옴표로 묶인 경우에도 특수 문자로 해석되었습니다. Filter on Custom Criteria: 보고서를 생성할 수 있습니다. 이 보고서는 샘플 보고서 또는 통합 보고서에 추가할 수 있으며, 기준과 일치하거나 일치하지 않는 총 항목 수를 샘플 보고서의 QC 요약 항목으로 사용할 수 있습니다. Motif 목록, stand-alone mapping 및 generic table들은 이제 input 형식으로 지원됩니다. Tables Tables 테이블 하단에 있는 Create New Table 버튼을 사용하면, 기존 Table에서 선택된 행만을 포함하는 새 테이블을 생성할 수 있습니다. 현재 View에 표시된 테이블 내용을 내보내는 메뉴 옵션의 이름이 Export Displayed Table로 변경되었습니다. 대용량 테이블에 대한 정렬 속도가 개선되었습니다. 테이블에서 행이 선택된 상태인 경우, 열 기준 정렬을 수행한 이후에도 해당 선택 상태가 유지됩니다. Motifs Viewing and defining motifs Motif List 테이블 View는 여러 행 선택을 지원하며, 마우스 오른쪽 클릭 메뉴에 표준 테이블 옵션이 포함되어 있고, sequence로부터 Motif를 추가할 수 있는 Add Motifs from Sequences 옵션을 제공합니다. Motif는 Annotation 타입을 가지며, 추가적인 annotation 메모를 포함할 수 있습니다. 이러한 기능은 sequence 간에 간단한 annotation 정보를 전달하는 데 사용할 수 있습니다. Searching for motifs Motif Search는 개선된 실행 화면을 제공하며, 정확도 값을 0에서 100 사이의 임의의 값으로 지정할 수 있습니다. 또한, circular sequence의 motif도 지원됩니다. Side panel의 Motifs와 관련된 새로운 기능은 다음과 같습니다. 단순 motif 매칭을 위한 최소 정확도를 설정할 수 있습니다. Motif를 직접 입력할 수 있는 빠른 검색 필드가 추가되었습니다. Side panel에서 motif를 직접 편집할 수 있습니다. 다음 매칭 위치로 바로 이동할 수 있습니다. 하이라이트 된 motif 위에 마우스 커서를 올리면 표시되는 정보에는 매칭 상세 정보가 포함되며, 일치하지 않는 residue는 소문자로 표시되고 매칭 정확도도 함께 표시됩니다. Side panel에서 실행되는 Manage Motifs 대화상자에는 추가적인 공통 Motif들이 포함되어 있으며, Motif list에 저장할 수 있는 옵션도 제공합니다. BLAST and BLAST at NCBI BLAST and BLAST at NCBI Megablast 최적화 기능은 nucleotide 쿼리 서열로 nucleotide 데이터베이스를 검색할 때 사용할 수 있습니다. 검색에 대한 기본 설정값이 업데이트되었습니다. 특히 중요한 부분은, 모든 검색 유형에서 기본 E-value가 이제 0.5로 설정되었습니다. 실행 화면에서 옵션 표시 방식이 전반적으로 개선되었습니다. 히트가 발견되지 않은 경우에도 BLAST 결과가 생성됩니다. 이전에는 히트가 없다는 정보가 로그에만 기록되고, BLAST 결과는 생성되지 않았었습니다. Sequence 리스트 내의 서열에서 선택한 영역을 기준으로 BLAST 및 BLAST at NCBI를 바로 실행할 수 있습니다. 이전에는 서열을 개별 View로 열었을 때만 이 기능이 가능했습니다. 펩타이드 데이터베이스 검색을 위해 BLAST at NCBI를 실행할 때, 기본 선택 데이터베이스가 nr 데이터베이스에서 ClusteredNR로 변경되었습니다. PDB 데이터베이스에 대한 BLAST 히트 결과의 서열은 다운로드하여 열거나 저장할 수 있으며, 또는 NCBI 웹사이트에서 바로 열어 확인할 수도 있습니다. Variant detection Variant detection 성능 개선 사항 Basic Variant Detection, Low Frequency Variant Detection, and Fixed Ploidy Variant Detection는 특히 전장 유전체 데이터처럼 많은 변이를 호출할 때 메모리 사용량이 감소되었습니다. Low Frequency Variant Detection 속도가 개선되었습니다. Copy Number Variant Detection (Targeted)는 이제 타겟 영역을 초과하는 범위를 포함하는 control coverage table도 사용할 수 있습니다. 이전에는 control coverage table의 영역이 타겟 영역과 정확히 일치해야 했습니다. Filter Homozygous Reference Variants는 homozygous reference variant를 결과에서 제거하는 대신 annotation으로 표시할 수 있습니다. Amino Acid Changes는 HGVS 표준을 준수하는 annotation을 추가합니다: Deletion과 Duplication은 단순한 표기법을 사용합니다. 예를 들어, c.274delT와 c.123_124dupGA는 각각 c.274del과 c.123_124dup으로 표기합니다. 반복 서열은 long format을 사용합니다. 예를 들어, c.58_59insTTT는 c.58_58insT[3]으로 표기됩니다. Theoretical 변이는 괄호로 표기됩니다. 예를 들어, p.Glu169Asp는 p.(Glu169Asp)로 표기됩니다. Low Frequency Variant Detection 과 Fixed Ploidy Variant Detection은 PacBio 및 Oxford Nanopore reads를 사용할 때 homopolymer indel에 의한 거짓 양성 발생이 감소되었습니다. Reports Reports Create Report from Table은 생성되는 리포트에 대해 추가적인 사용자 지정 기능을 지원합니다: Numerical column은 퍼센트 형식으로 표시할 수 있습니다. Filter on Custom Criteria에 의해 ‘일치하지 않음‘으로 annotation 처리된 행은 리포트에서 제외할 수 있습니다. 요약 행을 추가할 수 있으며, 이는 Create Sample Report에서 QC 요약 항목으로 사용될 수 있고, combined report 에도 포함될 수 있습니다. RNA-seq Analysis에서 생성된 리포트에는 paired reads의 총 매핑 수가 포함되며, 이 값 또한 Create Sample Report에서 QC 요약 항목으로 사용할 수 있습니다. Create Sample Report와 Combine Reports는 RNA-seq Analysis for Long Reads의 리포트를 입력으로 사용할 경우, 더 이상 reads에 대한 read count를 출력하지 않습니다. Create Variant Track Statistics Report는 입력 데이터가 비어 있을 경우, 기존의 No data available 대신 0으로 출력됩니다. Create Variant Track Statistics Report에서 보고되는 총 변이 수는 Create Sample Report에서 QC 요약 항목으로 사용할 수 있습니다. Tracks Tracks Merge Annotation Tracks: 중복 annotation을 처리하기 위한 옵션이 포함되었습니다. 중복된 annotation이 하나로 병합되었는지 여부를 나타내는 Collapsed 속성이 결과물에 추가되었습니다. 병합된 annotation 이름 뒤에 (merged)를 더 이상 자동으로 추가하지 않습니다. Annotate with Overlap Information에는 겹치는 항목의 속성을 복사할지 여부를 제어하는 옵션이 추가되었습니다. 속성이 복사되는 경우, 겹치는 트랙의 이름이 Overlap tracks 속성에 추가됩니다. 이전에는 속성이 항상 복사되었으며, 겹치는 트랙의 이름이 복사된 속성 이름 뒤에 그대로 추가되었습니다. Filter Based on Overlap과 Filter on Custom Criteria는 fusion track을 필터링할 때, 동일한 융합을 설명하는 두 개의 breakpoint가 함께 유지되거나 함께 제거되도록 동작합니다. 이전에는 각 breakpoint가 독립적으로 필터링 되었습니다. Detect and Refine Fusion Gene에서 출력되는 fusion track은 다음 정보를 포함합니다: fusion frequency와 5’ 및 3‘ frequency를 포함합니다. IPA gene view를 사용할 수 있는 더 많은 fusion이 포함된 최신 목록이 적용되었습니다. Chromosome Table view는 이제 모든 트랙 타입에서 사용할 수 있습니다. Sequences Sequences 복사된 sequence는 기존 sequence에 붙여넣을 수 있습니다. Annotation이 있는 sequence 영역을 복사하면, annotation도 새 위치에 복사됩니다. 개별 sequence는 attribute를 관리할 수 있는 table view가 있습니다. 선택한 영역 내 residue에 대한 빈도 정보는 side panel에 Positional stats에서 확인할 수 있습니다. Sequence lists Graphical view improvements Graphical view에서 sequence 이름을 클릭하면 전체 sequence가 선택됩니다. Graphical view에서 여러 sequence를 선택하는 것이 더 간편해집니다. Graphical view에서 sequence 레이블에 숫자를 포함할 수 있습니다. Side panel의 “Lock numbers” 옵션을 통해 각 sequence별이 아닌, 최상단에 sequence position 숫자를 표시할 수 있습니다. 선택한 영역 내 residue 빈도에 대한 정보 및 선택한 영역을 포함하는 sequence의 개수가 side panel의 “Position stats”에 표시됩니다. Table view improvements Table view에서 행을 선택 후 드래그하여 원하는 순서로 재배치할 수 있습니다. Table view에서 선택한 행을 다른 리스트의 Table view로 드래그하여 sequence를 복사할 수 있습니다. Alignments Graphical view improvements Graphical view에서 sequence 이름을 클릭하면 전체 sequence가 선택됩니다. Graphical view에서 여러 sequence를 선택하는 것이 더 간편해집니다. Graphical view에서 sequence 레이블에 숫자를 포함할 수 있습니다. 선택한 영역 내 residue 빈도에 대한 정보 및 선택한 영역을 포함하는 sequence의 개수가 side panel의 “Position stats”에 표시됩니다. Table view improvements Table view에서 행을 선택 후 드래그하여 원하는 순서로 재배치할 수 있습니다. Sequence 속성(attribute)을 추가, 수정 및 삭제할 수 있습니다. Trees Trees Alignment 기반으로 생성된 tree의 경우, tree와 해당 alignment를 연결하여 함께 볼 수 있는 alignment view를 제공합니다. 기존 “metadata”로 표시 및 우클릭 메뉴 항목이 “attributes”용어로 변경됩니다.예: “Assign Metadata” → “Add Attributes”, “Delete Metadata ” → “Delete Attribute ”, “Import Metadata” → “Add Attributes” Tree 옵션에 Description, Accession, Latin Name, Taxonomy, Common Name 등 표준 sequence 속성을 선택할 수 있습니다. Template workflow updates Template workflow updates QIAseq Panel Analysis Assistant가 QIAseq 커스텀 패널용 분석을 설정할 수 있도록 지원합니다. Identify DNA Germline Variants workflow에서 변이를 필터링 하는 대신 annotation을 추가하도록 변경됩니다. RNA-Seq and Differential Gene Expression Analysis workflow에 “Create Sample Level Heat Map”이 추가됩니다. 이전에는 feature level heat map만 생성되었습니다. Import and upload Import and upload FASTA 파일로부터 시퀀스를 가져오는 속도가 대폭 향상됩니다: Standard Import of FASTA (.fa/.fsa/.fasta), Nucleotide FASTA, and Protein FASTA Biomedical Genomics Analysis plugin 및 CLC Single Cell Analysis Module에서 제공하는 Import Immune Reference Segments CLC Microbial Genomics Module에서 제공하는 Import MLST Scheme Standard Import 사용 시 GenBank/EMBL feature table의 source 섹션에 포함된 taxon reference가 “TaxID” 속성값으로 자동으로 할당됩니다. CLC Server Import/export 디렉토리 및 AWS S3 bucket에 있는 파일을 metadata로 import 시킬 수 있습니다. Remote Files tab의 “Upload to This Folder” 우클릭 옵션을 통해 AWS S3 bucket에 업로드할 데이터를 다른 AWS S3 bucket에서 선택할 수 있습니다. Remote Files tab 상단에 검색창이 추가됩니다. 파일/폴더 이름 또는 S3 URL로 검색할 수 있습니다. Import 창에서 CLC Server Import/Export 디렉토리의 파일 선택 시 검색창이 추가됩니다. CLC URL, 경로 및 파일명으로 검색할 수 있습니다. Export Export Report를 PDF 형태로 내보낼 시, 표지 또는 목차를 제외하고 내보내는 옵션이 제공됩니다. 이전에는 둘 다 포함되었습니다. VCF Export Biomedical Genomics Analysis 플러그인의 Detect Regional Ploidy로부터 생성된 영역수준(regional-level)의 ploidy track을 지원합니다. 배수성(ploidy) 영역은 CN 값을 갖는 CNV로 내보내어집니다. “Filter” 열이 존재할 경우, 값과 관계없이 모든 항목이 내보내어지며, 해당 열은 VCF에 포함됩니다. BAM Export는 긴 contig를 포함한 read mapping에 대한 인덱스를 생성할 때 .bai 포맷의 인덱싱 포지션 제한(229)에 관련하여 더 명확한 오류 메시지를 제공합니다. Other improvements Other improvements De Novo Assemble Long Reads에서 ONT 또는 PacBio CLR reads 사용 시 “Trim windows” 및 “Minimum coverage” 설정을 추가하여 낮은 커버리지를 갖는 샘플 assembly에 유용한 선택지를 제공합니다. Create Pairwise Comparison으로부터 생성된 pairwise comparison 테이블에서 sequence 레이블이 기본적으로 상단 및 좌측에 표시되며, 레이블 내용을 여러 정보를 사용해 custom 하거나 숨김 처리할 수 있습니다. Workflow의 Create Sample Report에서 QC summary 항목 구성이 간소화됩니다. Primer design을 위한 Calculation parameters 대화창에 Reset 버튼이 추가됩니다. Extract Consensus Sequence가 Alignment를 입력으로 받을 수 있습니다. Annotate with GFF/GTF/GVF files 기능에서 여러 외부 파일을 동시에 사용하여 annotation을 추가할 수 있습니다. Reference Data Manager의 전반적인 개선 사항으로 다운로드 상태에 대한 더 명확한 정보 표시, 검색 기능 개선 등이 포함됩니다. 데이터 요소가 연결된 CLC Metadata Table을 찾는 기능이 지원됩니다. 해당 요소의 Element Info view에 있는 Metadata 섹션의 “Find” 링크를 통해 가능합니다. 기존에는 AWS Connections 대화상자에서 Public S3 bucket 접근을 설정하였으나, 이제는 Connections | Public S3 Buckets에서 설정합니다. 기존에는 별도의 vdb-config를 통해 프록시를 따로 설정하지 않으면 SRA 다운로드가 실패하였으나, 이제는 Workbench의 Preference에서 지정한 프록시 설정이 SRA 다운로드에도 적용됩니다. Toolbox의 Tools 또는 Workflows 탭에서 항목을 선택 후 Ctrl+C 입력 시 항목의 이름이 클립보드로 복사됩니다. 기타 다양한 소규모 개선 Bug fixes Analysis Trim Reads에서 reads trimming을 수행하면, trimming에 사용된 CPU 코어 수에 따라 약간 다른 결과가 나타나는 문제가 해결되었습니다. Basic Variant Detection, Low Frequency Variant Detection and Fixed Ploidy Variant Detection: Reference variants에 대해 일부 Count 값이 Coverage 값보다 커지는 오류가 수정되었습니다. 드물지만 여러 위치를 포함하는 변이에서 보고되는 다양한 품질지표 값이 잘못 계산되던 오류가 해결되었습니다. RNA-seq 데이터에서 서로 겹치는 paired spliced reads가 있고, insertion 내부에 read segment가 완전 포함되는 상황에서 QC가 실패하던 문제가 해결되었습니다. Assembly를 찾지 못한 경우, 결과 자체를 제공하지 않았는데, 이제는 빈 결과라도 출력되도록 개선되었습니다. Display Side Panel에서 consensus sequence의 ambiguous positions에 대한 기호 변경이 적용되지 않던 문제가 해결되었습니다. 서로 겹치는 RNA reads에서 서로 다른 염기가 있을 때, 두 기호가 중복으로 표시되는 문제가 있었는데 이제는 올바르게 IUPAC 코드로 표시됩니다. Compactness가 Packed로 설정된 stand-alone read mappings에서, insertion 직후 reference와 불일치하는 염기 위치가 지정된 mismatch 색상으로 표시되지 않던 문제가 수정되었습니다. Circular reference mapping 시, junction 구간에 걸친 insertion이 표시되지 않는 문제가 해결되었습니다. Import and export Sanger Import 시 reads 이름을 삭제하지 않은 상태로 paired reads를 importing할 때, 실패하던 문제가 수정되었습니다. Fusion 트랙을 VCF로 내보낼 때 read count에 “Fusion spanning reads”가 포함되지 않던 문제가 수정되었습니다. 이제 “Fusion crossing reads”와 “Fusion spanning reads”의 합계를 총 read count로 사용합니다. CNV track을 VCF로 export할 때, CNV 위치가 1bp씩 어긋나는 오류가 수정되었습니다. 특정 파라미터 값이 페이지를 넘어가는 경우, 발생하는 오류가 수정되었습니다. 많은 Input elements로부터 생성된 히스토리 정보를 export할 때 발생하던 문제가 수정되었습니다. Export file “Originates from” 섹션이 1페이지를 채우면, 이후 내용이 잘리던 문제가 있었습니다. Other 다양한 사소한 버그 수정 이번 릴리즈에서 수정된 CVE는 다음과 같습니다. CVE-2025-55163 CVE-2025-58057 CVE-2025-58056 CVE-2025-11226 Reference data Reference data Reference Data Manager의 QIAGEN Sets 탭에서 다음 Reference Data Elements가 추가되었으며, 관련 데이터들이 해당 버전을 표기하도록 업데이트되었습니다. Version 20250915_hg38_no_alt_analysis_set and 20250915_hg19 for Clinvar. Versions ensembl_mane_v1.4_hg38_no_alt_analysis_set and refseq_mane_v1.4_hg38_no_alt_analysis_set for MANE genes, CDS and mRNA. Version ensembl_v115_hg38_no_alt_analysis_set for Ensembl genes, CDS and mRNA. 2025년 11월 3일자로 Download 3D Protein Structure Database 가 14 version으로 업데이트되었으며, 이전 버전의 CLC Genomics Workbench에서도 같은 데이터가 다운로드 됩니다. 2025년 12월 1일부터 Pfam 38.0을 다운로드합니다. 이전 버전의 CLC Genomics Workbench에서도 같은 데이터가 다운로드 됩니다. Plugin notes Plugin notes MAFFT가 이제 추가 alignment plugin에서 사용 가능합니다. Changes Tools and settings Predict Splice Site Effect에 의해 추가된 annotation 이름이 Splice effect에서 Possible splice effect로 변경되었습니다. Possible splice site disruption 값은 Yes로 간소화되었으며, Splice site에 대한 영향이 예측되지 않는 변형에는 No로 표시됩니다. Annotate with Overlap Information으로 추가된 annotation 이름이 기존 overlapping track에서 Overlap으로 변경되었습니다. Annotate from Known Variants으로 추가된 annotation 이름이 Overlap에서 Overlap tracks으로 변경되었습니다. Annotate with GFF/GTF/GVF file의 이름이 Annotate with GFF/GTF/GVF files로 변경되었습니다. Remove Homozygous Reference Variants 이름이 Filter Homozygous Reference Variants로 변경되었습니다. 다음 도구들은 update 된 실행 창들을 보여줍니다. Annotate with GFF/GTF/GVF files Assemble Sequences Extract Sequences Merge Variants Tracks Restriction Site Analysis De Novo Assemble Long Reads and Polish with Short Reads, Identify DNA Germline Variants, Prepare Raw Data and RNA-seq and Differential Gene Expression Analysis workflow: 옵션이 업데이트 되었으며 생성되는 결과 이름이 변경되었습니다. Third party version updates SRA toolkit 버전이 3.1.1로 업데이트되었습니다. Functionality retirement 다음 도구는 더 이상 사용할 수 없습니다. Filter Annotations on Name -> Filter Based on Name Marginal Variants -> Filter on Custom Criteria & Filter Homozygous Reference Variants Update Sequence Attributes -> Update Sequence Attributes Correct Long Reads (legacy) Branch on Sequence Count -> Bran on Item Count Discard variants without effect on splice site 옵션이 Predict Splice Site Effect에서 제거되었습니다. 대신 Filter on Custom Criteria을 사용하여 Predict Splice Site Effect에 annotation이 달린 변형을 필터링하는 것을 권장합니다. path.properties 파일의 설정을 사용하여 임시 파일의 기본 위치가 아닌 위치를 지정하는 것은 더 이상 지원하지 않습니다. 대신, workbench의 vmoptions 파일에 해당 위치를 지정해야 합니다.
[공지] CLC Permanent 라이선스의 MUS 서비스 단종 안내 조회 1,860 2025. 08. 22 - CLC Permanent 라이선스의 MUS 서비스 단종 안내 안녕하세요. CLC 솔루션의 지속적인 사용에 진심으로 감사드리며, 해당 솔루션의 글로벌 정책에 변경사항이 있어 안내드리고자 합니다. [사전 공지 : CLC 라이선스 시스템 변경] 사전 공지 요약 : QIAGEN사는 2025년 11월 25일 출시 예정인 CLC 솔루션 26버전부터 사용자 계정을 통해 라이선스 시스템에 액세스하는 새로운 기능을 도입함. 변경 사유 : 보안 강화 및 QIAGEN 타 솔루션과의 라이선스 시스템 통합 등 2026년 11월 출시 예정인 CLC 솔루션 27버전부터는 기존 CLC permanent 라이선스를 관리하는 시스템에 대한 액세스가 중단될 예정 첨부파일 : CLC_MUS_Retirement.pdf CLC 솔루션의 Permanent 라이선스가 공식 단종된 이 후, 최신 버전 사용 및 기술지원을 위해 MUS(Maintenance, Upgrade, Support) 서비스를 운영해 왔습니다. 안내드린 사유로 인해 MUS 서비스의 구매는 2025년 11월 30일에 종료를 예정하고 있으며, CLC Permanent 라이선스는 26버전까지만 지원합니다. 따라서 CLC 솔루션의 27 버전부터는 Annual 버전의 구독형으로만 라이선스 구매가 가능하오니 참고 부탁드리며, MUS 단종 전에 해당 서비스의 추가 구매 및 장기 계약을 원하시는 경우는 consulting@insilicogen.com 으로 언제든 연락 부탁드립니다.
[릴리즈] QIAGEN CLC Genomics Workbench v.25 새로운 업데이트 조회 2,493 2025. 02. 06 - Latest improvements for QIAGEN CLC Genomics Workbench QIAGEN CLC Genomics Workbench 25.0 Release date : 2025 Long read handling long NGS reads를 분석하기 위한 새로운 tool들과 workflow는 다음과 같습니다: Import Oxford Nanopore Reads Map Long Reads to Reference 염색체를 2번 이상 wrap(감싸는) 하는 reads는 이제 Unmapped로 처리되어 보고서에 작성됩니다. 이전에는 이러한 reads가 자동으로 무시되었습니다. stand-alone read mapping에서 individual read mapping은 이제 ‘mapping’ 대신 ‘_mapping’ 으로 지정됩니다. 이러한 변경으로 downstream tool과 호환성이 향상되었습니다. Structural Variant Caller for Long Reads RNA-Seq Analysis for Long Reads De Novo Assemble Long Reads Hifiasm이 0.19.9 버전으로 업데이트되었습니다. 이 De novo assembler는 PacBio HiFi reads를 assemble 하는데 사용됩니다. 따라서 지금의 결과는 이전 버전의 결과와 다를 수 있습니다. Raven이 1.8.3 버전으로 업데이트되었습니다. 이 De novo assembler는 Oxford Nanopore 또는 PacBio non-Hifi reads를 assemble 하는데 사용됩니다. Tool 내에서의 polishing 방식 변경으로 인해, 이제 reference 서열에서 reads와 비교했을 때 insertion이 더 적게 나타납니다. Assembly Graph 결과에서 마우스 커서를 contig 위에 놓으면 contig의 이름과 length가 포함된 설명이 표시됩니다. Polish Contigs with Reads De Novo Assemble Long Reads and Polish with Short Reads template workflow minimap2가 2.28 버전으로 업데이트되었습니다. minimap2 mapper는 다음 tool에서 활용됩니다: Map Long Reads to Reference, RNA-seq Analysis for Long Reads 따라서 결과는 이전 버전의 결과와 다를 수 있습니다. RNA-seq Analysis for Long Reads의 경우, 로그 파일에는 염색체를 2번 이상 감싸는 reads 수가 포함됩니다. 이전 버전과 마찬가지로 이러한 reads는 발현에 포함되지만 reads track에는 포함되지 않습니다. “Polish with Reads“->”Polish Contigs with Reads“ 로 이름이 변경되었습니다. De Novo Assemble and Polish with Short Reads Workflow가 개선되었습니다: Workflow가 시작되면 추가 옵션을 구성할 수 있습니다. 각 분석 Tool로부터 나온 report는 기존에는 summary sample report에 포함되고 개별적으로 저장할 수 없었지만, 이제는 Output으로 생성됩니다. Summary report가 업데이트되었습니다. section 순서가 바뀌었으며, 시퀀싱 QC 보고서의 일부 section이 더 이상 포함되지 않습니다. 이제부터는 새로운 형식의 Output으로 출력됩니다. 결과로 나오는 Output의 이름 패턴이 업데이트되었습니다. Structural Variant Caller (Long Reads) 에 stand-alone read mapping을 input 했을 때 실패하던 문제를 해결했습니다. Other new functionality 새로운 workflow인 Trim and Map Sanger Sequences는 시퀀스에 trim 주석을 추가한 후 이를 reference 서열에 mapping 합니다. New workflow control flow elements: Fork를 포함하면 workflow가 시작될 때 다운스트림 분석 경로에 대한 선택을 할 수 있으며, 분석의 특정 부분을 실행할지에 대한 여부를 선택할 수 있습니다. Save On the Fly Imports 기능을 사용하면, 실시간으로 데이터를 가져온 직후 바로 저장할 수 있습니다. Collapse Overlapping Annotations는 주석 트랙에서 중복된 주석을 하나의 주석으로 축소시켜줍니다. Resize Annotations을 사용하면 주석 트랙에서 5‘ 또는 3’ 위치를 조정할 수 있습니다. Remove Information from Track은 선택한 정보를 유지하거나 제거하여 주석, 표현, 통계적 비교 및 variant 트랙을 다듬을 수 있습니다. Create Report from Table은 테이블 view의 내용을 기반으로 보고서를 만듭니다. Create Sample Level Heat Map for RNA-Seq은 RNA-seq 데이터에서 샘플 distance에 대한 Heat map을 생성합니다. Import Expression Data는 Excel, CSV 또는 TSV 파일에서 RNA-seq 발현 값을 가져옵니다. AWS S3 bucket의 파일은 Navigation Area 탭에 있는 Remote Files를 사용하여 찾아볼 수 있습니다. Detect and Refine Fusion Genes 새로운 옵션을 사용하면 fusion을 필터링할 수 있습니다. 이는 알려진 false positive를 제거하거나 관심 있는 유전자 또는 fusion을 감지하는데 유용합니다. Fusion은 이제 fusion crossing reads 외에도 fusion spanning reads를 지원합니다. fusion spanning reads는 p-value 및 z-score 계산에 포함됩니다. ‘Detection’ 단계에서 식별된 모든 fusion은 fusion WT 트랙에 포함됩니다. 이는 다음에서 유용합니다: refinement 단계 전에 특정 fusion이 필터링된 이유를 조사할 수 있습니다. break point 위치를 확인할 수 없는 broken pairs를 매핑된 paired reads를 기반으로 잠재적인 fusion을 식별할 수 있습니다. 다음 옵션들이 삭제되었습니다: opposite strand에 위치한 중복 유전자들의 fusion은 무시해야 합니다. 새 필터 기능을 사용하면 이를 방지할 수 있습니다. fusion primer reads만 사용하세요. Detect and Refine Fusion Genes를 실행하기 전에 Filter on Custom Criteria를 사용하여 read를 필터링하는 것을 권장합니다. broken pair fusion의 최대 거리는 더 이상 결과에 영향을 미치지 않습니다. fusion track의 table view가 개선되었습니다: IPA에 대한 링크가 포함된 IPA gene view 열이 포함되어 있으며, 이를 통해 fusion에 대한 추가 정보를 제공받을 수 있습니다. table의 배치와 이름이 변경되었습니다. Gene 열이 제거되었습니다. Usability Tools와 workflows는 이제 Tools와 Workflows로 각각 분리되었습니다. 분리된 기능 들은 Workbench 상단과 Workbench 왼쪽 하단에 있는 Toolbox panel에서 확인할 수 있습니다. Workbench toolbar에 있는 tool들의 이름과 순서가 업데이트 되었습니다. Multiple sequence alignments Positional stats palette가 side panel에 추가 되었습니다. Alignment된 결과에서 특정 위치 위에 마우스 커서를 올려 놓으면 해당 위치의 염기 또는 펩타이드 frequency에 대한 정보를 palette에서 확인할 수 있습니다. Alignment on top의 옵션은 Sequence layout Side Panel palette에서 사용할 수 있습니다. 이 옵션을 활성화하면 aligned 된 sequence 및 sequence logo 등을 확인할 수 있습니다. Alignment된 서열 중에 개별 서열에 대한 정보를 볼 수 있는 Table view가 추가되었습니다. 하나 이상의 sequence에서 염기를 선택하면 alignment된 서열 모두에서 해당 위치를 확인할 수 있습니다. 표에서 작업할 때 키보드 단축키 Ctrl+F (Mac: Cmd+F)를 누르면 간단하게 찾을 수 있습니다. Workflow를 편집할 때, 키보드 단축키 Ctrl+F (Mac: Cmd+F)를 누르면 side panel에 검색 창이 활성화됩니다. Reference Data Manager에 Download Genomes tab에서 사용 가능한 데이터에 대한 정보를 선택하여 복사할 수 있습니다. Performance Copy Number Variant Detection (Targeted), QC for Targeted Sequencing, QC for Read mapping 그리고 QC for Sequencing에 속도가 크게 개선되었습니다. Variant track에서 검색 및 필터링 속도가 향상되었습니다. Annotate with Exon Numbers, Annotate with Overlap Information, Filter Based on Overlap 속도가 향상되었습니다. Maximum Likelihood Phylogeny 이전보다 더 적은 메모리를 활용합니다. Import GFF3 format을 위한 Tracks importer: 파일과 제공된 reference 사이에 일치하지 않는 염색체 길이가 있는 것을 허용하지 않습니다. UCSC에서 정의한 모든 염색체 aliases를 지원합니다. Gene 및 Transcript의 유사한 annotation 유형을 식별하기 위해 Sequence Ontology 버전을 2024-06-05를 활용합니다. Gene track의 pseudogenes를 포함합니다. VCF import UCSC에서 정의한 모든 염색체 aliases를 지원합니다. DUP:TANDEM symbolic 대립유전자는 Variant track에 포함됩니다. UMI 정보를 포함하는 세 가지 FASTQ 헤더 형식이 지원됩니다. Standard Import를 사용하여 GenBank 형식 파일을 가져올 때, ncRNA 및 rRNA annotation은 다음 중 하나의 정보를 사용하여 명명되며, 이 순서로 고려됩니다: “gene”, “locus_tag”, “product”, “protein_id”, “transcript_id”, “note”. 기존에는 “note” 정보만을 사용하였습니다. Workflow 이제 다음과 같은 workflow를 사용할 수 있습니다. Create Pairwise Comparison Proteolytic Cleavage Motif Search Find Binding Sites and Create Fragments Assemble Sequences to Reference의 stand-alone read mapping 결과는 workflow에서 Fixed Ploidy Variant Detection, Low Frequency Variant Detection 그리고 Basic Variant Detection에 입력으로 사용할 수 있습니다. Annotate with Exon Numbers, Annotate with Overlap Information 그리고 Filter Based on Overlap은 single output channel을 가지며, 이는 track-type 4개를 대체합니다. Reports Combine Reports는 다음과 같은 기능을 제공합니다: 샘플 보고서나 결합 보고서에 경우 Set order 페이지에서 순서를 정렬할 수 있습니다. Set contents 단계에서 Quality Control 섹션의 샘플 보고서를 제외할 수 있습니다. Combine Reports와 Create Sample Report에는 Map reads to Reference 보고서에서 mapping된 염기와 mapping 되지 않은 염기의 수 및 백분율을 포함하는 옵션이 있습니다. JSON exporter 기능에서 sample 및 combined report의 품질 조건에 대한 passed/uncertain/failed 상태를 확인할 수 있습니다. QC for Sequencing Reads는 average quality가 20, 25, 30, 35보다 높은 read의 백분율을 보고합니다. 보고된 값은 Create Sample Report에서 QC thresholds로 사용할 수 있습니다. Copy Number Variant Detection (Targeted)의 결과 보고서에서 genome 및 염색체 plot이 다음과 같이 개선되었습니다: axis labels(축 라벨)을 업데이트하였습니다. 색상 구성표가 개선되었습니다. CNV를 빨간색(gain), 파란색(loss)으로 표현합니다. Trim Reads 보고서에서 소수점이 포함된 값은 이제 소수점 둘째 자리까지 나타납니다. 보고서 plot에 사용되는 빨간색 음영이 다른 색상과 쉽게 구분할 수 있도록 조정되었습니다. Other new feature and improvements Annotate with Repeat and Homopolymer Information 반복 및 homopolymer detection 기능이 개선되었습니다. 이로 인해 이전 버전과 비교했을 때 결과가 차이날 수 있습니다. reference 서열은 homopolymers에 대해 variant의 5‘와 3’을 테스트합니다. 이전에는 3‘쪽에서만 테스트하였습니다. Variant의 양쪽에서 다른 homopolymers가 발견되면 가장 긴 것에 대한 정보가 유지됩니다. Variant에 대해 한쪽에서 homopolymers가 발견되고, 다른 쪽에서 repeat이 발견되면 두 정보 다 유지합니다. homopolymers와 repeat에 대한 길이, 서열 정보는 Variant track의 annotation으로 추가됩니다. 이제 옵션으로 homopolymer/repeat에서 허용되는 최대 불일치 수를 지정할 수 있습니다. QC for Targeted Sequencing long reads에 대한 mapping이 효율적으로 처리됩니다. broken pairs와 non-specific reads의 적용 범위에 대한 정보는 per-region statistics track에 포함됩니다. 평균과 중간 값 coverage가 모두 gene coverage track에 포함됩니다. QC for Sequencing Reads는 long reads에 대해 효율적으로 처리할 수 있게 되었습니다. Filter Based on Overlap에서 annotation을 유지하거나 제거하기 위한 새로운 옵션이 생겼고, 기존 옵션의 이름을 변경하여 기능을 더 잘 반영하였습니다. Filter on Custom Criteria는 이제 Sequence list에 input으로 넣을 수 있습니다. Merge Annotation Tracks을 사용하면 다양한 gene 또는 RNA 유형 등 유사한 유형의 annotation이 포함된 track을 합칠 수 있습니다. Create Consensus Sequences from Variants 여러 개의 SNV가 동일한 위치에 존재하는 경우, consensus sequence에 N 대신 관련 IUPAC 코드가 나타납니다. 이전에 모든 overlapping insertion을 추가할 수 있었지만, 이제는 가장 빈번한 것만 포함됩니다. The Motif Search tool “?”문자가 포함된 정규 표현식이 지원되어 예측 표현식이 가능해졌습니다. Motif 목록을 input으로 사용하는 경우에는 Table에 이름과 Motif column이 포함되어야 하고, 단일 서열을 분석하는 경우에는 Motif column만 포함되어 있어도 됩니다. 검색된 Motif에 대한 match 수를 보고서에서 볼 수 있습니다. Multiple sequence alignment 결과를 input으로 활용할 수 있습니다. Reads tracks Side panel을 통해 정렬되지 않은 끝부분을 강조 표시할 수 있는 옵션이 추가되었습니다. Volcano plot view of Statistical Comparison Table and tracks: down-regulated에 기본 색상은 이제 파란색이고 up-regulated에 기본 색상은 빨간색입니다. 이전에는 반대였습니다. legend의 위치를 조정할 수 있습니다. Expression track, statistical comparison track은 Side Panel의 Find palette에 있는 기능을 사용하여 검색할 수 있습니다. 이전에는 이 기능을 annotation track에서만 사용할 수 있었습니다. annotation track의 table view에서 이제는 annotation type이 포함됩니다. Heatmap elements에는 기본 값이 포함된 table view가 생겼습니다. Bug fixes Detect and Refine Fusion Genes 동일한 유전자 pair에 있어서 여러 개의 fusion 영역이 감지되었을 때 일부 fusion이 포함되지 않는 문제를 해결했습니다. input된 mRNA track에 mRNA type이 하나도 포함되어 있지 않으면 구동이 안되는 문제를 해결했습니다. QC for Targeted Sequencing gene coverage track에서 평균 커버리지가 median 커버리지로 표시되는 문제를 해결했습니다. Coverage report, per-region statistics track에서 Insertion에 대한 커버리지 오류를 해결했습니다. Coverage report에서 중복되는 대상에 대해 두 번 계산되는 오류를 해결했습니다. Trim Reads Sequence list가 동일한 순서로 제공되지 않을 때 adapter trimming이 다른 결과를 제공할 수 있는 문제를 해결했습니다. 이제는 개별적으로 수행됩니다. automatic read-through adapter trimming에 실제로 사용된 서열이 아니라, 식별된 모든 서열을 기반으로 계산된 consensus 서열을 제공했는데, 이러한 문제를 수정했습니다. Annotate with Repeat and Homopolymer Information 염색체의 특정 위치에 있어서 Variant에 주석을 달 때, 기능이 멈추는 것을 해결했습니다. Circular reference 서열에서 원점을 포함하는 homopolymer 또는 repeat 영역에 위치한 variant에 주석이 포함되지 않는 문제를 해결했습니다. Other bug fixes 정렬되지 않은 매우 긴 reads의 바깥쪽 끝이 read track에서 rendering(랜더링)되지 않는 문제를 해결했습니다. 이는 Nanopore 및 PacBio와 같은 long read 데이터를 reference에 정렬할 때, 정렬되지 않은 영역에서 발생합니다. SAM/BAM/CRAM Mapping Files과 Ultima Importer가 CRAM 파일을 import 할 때 reference synonyms(동의어)를 허용하여 실패하는 문제를 해결했습니다. 이제 더 이상 동의어를 허용하지 않습니다. SVLEN=0인 대립유전자가 있는 VCF 파일을 가져올 때 VCF가 import되지 않는 문제를 해결했습니다. 이러한 대립유전자는 이제 ‘annotation track’으로 가져오고 길이가 0으로 저장됩니다. Map Reads to Contigs은 contig 업데이트 옵션이 활성화된 경우 트랙 기반 결과물을 얻지 못합니다. GenBank 파일은 standard import에서 SOURCE 또는 ORGANISM 필드 바로 뒤에 ORIGIN 필드가 있는 파일을 읽지 못하는 문제를 해결했습니다. Create K-medoids Clustering에서 Cluster 1에 10개가 넘는 유전자가 포함되어 있는 경우 line graph legend가 표시되지 않는 문제를 해결했습니다. Windows 파일 공유에 있는 DB를 검색할 때 local BLAST 작업이 실패하는 문제를 해결했습니다. Search for Sequences at NCBI에서 OR, ‘,’ 또는 공백으로 구분되게 검색할 경우 일어나는 문제를 해결했습니다. list에서 찾을 수 없는 용어가 하나 이상 포함된 경우 결과가 반환되지 않습니다. Side panel에서 palette를 이동할 때 가끔씩 palette가 사라지는 문제를 해결했습니다. Reference data Reference Data Manager에서 확인할 수 있습니다. QIAGEN Sets tab 유전자 제외 목록 및 fusion 제외 목록 reference data가 추가되었습니다. 이러한 데이터는 Detect and Refine Fusion Genes에서 감지된 fusion을 필터링하는 데 사용할 수 있습니다. Version ensembl_v106.1_hg38_no_alt_analysis_set Version refseq_GRCh38.p14_no_alt_analysis_set MANE genes, CDS 및 mRNA Reference Data 추가 Version ensembl_mane_v1.3_hg38_no_alt_analysis_set. Version refseq_mane_v1.3_hg38_no_alt_analysis_set. Reference Data Sets hg38 (Ensembl MANE) containing Ensembl MANE Genes, CDS and mRNA elements. hg38 (RefSeq MANE) containing RefSeq MANE Genes, CDS and mRNA elements. Download Genome tab Homo sapiens – hg38_no_alt_analysis_set에 대한 gnomAD 엑솜 데이터 Tool and settings Create HeatMap for RNA-seq에서 Create Sample Level HeatMap for RNA-seq에 이름으로 변경되었습니다. Copy Number Variant Detection (CNVs)가 Copy Number Variant Detection (Targeted)로 이름이 변경되었습니다. BLAST at NCBI에서 nr/nt가 기본 값이었는데, blastn 및 blastx로 기본 값이 변경되었습니다. Create Tree에서 single alignment만 input으로 가능합니다. 여러 개의 alignment를 개별적으로 처리하는 것은 Batch box를 선택하여 사용 가능합니다. Illumina importer에서 .txt 파일은 더 이상 지원되지 않습니다. Variant tracks에서 linkage column은 항상 비어있기 때문에 삭제하였습니다. InDels and Structural Variants 보고서에서 Translocation 및 Total(Translocation) 행이 더 이상 포함되지 않습니다. Utility Tools 하위 폴더에 tool들의 순서가 재정렬되었습니다. bypass proxy settings가 CLC Server Connection에서 Workbench Preferences로 이동하였습니다. Installation CLC Genomics Workbench 25.0 이상 버전을 설치할 때, 로컬에 이미 존재하는 Workflow가 새 버전으로 복사됩니다. 새 버전을 시작하면 호환을 위해 업데이트 안내 대화 상자가 열립니다. 이 변경으로 이전 버전에서 새 버전으로 쉽고 빠르게 업그레이드를 할 수 있습니다. Third party version updates Workbench Preferences에 위치한 “Sequence Representation” 옵션이 “Sequence Label”로 이름이 변경되었습니다. CLC Genomics Workbench 25.0에 포함된 Java 버전은 21.0.4이며, Azul Open JDK 빌드의 JRE를 사용합니다. Pfam domain search에 사용되는 hmmsearch 프로그램이 3.4버전으로 업데이트되었습니다. Trim Sequences는 UniVec 데이터베이스 10.1 버전으로 업데이트되었습니다. restriction site database인 REBASE가 408 버전으로 업데이트되었습니다. Functionality retirement 다음은 Workbench 내에서 삭제되었습니다: Remove Information from Variants tool이 Remove Information from Track으로 대체되었습니다. Import Vector NTI Database Plugin Retirements Ingenuity Pathway Analysis (IPA) 플러그인의 기능은 이제 Biomedical Genomics Analysis 플러그인에서 사용할 수 있습니다. Long Read Support 플러그인의 기능은 이제 Workbench 내에서 직접 사용할 수 있습니다. Vector NTI Import 플러그인을 더 이상 지원하지 않습니다. Legacy tools 해당 도구는 Workbench Tools menu의 Legacy 폴더로 이동되었으며, 향후 버전에서는 더 이상 지원되지 않습니다. Correct Long Reads (legacy). Other legacy functionality run_on_workbench_when_server_is_available은 향후 릴리스에서 폐기됩니다. 대신 새로운 workbench_save_to_server 정책을 사용하세요.
[학술자료] CLC Genomics Workbench 활용 사례 조회 2,631 2024. 07. 04 - [학술자료] CLC Genomics Workbench 활용 사례 엽록체 유전체 분석을 통한 두 약용 식물의 식별 참고 논문 정보 제목: Development of a Chloroplast-based InDel Marker that Discriminates between Paeonia suffruticosa and P. lactiflora 저자: Mi Sun Lee, Yi Lee (교신 저자) 출판지, 연도: Korean Journal of Medicinal Crop Science, 2022 DOI: http://dx.doi.org/10.7783/KJMCS.2022.30.6.430 참고 논문 연구 개요 현대 생물학 연구에서 정확한 종 식별은 약용 식품의 품질 관리 및 보존에 필수적입니다. 충북대학교에서 진행된 연구에서 CLC Genomics Workbench를 활용하여 서로 매우 유사한 두 약용 식물, 모란과 작약을 구별할 수 있는 분자 마커를 개발하였습니다. 연구 방법 및 결과 연구팀은 CLC Genomics Workbench를 사용하여 두 식물의 엽록체 전장유전체를 비교 분석하였습니다. 이를 통해 in silico 상에서 P. suffruticosa와 P. lactiflora 사이의 여러 다형성 지역을 식별하고, 특히 InDel 마커인 PsPl-InDel-12를 개발하여 성공적으로 두 종을 구별할 수 있었습니다. 이 마커는 한국 전역에서 수집된 다양한 샘플에 적용되었으며, 각 종에서의 특이적 증폭 산물을 통해 정확한 종 구분이 가능하였습니다. [그림 1] InDel locus sequence of the PsPl-InDel-12. Comparison of the chloroplast genomic information of P. suffruticosa (MH793271) and P. lactiflora (MK860971) with CLC Genomics Workbench. 연구의 응용 이 연구 결과는 약용 식물의 정확한 식별 뿐만 아니라, 향후 유사한 형태의 식물을 구별하는 데 CLC Genomics Workbench가 얼마나 효과적인지를 보여주는 예입니다. 연구자들은 이 도구를 사용하여 생물 다양성 연구, 자원 관리, 그리고 약용 식물의 품질 보증에 필수적인 정확한 데이터를 확보할 수 있습니다.
[릴리즈] QIAGEN CLC Genomics Workbench v.24 새로운 업데이트 조회 2,424 2024. 02. 29 - CLC Genomics Workbench Latest release CLC Genomics Workbench 24.0이 출시 되었습니다. Long Read Support Plug in 24.0 New features and improvements New tool: Structural Variant Caller for Long Reads Sniffles2 v2.2 기반의 Long Reads 데이터를 위한 Structural Variant Caller 길이가 35 bp 이상인 구조적 변이를 감지할 수 있습니다. De Novo Assemble Long Reads improvements: 10,000 bp보다 짧은 contigs의 Assembly를 지원합니다. De Novo Assemble Long Reads 도구가 업데이트되어 PacBio HiFi Read 까지 활용이 가능합니다. PacBio HiFi Read 는 Correct Long Reads 도구에서는 현재까지는 사용이 불가합니다. Map Long Reads to Reference / RNA-Seq Analysis for Long Reads: Read alignment 옵션(Automatic / Manual)이 추가되었으며 Automatic을 선택한다면 input된 reads의 적합하게 값이 설정됩니다. 이 옵션은 PacBio HiFi 데이터의 Mapping 과정을 개선시킵니다. Other improvements: Long read Assembly 도구의 기반이 되는 Minimap2의 버전이 v2.26으로 업그레이드됨에 따라, Map Long Reads to Reference, Correct Long Reads 및 RNA-Seq Analysis for Long Reads에서 생성되는 Output의 사소한 부분이 개선되었습니다. Report Content 품질이 낮은 샘플에 대한 개요를 제공합니다. Trim Reads와 QC 작업에 대한 세부 내용을 포함하는 추가 섹션을 제공합니다. Homology Based Cloning 도구의 보고서를 지원하며, 레이아웃이 개선되었습니다. Configuration Contents customizing 가능합니다. Traffic light colors를 사용하여 평가 기준을 할당할 수 있습니다. Combine Reports 도구에서는 이 방법을 활용하여 샘플 품질을 빠르게 평가합니다. Create Sample Report tool에서는 Sequencing Reads, Read Mapping, Targeted Sequencing 및 RNA-seq Analysis에 의해 생성된 보고서에 대한 추가 QC 요약 항목을 지원합니다. Modify Report Type은 보고서 유형을 변경하는 도구로, 해당 보고서의 내용에 영향을 줍니다. Sample report에서 사용할 샘플 이름을 설정할 수 있습니다. Changes Create Sample Report 및 Combine Reports에서 지원되지 않는 보고서가 input 될 경우 실패할 수 있습니다. Sample report 및 Combine Reports 내에서의 이름 변경: Methylation Levels -> Call Methylation Levels Duplicated Mapped Reads -> Remove Duplicate Mapped Reads Variants -> Create Variant Track Statistics Report QC Summary -> Quality Control(Combine Report만 해당) Workflow QIAseq Panel Analysis Assistant는 QIAseq Panels 등을 통한 데이터를 분석하기 위한 workflow에 접근하고, reference 데이터 다운로드 및 workflow의 customized 복사본 생성과 같은 기능을 제공합니다. 두 개의 새로운 Control Flow element가 추가되었습니다: Branch on Sequence Count: 해당 목록의 Sequence 수에 따라 Sequence 목록의 downstream processing을 제어하는 데 사용됩니다. Branch on Sample Quality: 샘플 보고서에서 제공되는 Quality Criteria를 기반으로 어떤 데이터 요소의 downstream processing을 제어하는 데 사용됩니다. workflow build ID는 설치된 workflow를 사용하여 생성된 데이터 element에 대한 History View의 workflow details section에 포함되어 있습니다. 이전에는 workflow 이름과 버전만 표시되었습니다. element 간 연결의 source 또는 destination에서 workflow element로 이동하는 옵션이 추가되었습니다. Import and export New import and export functionality Element Bio는 Element Biosciences에서 생성된 fastq 파일을 가져옵니다. PacBio Onso는 PacBio Onso에서 생성된 fastq 파일을 가져옵니다. Singular는 Singular Genomics에서 생성된 fastq 파일을 가져옵니다. Ultima는 Ultima Genomics에서 생성된 CRAM 파일을 가져옵니다. SAM/BAM/CRAM Mapping Files에는 CRAM 가져오기 기능이 있습니다. Read Mappings는 CRAM 형식으로 내보낼 수 있습니다. Public AWS S3 buckets의 데이터에 접근할 수 있습니다. Other import and export improvements 모든 fastq 파일의 importers는 이제 UMI(Unique Molecular Identifier) 정보가 read 헤더에서 감지되면 시퀀스에 UMI를 주석으로 추가합니다. Illumina Importer는 20억 개 이상의 read를 포함하는 fastq 형식 파일을 지원하며, 이러한 파일은 여러 개의 작은 sequence 목록으로 가져옵니다. MGI/BGI Importer는 paired reads를 가져올 때 파일을 매핑하는 유연성이 높아졌으며 joining lanes를 지원합니다. SAM 및 BAM 파일은 AWS S3 bucket에서 import 할 수 있습니다. Drag-and-drop은 import tool에서 파일을 선택하는 데 사용할 수 있습니다. VCF로 heterozygous Insertion 또는 deletion을 symbolic alleles로 내보낼 때, Export VCF는 reference allele에 대한 non-symbolic VCF line을 생성하지 않습니다. CLC 형식이 아닌 파일은 Navigation area에서 "Save-To-Disk" 옵션을 이용하거나, 우클릭 메뉴에서 사용할 수 있는 "Drag-and-drop"을 통해 직접 디스크에 저장할 수 있습니다. CLC 형식이 아닌 파일이 CLC 파일 위치에 있을 때, 해당 파일은 Navigation area에서 프로그램 아이콘 또는 유사한 도구 모음에서 프로그램 아이콘으로 드래그하여 해당 프로그램에서 열 수 있습니다. Usability "Save View"는 이제 Side Panels 하단에 있는 "View Settings" 메뉴로 대체되었습니다. Navigation Area, Toolbox 탭 및 Favorites 탭의 글꼴 크기를 증가 또는 감소시킬 수 있습니다. Navigation Area에서 track element를 선택하고 해당 요소를 Track view에서 열린 호환 가능한 reference 유전체를 기반으로 Track을 끌어오면 새로운 Track List가 생성됩니다. Reference Data Manager에서 검색 기능을 사용할 수 있습니다. Table related Column order는 이제 Side Panel에서 해당 열 이름을 위 또는 아래로 이동하여 조절할 수 있습니다. 테이블 유형의 열 순서는 View Setting으로 저장하고 적용할 수 있습니다. 테이블을 필터링하는 데 사용된 세트는 Filter Sets로 저장할 수 있습니다. 내용이 없는 항목을 Excel 형식(.xlsx, .xls)으로 내보낼 때, 생성된 시트에는 Column header가 포함됩니다. BLAST NCBI의 BLAST의 데이터베이스 목록이 확장되었으며, 'Eukaroyta nt (nt_euk)', 'Prokaryota (bacteria and archaea) nt (nt_prok)', 'Viruses nt (nt_viruses)'가 추가되었습니다. BLAST 데이터베이스 위치 및 경로 설정 시, 폴더 이름에 공백 포함 가능합니다. Reference data related "Download Genomes"에서, (Homo sapiens) hg19 및 hg38의 dbSNP는 버전 151에서 156으로 업데이트 되었습니다. Under the QIAGEN Sets tab에 아래의 data가 추가되었습니다. refseq_GRCh38.p14_no_alt_analysis_set Clinvar을 위한 20231112_hg38_no_alt_analysis_set Version Gene Ontology를 위한 20231009_hg38_no_alt_analysis_set Version dbsnp_common_v151_ucsc_hg38_no_alt_analysis_set. dbsnp_common_v151_ucsc_hg19 Version Multimodal reference data set에 포함된 RNA trim 어댑터 목록이 업데이트 되었습니다. Other new features and improvements 사용자 정의 색상 및 그라데이션을 정의할 수 있습니다. 이는 그라데이션의 유형과 경계의 수, 그리고 해당 경계에서 사용할 색상을 지정할 수 있는 기능을 포함합니다. 통계 비교 테이블 및 트랙의 Volcano plot view에서는 p-값과 fold 변화에 따라 특징의 색상을 결정하여 도표를 생성하는 데 지원합니다. Extract Reads, Create Reads Track from Selection 및 Extract from Selection을 사용하여 Mapping 데이터에서 방향에 따라 reads를 추출할 수 있습니다. Extract 기준에 맞는 한 쌍의 reads 중 하나만 일치할 때 Mapping 데이터에서 끊어진 쌍으로 reads를 추출할 수 있습니다. 이는 Extract Reads 및 Create Reads Track from Selection에서 사용 가능한 옵션과 일치하도록 이 도구의 옵션을 업데이트했습니다. Filter on Custom Criteria의 wizard layout과 옵션이 개선되었습니다. Filter on Custom Criteria에서 구성된 filter criteria의 future run에서 재사용될 수 있습니다. Annotate with Nearby information은 annotation을 위해 어떤 트랙이든 사용할 수 있습니다. "Detect with novel exon boundaries" 옵션이 활성화되고 reference sequence에 수천 개의 염색체가 포함되어 있는 경우 Detect and Refine Fusion Genes에서 상당한 속도 향상이 있습니다. Variant 트랙에서 조합된 deletion 및 SNV로 구성된 replacement의 SNV가 오른쪽에 정렬되고 deletion이 왼쪽에 정렬되도록 표시됩니다. 이전에는 변이 트랙에서 이러한 replacement의 SNV가 왼쪽에 정렬되고 deletion이 오른쪽에 정렬되도록 표시되었습니다. Homology Based Cloning의 ouput명에는 각 서열의 이름이 포함됩니다. Amino Acid Changes에 의해 생성된 Amino Acid track의 아미노산 배치가 개선되었습니다. Oxford Nanopore 또는 PacBio long reads를 포함하는 Mapping 데이터가 Fixed Ploidy Variant Detection, Low Frequency Variant Detection 또는 Basic Variant Detection에 input 될 때 경고가 표시됩니다. Long reads (>10kbp)를 포함하는 Read mapping track이 더 반응적이고 빨리 로드됩니다. 대량의 염색체를 reference로 사용하는 경우 (예: 수십만 개), Convert to Tracks, Create Mapping Graph, Identify Graph Threshold Areas와 같은 tool에서 속도가 개선되었습니다. Combine Reports의 이상치 계산이 반올림에 둔감하도록 개선되었습니다. 큰 보고서의 호환성이 증가하였습니다. CLC Server에 연결된 경우, CLC Server File System Locations의 하위 폴더가 액세스 권한에 따라 Workbench Navigation area에 정렬됩니다. 외부 응용 프로그램을 사용하여 생성된 element의 history에는 사용된 외부 응용 프로그램의 버전이 포함됩니다. CLC File Locations는 Viewing Mode에서 Workbench를 실행 중일 때 제거 및 다시 re-index 할 수 있습니다. Navigation Area의 drag-drop 작업 중에 오류 대화 상자가 표시되는 드문 문제가 수정되었습니다. New policy property: 'run_on_workbench_when_server_is_available'이 추가되었습니다. 'deny'로 설정하면 CLC Genomics Workbench가 CLC Genomics Server에 연결된 상태에서 로컬에서 실행되지 않습니다. 기타 여러 개선 사항이 있습니다. Bug fixes 'Annotate with Repeat and Homopolymer Information'이 염색체 끝에서 두 번째 위치에 있는 변이를 주석으로 처리하는 데 실패하는 문제를 수정했습니다. 'Annotate with Repeat and Homopolymer Information'이 homopolymer나 repeat이 Circular Reference Sequence의 원점을 통과할 때 변이를 주석으로 처리하지 않는 문제를 수정했습니다. 'QC for Targeted Sequencing' 보고서의 "Target Region Low Coverage" 섹션에서 Coverage가 임계값과 동일하거나 임계값보다 큰 위치도 포함됩니다. 'Fixed Ploidy Variant Detection' 및 'Low Frequency Variant Detection'이 특정 상황에서 heterozygous로 할당해야 하는 변이를 실수로 homozygous으로 할당하는 문제가 수정되었습니다. "SAM 또는 BAM 매핑 파일을 가져올 때 이름에 * 및/또는 =이 포함된 reference가 건너뛰어지던 문제가 수정되었습니다. MGI/BGI Importer에서 "Create subfolders per batch unit" 옵션을 확인해도 효과가 없는 문제가 수정되었습니다. VCF export 시 PASS로 주석이 달려있지 않은 fusion track을 export 할 때 실패하는 문제가 수정되었습니다. Insertion 부분의 양 끝이 정렬되지 않은 paired reads가 Side Panel 뷰 설정에서 strand를 표시하는 옵션을 선택한 후에도 forward 및 reverse reads에 대해 서로 다른 색상으로 표시되지 않던 문제가 수정되었습니다. PDF 형식으로 내보낸 보고서의 plot의 축 scale 범위가 때때로 CLC Workbench에서 해당 plot을 보는 범위와 다른 문제가 수정되었습니다. Combined Report에서 box plot을 export PDF 할 때 보고서에 포함되지 않던 문제가 수정되었습니다. PDF 형식으로 보고서를 export 할 때 무한한 값이 plot에 포함되는 문제가 수정되었습니다. Iterate 요소를 포함하는 workflow를 시작할 때 메타데이터가 불완전하게(예: 열 이름 누락) 제공될 경우 fail 대신 분석이 멈추는 현상을 개선하였습니다. Local Search 결과를 크기별로 정렬할 때 이전에 알파벳 순으로 정렬했던 것을 숫자 순서로 정렬되도록 수정되었습니다. Download BLAST Databases에서 일부 설명이 launch wizard에서 보이지 않던 문제가 수정되었습니다. Illumina 및 MGI/BGI Importers에서 제공된 모든 리드 파일이 zip으로 압축된 경우 "paired reads" 옵션이 비활성화되던 문제가 수정되었습니다. Workflow Manager에서 여러 workflow installer 파일(.cpw)을 동시에 선택할 수 있었던 문제가 수정되었습니다. "Reference Data Manager"의 "QIAGEN Sets" 탭에서 이미 제거된 데이터가 다운로드할 수 없음에도 불구하고 목록에 표시되는 문제가 수정되었습니다. 기타 여러 버그가 수정되었습니다. Changes 아래와 같은 Tool 이름이 더 명확하게 업데이트 되었습니다: "SAM/BAM Mapping Files"는 이제 "SAM/BAM/CRAM Mapping Files"로 명칭이 변경되었습니다. "PacBio Importer"는 이제 "PacBio Long Reads"로 명칭이 변경되었습니다. "Annotate with Nearby Gene Information"는 "Annotate with Nearby Information"으로 명칭이 변경되었습니다. Toolbox에서 다음과 같은 Tool들이 이동되었습니다.: 이전에는 "Quality Control" 하위에 있던 "Create Sample Report"는 이제 "Utility Tools | Reports" 하위에 있습니다. 이전에는 "Quality Control" 하위에 있던 "Combine Reports"는 이제 "Utility Tools | Reports" 하위에 있습니다. 이전에는 "Epigenomics Analysis" 하위에 있던 "Annotate with Nearby Information"은 이제 "Utility Tools | Annotate and Filter" 하위에 있습니다. "De Novo Assembly"는 이제 PacBio 및 PacBio HIFI등 long reads 를 더 이상 지원하지 않습니다. Long read의 De Novo Assembly가 필요한 경우 "Long Read Support" 플러그인에서 제공하는 도구를 사용해야 합니다. "Map Reads to Reference"는 이제 PacBio 리드를 Mapping할 때 특화된 Mapping 알고리즘을 더 이상 사용하지 않습니다. 이 데이터 유형에 대해서는 "Long Read Support" 플러그인에서 제공하는 "Map Long Reads to Reference"를 사용하는 것을 권장합니다. SRA(Sequence Read Archive) blast 데이터베이스는 이제 NCBI에서 제공하는 BLAST에서 사용할 수 없습니다. NCBI는 더 이상 해당 데이터베이스에 대한 BLAST를 API를 통해 지원하지 않기 때문입니다. BLAST가 BLAST+ 2.14.0으로 업그레이드. BLAST+의 변경 사항은 http://www.ncbi.nlm.nih.gov/books/NBK131777.에서 확인할 수 있습니다. SRA Toolkit이 3.0.2 버전으로 업데이트 되었습니다. CLC Genomics Workbench 24.0에 번들로 제공된 Java 버전은 Azul OpenJDK 빌드의 Java 17.0.8.1을 사용합니다. Intel 및 ARM 기반 Mac 시스템을 위한 전용 설치 프로그램이 제공됩니다. Functionality retirement RNA-Seq Analysis에서 "Minimum read count fusion gene table" 및 "Create fusion gene table" 옵션이 제거되었습니다. Fusion detection을 위해 Detect and Refine Fusion Genes Tool 사용을 권장합니다. QIAGEN GeneReader importer (Legacy) tool이 삭제되었습니다. Plugin notes Long read를 분석하는 tool은 Long Read Support 플러그인에서 사용할 수 있습니다. Vector NTI import 플러그인에 의해 제공되는 도구는 이제 legacy 상태입니다.

전체 54개 중 5개 표시

1

2

3

...

11