News
게시판 리스트
-
[릴리즈] QIAGEN OmicSoft 2022R4 새로운 업데이트 조회 792 QIAGEN OmicSoft 2022R4 Release In this release What’s new in the QIAGEN OmicSoft 2022R4 Release 이번 릴리즈에 대한 간략한 개요 수백 개의 오믹스 연구가 OncoHuman 및 DiseaseLand에 추가되었습니다. CCLE는 DepMap 2022로 업데이트 되었습니다. BeatAML, METABRIC 및 CellLine Land는 Hunam Genome 38로 만들어져 업데이트 되었습니다. 새로운 Single Cell Lands의 데이터세트와 새로운 CellType vs Others 비교가 추가되었습니다. How to get the most out of your OmicSoft subscription Request new data curation OmicSoft 팀은 향후 릴리즈를 위해 큐레이팅 할 새로운 OncoLand 및 DiseaseLand 표현 프로젝트에 대한 요청을 권유하고 있습니다. 이는 구독의 일부에 포함됩니다. 어떤 중요한 데이터세트를 큐레이팅하여 Land에 포함시키고 싶은지 알려주세요. 인간, 마우스, 랫에 대한 공개된 발현 연구(GEO, SRA 또는 Array Express)를 평가할 것입니다. 단일 세포 전사체 프로젝트, bulk RNA-seq 프로젝트 및 Affymetrix, Illumina 및 Agilent의 상용 발현 array가 호환 가능한 플랫폼입니다. 자세한 내용은 omicsoft.support@qiagen.com으로 이메일을 보내주세요. 또한 2022년 말부터 큐레이션을 위해 proteomics 데이터세트도 평가하고 있습니다. Use the latest Land database versions 최신의 가장 포괄적으로 선별된 데이터를 찾을 수 있는 최근 버전(“B38_GC33”)을 사용하는 것이 좋습니다. B38_GC33이 있는 Land로는 OncoHuman, HumanDisease, GTEx, Blueprint, CCLE, ENCODE_RNAbinding, TCGA, TARGET, TRACERx, METABRIC, CellLines and BeatAML, 그리고 최근 버전의 Single Cell Lands가 포함됩니다. OmicSoft Server 관리자에게 연락하여 최신 Land 데이터베이스를 다운로드 받을 수 있게 하세요. 이 비디오는 OmicSoft Server 관리자가 수행할 작업에 대한 간단한 설명을 제공합니다. Use flat-file downloads of Land database 만약 현재 구독권이 OmicSoft Land “text dump” flat-file 내보내기에 접근할 권한을 포함하고 있다면, 당신은 일련의 인덱싱 된 탭으로 구분된 table 형식이나 MyQDI web 인터페이스를 통해 최신 데이터를 요청할 수 있습니다. 이러한 파일은 더 큰 탐색적 메타 분석 및 ML 연구에 적합합니다. Flat file을 통해 최신 데이터에 액세스하려면 OmicSoft 계정 관리자에게 링크를 요청하세요. Attend live and on-demand webinars QIAGEN의 전문 현장 응용 과학자들은 OmicSoft Lands 데이터의 초보 및 고급 사용자를 위한 온라인 교육을 정기적으로 개최하여, 리소스를 사용하여 과학적 질문에 답하는 방법을 보여줍니다. 예정된 웨비나와 이전 웨비나의 녹화물을 여기서 확인해주세요. : https://digitalinsights.qiagen.com/webinars-and-events/ Learn more about OmicSoft’s new APIs OmicSoft Lands는 이제 새롭고 강력한 Python 및 R API로 검색이 가능합니다. 이는 SQL의 구문 기능을 활용하여 모든 데이터베이스에서 원활하게 검색하여 관심있는 데이터를 정확히 찾을 수 있는 기능입니다. 블로그 포스트를 통해 조금 더 알아보세요. [그림 1] 새로운 OmicSoft Lands API의 개략도. Python 또는 R API 클라이언트는 SQL 쿼리를 OmicSoft Lands API 쿼리 엔진에 제출하며, 이 쿼리 엔진은 Lands 컬렉션의 모든 큐레이션 된 데이터를 검색합니다. 일치하는 데이터세트는 분석을 위해 클라이언트 환경으로 빠르게 반환됩니다. OncoHuman Updates [그림 2] DiseaseCategory로 그룹핑된 OncoHuman_B38_GC33의 새로운 샘플들 이번 릴리즈에서는 95개의 데이터세트로부터 6,926개의 샘플과 432개의 비교가 추가되었습니다. 또한 이번 릴리즈에서는 Hematology_B37 Land의 67개 데이터세트로부터 3,316개의 샘플과 584개의 비교가 통합되어 현재 큐레이션 수준에 맞게 수정 및 조정되어 OncoHuman에 통합되었습니다. [그림 3] Primary colorectal cancer(원발성 대장암)과 한 쌍의 peritoneal metastases(복막 암종증) 사이에서 차등적으로 발현된 상위 109개 유전자의 RNA-seq 발현 heatmap. OncoSampleType(전이 vs 원발성 종양) 및 SubjectID로 그룹화하여 그룹 간의 일관된 차등 발현을 확인했고, 이는 하단의 색상 막대로 표시되고 있습니다. BeatAML - New data and metadata 이번 BeatAML 연구 업데이트는 Bottomly et al., 2022에 발표된 유전체 및 약물 반응 데이터와 Gosline et al., 2022에 발표된 단백체 데이터를 통합하여 AML 및 관련 암을 연구하는 사람들을 위한 데이터의 유용성을 높였습니다. CCLE — DepMap updates and updated data dictionary CCLE_B38_GC33은 28개의 새로운 세포주를 포함하여 DepMap 2022Q2의 업데이트를 포함하도록 업데이트 되었으며 새로운 메타데이터 사전을 사용할 수 있습니다: https://resources.omicsoft.com/downloads/land/CCLE/CCLE_B38_GC33_DataDictionary.xlsx 새로운 메타데이터 열은 다음 매개변수를 설명합니다: ParentID[DepMap] and SubjectID[DepMap]:부모 세포주 ID 및/또는 세포주가 파생된 Subject ID. DiseaseState[Cellosaurus] and DiseaseState[Cellosaurus][NCItCode]: Cellosaurus 저장소에 주석이 달린 각 세포주와 관련된 DiseaseState. CellDescription: 여기에는 이제 모델 조작 전략이 포함됩니다. 이번 릴리즈에 추가된 OmicSoft CV열: CellLine, CellType, AgeCategory, GeneDependency[XPR1][PMID: 35437317], PairingType, PairingStatus, AgeSummary, SampleMaterial, SampleType, Molecule CellLine Land — Integrating GSK, NCI and Pfizer cell-line profiling datasets 이번 릴리즈에는 CellLine_GSK_B37, CellLine_NCI_B37 및 CellLine_Pfizer_B37을 새로운 메타데이터 및 최신 표준과 결합하고 업데이트하는 새로운 Land인 CellLine_B38_GC33이 포함되어 있습니다. 이 데이터를 CCLE_B38_GC33의 보완 자료로 사용하여 거의 2,000개의 세포주에 대한 오믹스 및 메타데이터 정보를 탐색합니다. [그림 4] CellLine Land인 CellLine_B38_GC33에서 사용 가능한 세포주. CellLine Land는 3가지로 프로파일링 프로젝트(GSK, NCI 및 Pfizer)의 멀티오믹스 데이터를 Y축에 그룹화하고 선별된 조직학 메타데이터 열에 따라 색상을 지정하여 결합합니다. METABRIC — Breast cancer multi-omics study 유방암 분자 분류 국제 컨소시엄(METABRIC, Molecular Taxonomy of Breast Cancer International Consortium) 시험 데이터가 Human Genome 38과 Gencode.V33에서 재분석 및 재큐레이션 되었습니다. 이는 4,128개의 샘플과 큐레이팅 된 메타데이터, CNV(1,992개의 샘플) 및 microarray Expression Intensity Probes(2,136개의 샘플)을 포함합니다. [그림 5] GeneticSubtype으로 그룹화되고, OncoSample에 따라 색상이 지정된 METABRIC 샘플 분포. DiseaseLand updates [그림 6] DiseaseCategory로 그룹화된 HumanDisease, MouseDisease 및 RatDisease(대조군 제외) 에 추가된 새로운 샘플의 분포. HumanDisease 이번 HumanDisease 릴리즈에서는 75개의 데이터세트로부터 3,064개의 샘플과 541개의 비교가 추가되었습니다. MouseDisease 이번 MouseDisease 업데이트에서는 62개의 데이터세트로부터 1,499개의 샘플과 564개의 비교가 추가되었습니다. RatDisease 이 RatDisease 업데이트에서는 20개의 데이터세트로부터 492개의 샘플과 202개의 비교가 추가되었습니다. Single Cell Lands 이번 Single Cell Lands 릴리즈에서는 HumanUmi_B38_GC33과 4,294개의 비교가 포함된 77개의 새로운 프로젝트와 MouseUmi_B38_GC33과 664개의 새로운 비교가 포함된 18개의 새로운 프로젝트가 추가되었습니다. 또한, HumanUmiLite_B38_GC33 및 MouseUmiLite_B38_GC33의 모든 데이터는 이제 HumanUmi_B38_GC33 및 MouseUmi_B38_GC24 내에 있습니다. 따라서 “Lite” Lands를 안전하게 삭제할 수 있습니다. 이번 릴리즈의 새로운 큐레이션된 “세포 유형”의 비교는 컴퓨터로 식별된 클러스터 간의 비교를 보완하여 서로 다른 세포 유형 간의 차이점을 보여줍니다. 예를 들어, CellMap-차원 축소 분석에서 Schwann cell과 다른 세포 유형간의 비교를 찾을 수 있습니다. 각 비교에서는 CellMap에서 “Schwann cell”로 큐레이션된 모든 클러스터를 함께 그룹화하여 CellMap의 다른 모든 세포와 비교했습니다. 이 분석을 통해 ERBB3과 같이 Schwann cell에서 특히 상향 또는 하향 조절되는 유전자를 발견할 수 있습니다. Percentage Cells Expressing 및 Gene Expression Overlay View와 같은 다른 시각화에서는 여러 프로젝트의 증거가 이를 뒷받침한다는 것을 확인할 수 있습니다. [그림 7] Schwann cell과 다른 세포 간에 사전 계산된 비교 결과를 검색한 후, 상향 조절되는 유전자 중 상위를 Significant Genes 표로 시각화하여, ERBB3, CADM3, CD9 등의 유전자를 밝혀냈습니다. [그림 8] ClusterCellType과 ProjectName으로 세포를 그룹화 한 Percentage Expressing Cells plot에서 볼 수 있듯이, Schwann cell이 포함된 일부 데이터세트에서 ERBB3 발현을 검색하면 연구 전반에 걸쳐 일관되게 높은 발현을 확인할 수 있습니다. [그림 9] Gene Expression Overlay plot은 큐레이팅 된 Schwann Cell(하단 패널)과 함께 여러 CellMaps(상단 패널)에서 ERBB3의 상향 조절을 보여줍니다. 파란색 화살표는 큐레이팅된 Schwann cell을 나타내며, 이는 새로운 Cell Type vs Others 비교의 CellMap에서 다른 모든 세포와 비교되었습니다. Revisions to the OmicSoft curation protocol Project.StudyRevision은 새로운 메타데이터 열으로, 데이터세트의 OmicSoft 표현과 원본 데이터세트(즉, source에서 발견됨)간의 중요한 차이점을 포착합니다. 이러한 중요한 차이점에는 OS 파이프라인을 통한 데이터 재처리, 통제된 어휘 사용으로 인한 메타데이터 형식 지정 또는 큐레이션 방법 적용과 같은 표준 변환을 포함하지 않습니다. 예를 들어, 이 열은 큐레이터가 메타데이터 불일치를 명확히 하기 위해 작성자에게 연락한 후, 데이터세트에 대한 작성자의 추가 입력으로 인해 발생한 변경 사항을 포착하는 데 사용됩니다. 저자 입력을 추가하여 land화 된 메타데이터가 변경될 때 마다 Project.StudyRevision에는 “Authers Contacted” 내용이 포함되며, Project.Comments는 동일한 문자열(“Authers Contacted”)과 함께 저자로부터 받은 정보에 따라 수정된 내용에 대한 간단한 설명으로 끝납니다. CCLE_B38_GC33 2022R4에 대한 DiseaseState 큐레이션은 CCLE 용어와의 일관성을 유지하기 위해 OmicSoft ontology에 정의된 세포주 설명을 사용하는 대신 CCLE source(저장소 및 논문)을 사용합니다.
-
[릴리즈] OmicsBox v3.0 새로운 업데이트 조회 846 OmicsBox 3.0 Release Notes New Module Genetic Variation: all you need to know about our new module Genetic Variation Module은 variant calling 및 filtering을 위한 두 가지 분석 전략을 제공합니다. 예를 들어 GBS vs WGS와 같은 특정 방법론이나 ploidy level, genome coverage 및 repetitive regions의 존재 등, 다양한 목적에 맞게 분석을 수행 할 수 있는 많은 옵션이 존재합니다. 이 Module 은 또한 GWAS(Guided Genome-Wide Association Studies)를 실행하여 특정적인 특성과 관련된 genetic variation을 식별할 수 있도록 합니다. New features Genetic Variation Module Fast Variant Calling with BCFtools and FreeBayes Variant Filtering Variant Annotation with Variant Effect Predictor (VEP) Guided Genome-Wide Association Study Genome Analysis Genome Assemblies Comparison & Quality Assesment with QUAST Transcriptomics Long Read based Isoform Definition & Correction with FLAIR Functional Analysis Faster Functional Annotation with Diamond Blast KEGG Pathways Analysis available for commercial customers General Tools Barcode Demultiplexing with Cutadapt
-
[릴리즈] CLC LightSpeed Module 출시 조회 758 CLC LightSpeed Module Ultra-fast read mapping and variant calling QIAGEN CLC LightSpeed Module은 end-to-end hereditary NGS FASTQ에서 부터 VCF까지의 과정을 초고속으로 분석하는 파이프라인을 제공합니다. LightSpeed는 paired-end 150bp Sequencing protocol에 의해 생성된 raw FASTQ 파일을 가져오고 Quality Trimming, Adapter Trimming, Read Mapping, Deduplication, Local Realignment, 및 Germline Variant Calling까지의 분석을 수행합니다. LightSpeed는 34x Coverage로 Sequencing된 Human Whole Genome의 경우 25분, 50x Coverage로 Sequencing된 Human Whole Exome의 경우 2분 이내에 분석을 수행할 수 있습니다. Lightspeed는 모든 Reference Sequence를 지원하고 read Mapping 중에 region을 Masking하고 Target region에 대한 Variant calling을 수행할 수 있는 기능을 포함합니다. 해당 Module은 Illumina 장비 데이터에 최적화되어 있지만 유사한 프로토콜을 사용하는 장비에서 생성된 데이터에도 사용할 수 있습니다. QIAGEN CLC LightSpeed Module에는 LightSpeed “FASTQ to Germline Variants” Tool이 포함되어 있으며 이 Tool을 사용하는 Template workflow를 제공합니다. LightSpeed Module은 read mapping, variant track 및 QC report를 출력할 수 있으므로 데이터의 품질을 정확하게 평가할 수 있습니다. Workflow는 annotating variant, extended QC, creating copy number controls, 카copy number variant detection 및 추가적인 시각화 기능을 제공합니다. [그림 1] 빠르고 쉬운 WGS 및 WES 데이터 분석을 가능하게 하는 QIAGEN CLC LightSpeed Module이 제공하는 Workflow 및 Tool [그림 2] “FASTQ to Annotated Germline Variants” Workflow
-
[릴리즈] QIAGEN CLC Genomics Workbench Premium v.23 새로운 업데이트 조회 876 CLC GWB Premium V.23 Release Note CLC Microbial Genomics Module 23.0 New features Detect Amplicon Sequence Variants Tool은 샘플 Amplicon 데이터에 대한 Sequences Variants를 Single nucleotide resolution까지 추론합니다. Assign Taxonomies to Sequences in Abundance Table Tool은 Taxonomic index 수행을 통한 결과 Taxonomies를 Amplicon Sequence Variant Abundance Table과 같은 Abundance Table의 Sequence에 할당합니다. New workflows and reference data Detect Amplicon Sequence Variants and Assign Taxonomies - Read를 준비하고, Amplicon Sequence Data에서 Amplicon Sequence Variants를 감지하고 여기에 Taxonomies을 할당하기 위한 Workflow입니다. Standard import를 사용하여 Table 형식(.xls/.xlsx/.csv)의 Amplicon Sequence의 수를 포함하는 파일을 Abundance Table로 가져올 수 있습니다. Merge Abundance Table이 확장되어 Amplicon Sequence Variants Abundance Table을 지원합니다. [그림 1] The Identified Pathways Table 예시 이미지 Identified Pathways Table은 Excel 및 기타 표 형식으로 내보낼 수 있습니다. CLC Genome Finishing Module 23.0 improvements CLC Genomics Workbench 23 및 CLC Genomics Server 23과 호환되도록 업데이트가 되었습니다. CLC Single Cell Analysis Module 23.0 New features and improvements Immune Repertoire Import Immune Reference Segments - TCR 및 BCR Reference 데이터를 위한 새로운 Tool입니다. Single Cell V(D)J-Seq Analysis에 사용할 데이터를 가져오기 위한 것입니다. Single Cell TCR-Seq Analysis가 Single Cell V(D)J-Seq Analysis로 이름이 변경되었습니다. Immune Repertoire tools는 D 및 C segments 와 scBCR-Seq 데이터를 지원합니다. 이 변화는 아래의 것에 영향을 줍니다. Single Cell V(D)J-Seq Analysis (previously Single Cell TCR-Seq Analysis) Filter Cell Clonotypes Combine Cell Clonotypes Compare Cell Clonotypes Convert Cell Clonotypes to Cell Annotations Immune Repertoire workflows Additional improvements to Filter Cell Clonotypes New filters Clonotype을 유지하는데 필요한 Segment Types을 지정하기 위한 “Segment types to retain”. “CDR3 Sequence의 상태에 따라 필터링하기 위한 “Productive status to retain” : “Productive”, “Out of frame” 및/또는 “Premature stop codon”. 이들은 “Only productive” 필터를 대체합니다. Retained된 Cell에 필요한 Chain을 지정하기 위한 “Combined chains to retain” : 예를 들어 TCR Clonotypes의 경우 또는 TRA + TRB 또는 BCR Clonotypes 의 경우 IGH + IGH + IGK + IGL. 이는 ““Retain only paired clonotypes” 필터를 대체합니다. 이제 “Multiple Clonotypes”이 최종 필터링 단계입니다. Cell Clonotypes data elements have new and updated views Assembley된 Contig 와 Reference V, D, J 및 C segment 간의 Alignment를 포함하는 새로운 Alignment View Clonotypes의 구성과 빈도를 요약한 Sankey plot view Tables view 에 “Cell-level clonotype #” 열이 포함됩니다. Single Cell hg38 (Ensembl) and Single Cell Mouse (Ensembl) reference 데이터 세트에는 이제 D 및 C 참조 segment가 포함됩니다. 더 이상 C segments Trimming을 위한 Trim adapter list 을 포함하지 않습니다. Other improvements QC for Single Cell, Predict Cell Types and Cluster Single Cell Data Tool의 분석 속도 향상 Combine Cell Annotations 수행 시 사용되는 메모리 감소 UMI로 Annotation read 가 Single Cell RNA-Seq Analysis에 대한 Input으로 제공 Differential Expression for Single Cell, Single Cell에 대한 Differential Velocity 및 Single Cell에 대한 Differential Accessibility에 의해 생성된 통계 비교 Table 의 하위 집합은 다음과 같이 만들 수 있습니다. Filter on Custom Criteria를 사용하여 필터링합니다. Create Table from Selection 버튼을 사용하면 선택한 행에서 새 테이블이 생성됩니다. Annotate Reads with Cell 및 UMI에 의해 Demultiplexed Sequence 목록의 Table View에는 각 Sequence의 Cell barcode 및 UMI가 포함됩니다. QIAGEN Cell Ontology가 새로운 Cell 유형으로 업데이트되었으며 Ontology구조가 개선되었습니다. Single Cell Mouse (Ensembl) Reference 데이터 세트에는 234개의 Cell Type을 포함하는 새로운 Cell Type Classifier가 있습니다. 이외에 다양한 사소한 부분의 기능이 개선되었습니다.
-
[릴리즈] QIAGEN CLC Genomics Workbench v.23 새로운 업데이트 조회 1055 CLC Genomics Workbench V.23 Release Note New tools Homology Based Cloning Gibson Assembly®와 같은 homologous ends에 의존하는 Cloning 방법을 위한 Cloning 실험을 설계합니다. Create K-medoids Clustering for RNA-Seq genes/transcripts/miRNA 등의 특징 클러스터를 찾습니다. Sankey 플롯, 그래프 등 시각화된 결과를 함께 포함합니다. New tools coming from plugins Detect and Refine Fusion Genes 잠재적인 fusion을 식별한 다음 정제하여 RNA-Seq 데이터에서 fusion genes를 찾습니다. Target Region Coverage Analysis 여러 샘플의 Coverage를 분석하고 비교합니다. Create Consensus Sequences from Variants Variant Track 및 Reference Sequence에서 Consensus Sequences를 생성합니다. Annotate with GFF/GVF/GTF file GFF, GVF 또는 GTF 형식의 파일을 Sequences List에 Annotation합니다. 이 Tool는 이전에 Annotate with GFF file Plug in 으로 배포되었습니다. Other new functionality and improvements RNA-Seq analysis tools RNA-Seq Analysis Transcript Expression(TE) Table에서 유전자 명(중복 제외)이 변경되지 않습니다. 이전에는 유전자 명의 숫자를 더한 이름(예: “BRCA_1”)으로 변경되었습니다. 따라서, CLC Genomics Workbench 23버전의 TE Track을 히트 맵, PCA 플롯, 표현식 등을 생성함에 있어 이전 버전의 TE Track과 함께 사용할 수 없습니다. Input Reads가 Biomedical Genomics Analysis Plug in에 의해 UMI로 annotation 되고, Library 유형이 RNA-Seq 분석을 위한 3’ Sequencing으로 설정된 경우 보고서의 Fragment statistics section에 UMI의 수가 포함됩니다. Heat Map 샘플들은 Tree, 샘플 또는 활성 metadata layer options 이나 개별 Metadata 항목별로 정렬할 수 있습니다. Features를 재정렬 하여 왼쪽 위에서 오른쪽 아래로 대각선을 만드는 새로운 옵션입니다. Metadata 카테고리의 순서를 조정할 수 있습니다. Expression Browser 유전자를 시각화하기 위한 새로운 Plot이 포함되어 있으며, Metadata 카테고리 등은 알파벳순으로 정렬됩니다. Venn diagrams 4개 및 5개의 그룹의 분석을 지원 합니다. (이전까지는 최대 3개 그룹) PCA for RNA-Seq 두 개의 Table이 Output 되며, 첫 번째 Table에는 PCA 데이터 View가 나타나고, 두 번째 Table에는 점의 좌표로 표시 됩니다. 2D PCA Plot 의 Metadata 카테고리의 순서를 조정할 수 있습니다. miRNA analysis tools Quantify miRNA 중복된 이름을 포함하는 데이터베이스(Customize)를 가공합니다. 60bp보다 긴 시퀀스를 포함하는 데이터베이스(Customize)를 허용하지 않습니다. (SmallRNAs 와 유사한 시퀀스에 대한 Reads의 잘못된 할당을 방지할 수 있습니다.) Extract IsomiR Counts 여러 inputs를 추가할 때 Expression Tables에는 샘플 중에서 식별된 “Combined set of IsomiRs” 에 대한 항목이 포함되어 Differential Expression in Two Groups 및 Differential Expression for RNA-Seq 분석에 호환됩니다. Differential Expression for RNA-Seq and Differential Expression in Two Groups Differential Expression for RNA-Seq 및 Differential Expression in Two Groups에서 생성된 miRNA Statistical Comparison Table에 subset을 위한 새로운 옵션이 추가 되었습니다. Outliers를 낮출 수 있습니다. 이 옵션은 기본적으로 비활성화 되어있으며 적은 비율의 샘플에서 비정상적으로 높은 수준으로 발현되는 유전자에 대해 결과가 풍부해 보이는 경우에만 권장됩니다. Statistical Comparison Tracks and Tables 의 Max Group Means 열에 이제 RPKM 대신 TPM이 표시됩니다. 이 열은 Create Heat Map for RNA-Seq 및 Ingenuity Pathway Analysis 플러그인 의 경로 분석 도구와 같은 도구에서 데이터를 필터링하는 데 사용됩니다. Detect and Refine Fusion Genes 이전 Biomedical Genomics Analysis 플러그인에 배포되었던 Detect and Refine Fusion Genes의 업데이트된 버전입니다 . Fusion은 overlapping 유전자에 대해 calling 되지 않습니다. Novel exon boundary improvements: 옵션이 확장되어 Single fusion partner (“Detect with novel exon boundaries”)와 2 fusion partners (“Allow fusions with novel exon boundaries in both genes”)가 있는 융합을 탐지할 수 있습니다. “Detect exon skippings” 옵션은 새로운 Exon boundaries와의 fusions 감지를 지원합니다. 보고서에서 non-significant breakpoints를 생략하는 옵션이 추가되었습니다. Fusion에 대한 증거를 평가할 때 사용할 최소 Z-score를 지정할 수 있습니다. "Allow fusions with novel exon boundaries in both genes" 옵션이 false positive Fusion의 수를 줄이기 위해 기본적으로 false으로 설정됩니다. true로 설정하면 새로운 융합을 검색하는 데 유용합니다. Changes to the maximum number of equivalent matches to the reference allowed for a single read to be retained: Reads를 fusion chromosome으로 재 Mapping할 때 최대 수는 이제 30입니다. (이전에는 10이었습니다) unaligned ends를 검색할 때 최대 수는 변경되지 않고 10으로 유지됩니다. “Maximum number of hits for a Read” 옵션이 제거되었습니다. “Only use fusion primer Reads” 옵션이 활성화된 경우 paired end Reads가 single end Reads 으로 처리되는 문제를 수정했습니다. Insertions 및 deletions를 포함하는 Read에 대해 unaligned ends가 너무 길거나 너무 짧을 수 있는 문제를 수정했습니다. 따라서 이전 버전과 비교하여 결과에 약간의 차이가 발생할 수 있으며, 이는 결과의 false positive 와 false negatives의 감소로 인한 것으로 예상됩니다. Bisulfite mapping Map Reads to Bisulfite Reference 툴의 분석 속도가 향상 되었습니다. (데이터 특성에 따라 속도가 다를 수 있습니다) Call Methylation Level 툴의 분석 속도가 향상 되었습니다. Import of Read mappings from SAM/BAM는 이제 선택적 SAM tags XR의 methylation 정보를 Read conversion에 사용하고 XG를 reference conversion에 사용합니다. 인식되는 값은 “CT” 및 “GA”입니다. Bisulfite Mapping 데이터를(SAM/BAM ) 내보내고 다시 가져오는 경우 정보가 손실되지 않도록 합니다. SAM/BAM파일의 Export시 bisulfite conversion에 대한 세부 정보가 포함됩니다. Read conversion을 위한 SAM tags XR과 reference conversion을 위한 XG를 사용하여 지정됩니다. tags의 가능한 값은 “CT” 및 “GA”이며, 이는 다른 툴들과의 호환성 향상을 위해 제공됩니다. Workflows Branch on Coverage - 입력된 Coverage 범위 값을 기반으로 Mapping 이후 분석을 수행합니다. Import with Metadata - Raw data들에 Metadata Table을 Overlapping하는 템플릿입니다. Demultiplex Reads 요소를 포함하거나 Split Sequence List 요소를 포함하는 Workflow를 Batch 모드에서 실행할 수 있습니다. Workflow의 Demultiplex Reads elements에서 바코드를 미리 구성할 수 있습니다. Workflow Export elements는 AWS S3의 위치로 내보내도록 미리 구성할 수 있습니다. Search for Reads in SRA Technical Reads 와 biological Reads를 함께 다운로드 할 수 있습니다. 다운로드 할 Read 와 Read의 구조 및 방향을 구성할 수 있습니다. Accession query field에 여러 개의 Accessions을 입력하면 각각 별도로 검색 됩니다. Sequence목록의 최종적인 크기는 더 이상 제공되지 않지만 공간 요구 사항에 대한 추가 정보가 메뉴얼에 추가 되었습니다. Troubleshooting에 대한 정보가 매뉴얼에 추가 되었습니다. Read mappings Apple Silicon processors의 Read mapping 속도가 향상되었습니다. (Map Reads to Reference , RNA-Seq Analysis , Map Reads to Contigs 및 Map Bisulfite Reads to Reference) Stand-alone Read mappings 및 Read mapping tracks에서 deletions이 coverage 그래프와 Reads에서 강조 됩니다. Stand alone Read mappings 의 경우 “Match coloring” Side Panel에서 compactness level이 “Packed”으로 설정된 경우 Read에 적용된 색상을 표시합니다. Import and export VCF Import: Inversions (<INV>), Insertions (<INS>), Deletions (<DEL>) and Tandem duplications (<TANDEM:DUP>)의 Symbolic alleles를 지원합니다. Sequence 정보를 포함하지 않거나 100,000bp보다 긴 Symbolic alleles는 Variant tracks 대신 Annotation tracks로 가져옵니다. 동일한 vcf 레코드에 인코딩된 multiple loci가 있는 variants에 대한 처리가 개선되었습니다. VCF Export: Insertions (<INS>), Deletions (<DEL>), Tandem duplications (<TANDEM:DUP>)에 대한 Symbolic alleles를 표현합니다. deletions를 제외하고 Annotation tracks 의 Variants는 항상 Symbolic alleles로 내보내집니다. Annotation tracks의 Deletions 및 지정된 크기 이상의 Variants도 Symbolic alleles로 내보냅니다. (기본 크기는 1000 bp이며, 이는 InDels < 1000 bp가 Symbolic alleles로 표현되어야 한다는 QCI Interpret 요구 사항에 해당합니다) PacBio의 HiFi Reads를 CLC내로 가져오는 것을 지원합니다. fastq 파일로 내보낼 때 Reads 길이가 524,288bp에서 16,777,216bp로 증가했습니다. SAM/BAM Mapping Files importer: 속도가 개선되었습니다. References 의 Circular flag가 나타납니다. “GFF3 Export” 에서 헤더의 대소문자를 유지합니다. Standard Import의 사용 기록 정보가 자세히 나타납니다. (예: “CSV Table importer”, “Fasta importer” 등) Standard Import 는 AWS S3 위치의 파일을 가져오는 데 사용할 수 있습니다. 이미지를 Bitmap 기반 형식으로 내보낼 때 지원되는 최대 픽셀 수를 초과하지 않도록 화면 해상도 및 고해상도 옵션이 제한됩니다. Sequence Lists Checkboxes를 활성화 하여 Sequence Lists의 보기 내에서 Sequence를 선택할 수 있습니다. list는 표시 여부에 따라 정렬할 수 있으며 표시된 Sequence를 삭제할 수 있습니다. In the Annotation Table view, the following changes have been made to the right-click menu: 선택한 Annotation의 Sequence를 삭제할 수 있습니다. 선택한 Annotation이 있는 Sequence의 이름을 클립보드에 복사할 수 있습니다. GFF로 내보내는 옵션이 GFF3 형식으로 내보내집니다. Table view 에서 선택한 Sequence를 삭제할 수 있고 선택한 Sequence의 이름을 복사할 수 있습니다. CLC Metadata Tables Batch mode에서 분석을 시작하거나 Iterate element로 워크플로를 시작할 때 연결된 데이터가 있는 CLC Metadata Tables을 input으로 직접 사용할 수 있습니다. Workflow를 시작할 때 Batch 단위의 기반이 되는 열을 지정할 수 있습니다. 다른 CLC Metadata Table 또는 Excel, CSV 또는 TSV 파일의 콘텐츠 추가를 수행하는 새로운 옵션이 포함됩니다. CLC Metadata Table의 행을 선택하여 새로운 CLC Metadata Table을 만드는 데 사용할 수도 있습니다. 데이터를 CLC Metadata Table에 연결하면 미리보기가 표시됩니다. Other improvements UniProt에서 Sequences 검색이 업데이트되고 개선되었습니다. PubMed 항목에 대한 링크 및 더 많은 정보가 포함됩니다. Quick Search 및 Local Search 기능이 개선되었습니다. Batch mode에서 launching workflows with control flow elements (Iterate, Collect and Distribute)를 사용하여 Workflow를 시작할 때 Batch 단위의 개요가 조정되었습니다. 이름의 일부를 기반으로 요소를 포함하거나 제외하여 배치 단위의 내용을 조정할 수 있습니다. Low Frequency Variant Detection, Fixed Ploidy Variant Detection 또는 Basic Variant Detection 은 Local Realignment를 사용하여 realign된 mapping과 함께 guidance variant track과 함께 사용된 경우 partial insertions 부분이 감지 될 수 있었습니다. 이제 full insertion이 보고되려면 하나 이상의 개별적 Read 내에 있어야 합니다. QC for Targeted Sequencing 유전자당 coverage 통계를 확인할 수 있습니다. RNA-Seq 분석에서 생성된 Read Mapping 데이터 분석을 지원합니다. “Genome Reference Consortium_masking_hg38_no_alt_analysis_set”은 Reference Data Manager를 통해 reference element로 제공되며 “hg38_no_alt_analysis_set” genome sequence를 사용하는 reference sets의 일부입니다. Genome Reference Consortium 에서 정의한 영역이 포함되어 있어, 주로 U2AF1 유전자에 영향을 미치는 영역을 포함하여 잘못된 duplications를 제거하는 역할을 합니다. Map Reads to Reference Tool 과 함께 유용하게 사용할 수 있습니다. Annotate with Exon Numbers Annotation, Expression 및 Statistical Comparison Track에 Exon 번호를 추가할 수 있습니다. 하나의 transcript 또는 CDS 의 Exon으로 Annotation을 수행합니다. Custom Criteria 필터는 Statistical Comparison Track, Statistical Comparison Table, IsomiR Table 및 miRNA Seed Table을 필터링하는 데 사용할 수 있습니다. Demultiplex Reads has been updated to: 일치하는 Reads가 없는 barcodes를 보고 합니다. 기록에 barcodes 이름을 표시합니다. RNA-Seq 분석을 통해 생성된 Create Sample Reports 및 Combined Report 의 보고서(“Fragment counting statistics Table”)에 Mapping된 Read 비율이 포함됩니다. Create Sample Report 에서 설정된 threshold를 초과하는 Coverage 범위를 가진 대상 지역 위치의 백분율을 QC metric으로 사용할 수 있습니다. QC for Sequencing Reads 에서 long Read는 100,000bp까지만 처리합니다. Local Realignment는 더 이상 RNA-Seq Read mapping의 intron과 같은 coverage가 없는 영역으로 Read를 realigns 하지 않습니다. Remove Duplicate Mapped Reads 는 개선된 방법이 적용되어 paired end Read를 처리할 때 duplicate Read를 식별합니다. 따라서 약간 더 많은 Read가 중복으로 간주될 수 있습니다. Assemble Sequences to Reference은 circular reference의 원점에 걸쳐 있는 Read의 alignment를 지원합니다. Secondary Peak Calling 에는 Peak detection stringency 라는 새로운 옵션이 생겼습니다. The report from Copy Number Variant Detection (CNVs) CNV calling에 의해 영향을 받는 gene의 수를 보여주는 Table을 포함합니다. genome 및 chromosome 수준에서 새로운 coverage plot을 포함합니다. Trim Reads 보고서에는 이제 intact pairs 와 broken pair Read 수에 대한 통계가 포함됩니다. Restriction site database를 REBASE 2022-06-30으로 업데이트 했습니다. CLC Genomics Workbench용 Plug in은 Workbench가 Viewing Mode에서 실행 중일 때도 설치할 수 있습니다. 이외에 다양한 사소한 부분이 개선되었습니다. Changes Toolbox의 RNA-Seq 및 Small RNA Analysis 폴더에 있는 Tool는 자연스러운 분석 흐름에 맞추어 하위 폴더로 정렬되었습니다. “Cloning tool” 은 “Restriction Based Cloning” 으로 이름이 변경 되었습니다. read mapping tracks 및 stand-alone read mappings 에 대한 “Disconnect paired reads” 옵션이 “Show strands of paired reads” 옵션으로 대체되었습니다. AWS Connections AWS connection 설정에서 AWS region을 지정할 수 있습니다. AWS connection이 이미 정의된 이전 버전에서 업그레이드하는 경우 region은 기본적으로 us-east-1로 설정되며 변경이 가능합니다. CLC Genomics Cloud 설정에서 실행되도록 CLC Cloud Module이 설치된 CLC Workbench에서 분석을 제출하려는 경우 필요합니다.
전체 211개 중 5개 표시