[릴리즈] CLCbio, CLC Genomics Workbench 8.0 release
조회 1244
2016. 12. 29 - CLC bio A/S사에서는 아래와 같은 내용으로 CLC Genomics Workbench 8.0 버전을 출시하였습니다. New features and improvement Create Track from Experiment : 이 툴은 experiment를 트랙으로 전환할 수 있습니다. Experiment에서 통계분석 결과는 experiment에 annotation 컬럼으로 추가됩니다. 트랙으로 통계 분석 결과를 가시화할 수 있는 장점이 있습니다. Link Variants to 3D Protein Structure : 3D 단백질 구조 상에서 아미노산의 변화를 가시화할 수 있는 기능이 추가되었습니다. 변이 테이블에 대한 툴을 실행한 후에, 3D 구조로 가시화됩니다. 3D 모델은 자동적으로 PDB 구조를 이용하여 만들어집니다. 이 툴은 ‘Resequencing Analysis | Functional Consequences | Link Variants to 3D Protein Structure’ 경로에 있습니다. Map Reads to Reference : 이 툴은 linear gap cost parameters와 affine gap cost parameters를 모두 지원합니다. 게다가 affine gap cost 지원은 삽입 또는 결실이 일어난 리드들에 대한 정확한 정보를 가져올 수 있습니다. RNA-Seq Analysis : 이 툴에서 사용되는 Read mapper는 위에 명시한 새로운 ‘read mapper’를 이용하도록 업그레이드되었습니다. 이러한 업그레이드된 기능은 적어도 6GB RAM에서 RNA-Seq Analysis를 실행하여 결과를 향상시킬 수 있습니다. 그러나 아직 affine gap cost parameters를 선택할 수는 없습니다. Marge Read mapping : 이 툴의 성능은 향상되었고, de novo assembly 결과에 매핑된 리드들을 합칠 때처럼 reference sequence들이 매우 많을 때 특히 유용할 것입니다. Amino Acid Changes : 아미노산 변화가 가시화할 수 있는 결과로서 트랙 형태로 확장할 수 있습니다. 아미노산 색깔은 ‘Track layout’과 ‘Amino acids track’ 의 Side Panel에서 변경할 수 있습니다. Chromosome bands/cytogenetic ideograms : 기능 다운로드를 통해 Workbench로 다운로드를 할 수 있습니다. 데이터를 효율적으로 살펴보기 위해 언어(기호)를 트랙 리스트에 추가할 수 있습니다. Tracks향상된 리소스 관리 : 더 많은 reference sequence를 포함하는 트랙으로 더 효율적인 작업을 할 수 있습니다. Reference genome이 없는 경우에 de novo assembly 결과에 기반하는 방법으로 진행됩니다.Variant 트랙과 테이블 컬럼이 추가된 annotation 트랙이 많을 경우 일관적인 결과, 이러한 툴에서 작업한 결과 트랙은 같은 수의 추가된 테이블 컬럼을 갖고 있으며, 컬럼은 항상 순서대로 배열됩니다.만약 변이 테이블에서 이전에 추가된 컬럼이 빈 값으로 되어 있다면, 마지막 테이블에서 제거할 수 있습니다. 다양한 샘플을 같은 툴과 워크플로우에서 진행했을 때, 변이 수와 추가된 컬럼의 상대명령을 가져옵니다. 모든 컬럼은 그대로이며, 테이블을 export하는 하위 기능이 강화되었습니다. 그리고 특정 샘플에 대한 결과를 만드는 것이 아니더라도 enrichment/annotation 툴을 실행하기 위한 reference를 그래픽으로 제공합니다.Variant 트랙과 annotation 트랙의 테이블은 현재 다중수를 포함하는 cells의 컬럼을 분류하고 필터할 수 있습니다.Variant 트랙을 보기 위한 향상된 트랙뷰는 제시된 변이의 sequence 변화를 보여줍니다.Variant 트랙과 annotation 트랙을 만드는 향상된 성능Graph 트랙은 위쪽으로 y=0까지 채워지는 음수 값을 보여줍니다. Workflows워크플로우 매니저에서 워크플로우를 설치할 때, 새롭게 설치된 워크플로우가 자동적으로 선택 됩니다.워크플로우 에디터의 ‘Run’ 버튼은 저장된 워크플로우에서 지원되지 않습니다.워크플로우 마법사 실행에서 ‘Reset to default’ 버튼이 활성화 되었습니다.워크플로우 에디터의 모든 아이콘은 좌측에 위치합니다.Snippets : 워크플로우 일부는 다른 워크플로우에서 재사용된 부분 또는 snippet으로 저장될 수 있습니다.설치된 워크플로우 : 설치된 워크플로우를 복사하여 생성할 수 있으며, 툴박스에서 설치된 워크플로우를 우클릭함으로써 ‘view area’에서 복사본을 열어볼 수 있습니다. ‘Open Copy of Workflow’ 옵션으로 가능합니다. MA plots, scatter plots과 histogram은 expression 트랙을 input으로 받을 수 있습니다. 추가적으로 선택하는 output은 ‘Create coverage graph’입니다. 타겟 각각의 위치에 coverage를 보여주고, ‘Create Statistics for Target Regions’툴에 추가됩니다. CSV, tab delimited text, Excel로 테이블을 export할 때, 소수점 아래 숫자가 표시됩니다. 낮은 디스크 용량으로 관련된 에러를 리포트할 수 있는 기능이 향상 되었습니다. 3D molecule viewer의 새로우 기능Align to Existing Sequence는 3D 단백질 체인을 sequence에 연결할 수 있습니다.Transfer Annotations은 sequence에 연결된 sequence annotation 분자 그룹을 생성할 수 있습니다.Property viewer의 향상된 레이아웃물 분자, DNA/RNA, 당류의 PDB import 기능 향상PDB 파일을 import하면, Molecule Project 결과는 citation 정보(PDB ID와 primary reference)를 포함하고 이러한 정보는 ‘Show History’에서 확인할 수 있습니다. Batching : 프로세스 탭과 분석 실행 로그는 batch 이름과 강화된 기준에 따른 분석 이름을 포함합니다. External Application Client Plugin 기능이 활성화 되었으며, Workbench Plugin Manager에서 직접 이용할 수 있습니다. Bug Fixes수많은 레퍼런스에 대해 맵핑되어 수많은 read mapping이 생성될 때 다량의 read들이 떨어지는 오류를 수정하였습니다. 확실한 overlapping paired read에서 숨겨진 insertion이 너무 많을 때 이것을 보여주는 read mapping에서 표시 오류를 수정했습니다. 다음 링크로 연결할 때 표에서 링크와 텍스트가 잘리는 오류가 수정되었습니다. Restriction site analysis : Restriction site 분석표의 “Cut Position”열의 값은 문자열 대신 숫자로 표현되어 정렬이나 필터링도 가능해졌습니다. Identify Graph Threshold Areas라는 도구는 threshold를 정의하기 위해서 negative 값을 사용합니다. Workflow워크플로우 수정도구에서 “Reset to default”기능은 항상 바른 이름으로 되돌아갑니다.워크플로우 수정도구에서 확인은 input 요소들의 설정이 변함에 따라 알맞게 작동됩니다.워크플로우 수정도구는 workflow의 그래픽 화면에 오류가 날 경우에도 열어서 확인할 수 있습니다.워크플로우 이동할 때 일어날 수 있는 예외적인 상황들을 수정했습니다.워크플로우 installer 내에서 같은 이름을 가지는 데이터를 여러 번 추가할 수 있습니다.이전에는 플러그인에 사용자 지정작업과 workflow가 포함되면 workflow가 설치되지 않았습니다. 이 문제를 수정했습니다.이전에는 workflow가 실행되는 동안 설정을 할 수 없었던 결과파일 이름을 잠금 해제되도록 수정했습니다.서버에 연결되면 서버로부터 설정된 데이터와 workflow를 자동으로 검사합니다(수정도구에서 열 때). 기존 workflow는 반드시 닫았다가 다시 열어야 합니다.Workflow installer를 포함한 기존의 workflow 파일은 Workbench를 다시 시작할 필요 없이 바로 내보내기 할 수 있습니다. 가끔 작동되지 않는 저장된 테이블 설정에 대한 문제가 해결되었습니다. 이 버그 수정은 다른 열들의 테이블 설정 저장에서 더 강력하거나 일반적인 방법이 포함되었습니다. 이 문제를 해결하기 위해서 기존의 저장된 테이블 설정을 불러온 다음 덮어쓰기 위해서 이전 이름으로 테이블세팅이 저장되어야 합니다. 결과를 저장할 때 보다 결과를 열기위해 일괄처리할 때 생기는 오류를 수정했습니다. 외부 응용프로그램을 사용하여 BED파일의 가져오기에 관한 문제를 수정했습니다. Alignment를 위해 POS=0인 SAM/BAM 가져오기 실행 시 맵핑되지 않은 상태에서 가져오기를 해야 에러가 나지 않습니다. 트랙리스트에서 저장되지 않은 read 트랙을 지울 때 생기는 문제를 해결했습니다. Metadata for phylogenic trees : 열 이름에 콜론(:)이 포함되어 있는 경우 metadata를 가져올 때 나타나는 버그를 수정했습니다. 3개 미만 염기 annotation의 단백질 번역을 보여줄 때 나타나는 에러를 해결했습니다. NCBI에서 PDB 구조 검색할 때 PDB에 실린 날짜와 유기체타입이 제대로 보이도록 수정했습니다. Mapping Coverage 내보내기 관련 버그를 수정했습니다. 가끔 0으로 표시되던 read 트랙 read-amount indicator (read트랙과 트랙이름 및 read갯수가 표시되어있는 박스 사이에 있는 숫자)를 수정했습니다. Small RNA 분석 -> Annotate and Merge Counts : ‘grouped on mature’ 결과물을 만들기 위해 선택할 때, ‘grouped in mature’결과물에서 small RNA는 각각 5’과 3‘의 mature 시퀀스에 의해서 짝이 지어진다. 컬럼의 이름도 ‘Mature 5’대신 ‘Mature’를 표시하도록 변경되었습니다. RNA-Seq 분석 도구에서 ‘One reference sequence per transcript’ 옵션을 설정하면 ‘Maximum number of hits for ad read’옵션이 가끔 다중선택으로 인식되지 않던 부분을 수정했습니다. F1 도움말에 대한 두 가지 문제를 해결했습니다.1) workflow tool wizard에서 F1을 누르면 하나 이상의 도움말 창이 나타났던 오류2) tool wizard에서 F1을 눌렀을 때 도움말이 나오게 변경하였습니다. GFF/GTF/GVF annotation tool을 이용하여 read 시퀀스를 annotation했을 때 나타나는 오류를 수정했습니다. Amino Acid Tool : mRNA 트랙이 CDS트랙에 아무것도 overlap되지 않으면 “Coding Region changes”은 CDS annotation이 아닌 mRNA annotation overlapping variant에 추가되지 않습니다. Variant callers and the “Amino Acid Changes” tool : CDS annotation이 아닌 mRNA annotation이 겹치는 variant일 경우 “Coding Region Change”가 mRNA annotation에 겹치는 variant에 추가되지 않았던 버그를 고쳤습니다. 가끔 레퍼런스 시퀀스로부터 트랙의 생성을 막는 오류가 수정되었습니다. Hypergeometric test on annotations : ‘1234//abc’의 형태를 가지는 annotation이 포함된 데이터셋에서 가끔 나타나던 오류가 수정되었습니다. ChIp-seq 분석단계에서 QC 리포트가 생성되는 버그를 수정했습니다. RNA-seq 분석에서 색부분리드에서 모든 exon-exon match가 필터링되는 버그를 수정했습니다. 하나의 리드에서 염기부분과 색깔부분 모두를 포함하는 XSQ파일은 같은 시퀀스 리스트로 가져오기가 부정확했습니다. 결과적으로 각 read가 두 번씩 다루는 것처럼 보입니다. Alignment editor view와 alignment primer design view는 독립적으로 설정이 가능합니다. ChangesDe novo 어셈블리의 컨티그는 자신의 이름이 아닌 공간에 밑줄이 쳐져있습니다. Plugin updates and bug fixesTRANSFAC 플러그인을 업데이트하면 "Classic"과 "Genomic" 두 가지 작동 모드가 있습니다. “Classic” 모드는 시퀀스를 input으로 사용하고 이 시퀀스에 annotation으 해주는 레거시 모드입니다. 새로운 “Genomic”모드는 유전체의 region(annotation 트랙)을 input으로 사용합니다. 이 두가지 모드에서 결과에 포함되는 annotation을 필터링하기 위해 사용되는 similarity score의 global threshold를 명시하는 것이 가능합니다. Metadata Import 플로그인에서 콜론이 포함된 컬럼이름이 포함된 metadata의 가져오기에 관련한 버그가 수정되었습니다. Compatibility이번 릴리즈는 CLC Genomics Server 7.0과 함께 사용할 수 있습니다.이번 릴리즈는 CLC Assembly Cell 4.3에서 사용하는 read mapping, de novo assembler를 사용합니다.