2014년 2월 11일, CLCbio사에서는 아래와 같은 내용으로 새로운 버전을 릴리즈 하였습니다.
• CLC Genomics Workbench 7.0
• CLC Main Workbench 7.0
• CLC Genomics Server 6.0
CLC Genomics Workbench 7.0
New features and improvements
● New beta plugin available : 메모리 사용량이 크게 줄어 효율적인 read mapper 플러그인을 CLC Genomics Workbench를 통해 사용하실 수 있습니다.
● RNA-Seq on tracks : 많이 사용되고 있는 RNA-Seq Analysis tool이 새로운 differential expression analysis를 위한 statistical tools과 함께 업데이트되어 RNA-Seq을 연구하는 사람들에게 유용하게 사용될 것입니다.
- RNA-Seq Analysis의 결과값은 tracks을 기본으로 하여 tracks, expression values, fusion genes을 포함하고 있습니다. 다른 샘플의 tracks을 하나의 track list에 나타낼 수 있으며, 샘플간의 비교를 비주얼하게 확인할 수 있음
- Gene-level과 transcript-level의 expression results는 각각 다른 tracks에 결과값으로 나타나며, visualization을 위해 함께 사용이 가능
- “Relative RPKM'이라고 하는 새로운 column이 transcript-level expression track에 추가되어 gene에 대한 alternative transcripts의 relative expression을 확인하는데 사용할 수 있음
- 새로운 expressions tracks을 기본으로 하는 experiments는 read mappings, annotations과 함께 track list 브라우징 지원
- gene regions 뿐 아니라 전체 genome에 대하여 reads를 mapping하는 것이 가능함
- CLC Genomics Workbench 6.5 버전에서 포함되었던 read mapping 알고리즘이 RNA-Seq에서도 지원. 이를 통해 보다 빠르게 mapping을 진행할 수 있음. 최신의 annotation sets을 이용한 human 데이터 분석의 경우, 최소 16GB의 RAM을 필요로 하며, 24GB의 RAM을 사용할 것을 추천. 만약 문제가 발생할 경우, 플러그인을 통해 구 버전의 RNA-Seq Analysis tool을 사용할 것을 추천.
- Tracks을 사용하고 reference annotations를 조절하는데 편리하도록 wizard를 새롭게 구성
- RNA-Seq 분석에 사용했던 annotated reference sequence를 Convert to Tracks 기능을 사용하여 tracks으로 변경 가능
- Fusion genes table이 annotation track으로 변경되어 track list에서 read mappings을 브라우징 하는데 사용될 수 있음
- Expression tracks의 expression values로 variant tracks을 annotation 할 수 있음
- 새로운 RNA-Seq 튜토리얼 : http://clcbio.com/tutorials
● New statistical testbased on EdgeR:
- Differential expression의 statistical analysis를 위한 tool이 확장되어 ‘Exact Test'을 포함. 테스트는 그룹을 pair로 비교하는 곳에 적용하여 사용이 가능하며 TMM normalizationdmf 수행함.
● New functionality for phylogenetic trees
- Phylogenetic trees를 이용한 분석을 위해 강화된 뷰어기능. 뷰어를 통해 사용자는 빠르게 high-quality, publication-ready figures를 확인할 수 있음
- Trees의 크기가 큰 경우에는, 다른 줌 기능을 이용하여 확인이 가능하며 전체 tree 구조를 미니맵을 통해 확인할 수 있음. 2가지의 tree layout 지원(circular layouts, radial layouts)
- Phylogenetic trees에서 nodes와 관련된 메타데이터의 importing, editing, visualization 지원
- K-mers를 기본으로 phylogenetic trees를 reconstruct하기 위한 tool. 입력 서열의 multiple alignment를 구성하기 위한 복잡한 과정을 피할 수 있음. K-mer based reconstruction tool은 특히 whole genome phylogenetic reconstruction에 매우 유용함
- Different substitution models의 statistic evaluation을 수행하기 위한 tool은 maximum likelihood tree construction이 사용됨. 이 tool의 결과값은 phylogenetic trees를 구성할 때, 추천하는 세팅을 나타냄.
- Distance based methods를 이용하여 trees를 생성할 때, Kimura 80 substitution model을 이용할 수 있는 옵션이 추가됨
- Distance-based tree reconstruction methods는 Jukes-Cantor substitution model 또는 Kimura protein ML distance estimate를 이용하여 trees를 그릴 수 있음
- Defined start tree를 ML inference tool을 통해 지원 가능
● Complete redesign of the graphical user interface including :
- 새로운 tool bar 사용법
- 새로운 로고, 색, splash screen
- 새로운 background graphics
- 새롭게 구성된 tool bar
- 새로운 tab 디자인
- 새로운 zoom tool
- 분리할 수 있는 Side Panel editors
● New concept for Side Panels and Views:
- Support for multiple screens : 화면의 탭을 드래그 하여 다른 스크린으로 이동가능
- Side Panels의 구성과 순서를 변경하여 사용가능
- Palettes를 화면에서 제거 및 위치 변경 가능
- Navigation Area와 Toolbox 축소 가능
● Zoom tools redesign:
- Zoom tool이 재구성됨
- Zoom slider가 화면 확대 상태를 나타냄
가. Detailed zoom은 화면 확대 및 축소를 zoom slider를 드래그 하거나 커서를 움직여서 사용가능
나. Track views에서 zoom to selection button 지원
● Navigation Area에서 데이터를 복사하는 속도가 빨라지고 더 적은 메모리를 사용함.
● Tracks:
- dbSNP와 같은 큰 reference database를 사용할 때, Annotate with known variants와 Filter against Known Variants tool의 속도가 향상됨
- Table filtering of tracks : Region column에서 filtering을 할 때, "Overlap"과 "doesn't overlap" 사용이 불가능함.
- Track lists에서 variant tracks에 대한 tooltips에서 track의 variant number 정보 제공
- Identify Graph Threshold Areas tool에서 평균보다 높은 reads에서 intervals 확인이 가능함. "Identify Graph Threshold Areas" wizard의 "window-size" parameter 설정을 통해 가능.
- 이전에는 VCF 파일과 UCSC에서 variants를 importing 할 때, 작은 수의 variants가 무시되는 경향이 있었지만 이번 업그레이드를 통해 variants가 trimming 되고 올바르게 importing 됨. Download Reference Genome Data tool에서도 동일하게 적용됨
- Import를 실행할 때, 새롭게 추가된 batch mode function을 이용하여 여러 개의 파일을 하나의 track으로 한번에 import 할 수 있음. Genotype information이 없는 VCF의 파일은 지원 안됨
● Workflows :
- 동일한 reference 데이터를 multiple elements에 한번에 적용 가능
- Workflows 안에 workflow를 포함할 수 있음. Inner workflow는 단일 elements로 unfolded 됨.
- Elements를 확인하는 동안 creator를 이용하여 parameters 이름을 다시 설정할 수 있음
- Workflow를 설치하는 동안 설치된 workflow의 이름을 다시 설정할 수 있음
- Invalid/unknown elements가 포함되어 있는 workflows가 보다 명확해짐
- Workflow의 크기를 정확하게 나타내기 위해 editor 안에 rulers를 넣을 수 있는 옵션을 Sidepanel에 추가 함.
- Workflow의 Fit Width 화면 보기 설정 지원
- Sidepanel에 "Minimap" section이 추가되어 전체 workflow를 한눈에 확인 가능함.
- Sidepanel을 통해 workflow의 디자인 변경 가능
- Workflows의 parameters를 확인 할 때 향상된 validation
- 최소 2개 이상의 tools에서 입력값을 받을 경우, target element의 입력값 또는 connections의 context 메뉴를 통해 정렬 됨
- Workflow에서 결과값의 이름을 설정할 수 있음.
- Workflow의 parameters는 wizard를 통해 다양한 포맷으로 export 가능
- 이전에는 전체 element를 삭제하고 다시 추가하여야 Reference parameter를 다시 설정 할 수 있었지만 지금은 바로 변경 가능
- 설치된 workflows의 알파벳 배열 지원
- Workflow의 graphics export시 전체 화면 또는 현재 화면으로 가능.
- cpw 파일을 workflow manager로 드래그하여 설치 가능
- Editor에서 larger workflows에 대한 속도가 향상됨
- New tools that are now workflow-enabled :
가. Create Track List
나. Annotate with Flaking Sequences
다. Convert from Tracks
라. All tools in Statistical Tests
● 3D structure viewers :
- Property viewer : Side panel에 추가된 새로운 tab. 마우스포인터에서 atom에 대한 상세한 정보를 나타냄. 여러 개의 atom이 선택될 경우 거리, 각도, 이면각에 대한 정보를 제공. Project Tree에서 molecule이 선택 된 경우, molecule과 연관된 meta-data 정보를 제공.
- Issues List : Molecule structures 및 chemistry representation과 연관된 issues는 Molecule Projects의 Issue List view에 나열됨. Split-view with 3D viewer의 화면으로 확인할 때, 선택된 issue는 3D view에서 확대되어 나타남.
- General improvements to the PDB importer
- Project Tree에서 entry를 더블클릭하면 molecule 또는 atom group을 zoom-to-fit 되어 화면에 나타남.
- Atoms을 선택하면, atom context는 3D view에 나타나며, 선택된 부분에 대한 atom group을 생성할 수 있음.
● Amino acid changes:
- Longest transcript에 대한 아미노산 변화를 reporting 하는 두 개의 새로운 columns가 추가됨.
- Transcript가 안쪽에 위치하고 있으면, coding regions의 variants up-and downstream이 DNA position으로 annotation 됨. 이러한 내용이 report 되려면, amino acid changes tool이 mRNA track으로 제공되어야 함.
● Extract consensus sequence :
- Consensus sequence와 reference sequence에서 annotation 복사기능 지원
- Mapping 결과 값에서 consensus sequence를 뽑아 낼 때, conflict와 low coverage에 관한 annotations 정보에 reference position 정보도 포함
- Ambiguous consensus-symbols에 관한 "Ambiguous base" annotation이 추가됨
- Filtering을 통해 removals이 발생한 경우 “Deletion"으로 잘못 annotation 되었던 부분을 ”Removal"로 annotation 되도록 수정됨. “Deletion" annotation은 reference sequence에서 gap이 발견되지 않았음에도 불구하고 reads에 gap이 있는 경우에 표시됨.
- Input parameter에서 “Use Quality Score"를 선택하는 경우, quality score는 consensus sequence를 기준으로 계산됨
● Read mappings을 coverage, nucleotide insertions/deletions와 같은 상세한 per-base information을 포함하여 tabular file로 export 가능
● Fasta로 export할 때 Trim annotations 지원
● Secondary peak calling 기능이 향상됨 : Distinct peak shape이 나타나는 peaks와 동일한 간격에서 나타나는 peaks만을 검색. 또한, trim annotations를 고려하여 trimming이 된 영역에서는 peaks를 검색하지 않음
● Advanced table filter에 "starts with"와 "contains" 옵션이 추가됨
● Excel 2010 files로 exporting시 발생했던 한계점 해결
- 여러 개의 tables가 하나의 엑셀 파일로 exporting
- Reports가 엑셀 파일로 exporting
- Hyperlinks가 엑셀 파일에서도 유지됨
● SignalP prediction가 업데이트되어 server-, batch-, workflow에서 지원
● Folder contents view : Subfolders에 아이템의 개수 표시
● Policy settings을 통해 "Download Reference Genome" tool의 사용을 컨트롤 할 수 있음
● Assemble Sequences tool에서 입력값으로 sequence lists 지원
● REBASE restriction enzyme list가 310버전으로 업데이트 됨
● InDel and Structural Variants : 긴 alignments보다 짧은 alignment에 대한 높은 유사성을 요구함
● Quality-based and Probabilistic Variant Detection : Homopolymer filter 기능이 향상되어 longer variants가 소실되었던 문제점이 해결됨
● Background distribution이 올바르게 계산되지 않았을 경우, ChIP-Seq tool이 관련 내용을 report함
Bug fixes
● Workflows :
- Editor에서 "FitWidth" 대신 "100%" zooming이 활성화 됨
- 추가되거나 연결된 elements는 연결하고 추가된 곳 근처에 배치됨
- Workflow output 추가 후 undo 및 redo 기능 오류 수정됨
- 화면 하단에 위치한 화면확대 아이콘에서 마우스 우클릭을 통해 마우스 커서 설정 변경
- Server에서 실행하는 경우와 workbench에서 실행하는 경우의 workflow log information이 동일하게 지원됨
- Editor에서 elements를 확인할 때, "Reset to CLC Standards" 버튼이 지원되며 parameters의 default values가 다시 재설정 됨.
- 서버의 로그가 실행되어 workflow가 언제 취소 되었는지 상태를 나타냄.
- 추가 입력값을 제공하는 workflow의 elements의 경우에는 batch 기능 지원 안됨
● 데이터를 experiments에 추가할 때, 발생했던 오류를 수정
● Track visualization : 다양한 오류를 수정
● Extract consensus sequence tool의 다양한 오류를 수정
● 많은 chromosomes을 포함하는 tracks의 경우 extra dis space를 차지했던 오류를 수정
● Reads Tracks에서 quality score 정보가 없는 경우, residues에 가장 낮은 value 할당
● Detailed mapping report를 생성하라 때 발생했던 오류를 수정
● 많은 reference sequences를 input으로 했을 때, read mapping과 variant detection wizard가 제대로 작동하지 않았던 오류를 수정
● Ambiguous nucleotides가 올바르게 translation 되지 않았던 오류를 수정하여, 아미노산으로 translation 되는 부분만 protein으로 나타냄. Stop codon은 proteion sequence에서 X로 나타남.
● BLAST output table을 filtering과 sorting을 할 때, 발생한 오류를 수정.
● Restriction maps, histogram data, primer tables가 csv로 export되지 않았던 오류 수정
● Experiment를 설정할 때, 그룹별 샘플이 input으로 선택된 순으로 정렬됨
● "Find Open Reading Frame"tool을 사용할 때, input sequence가 ORF table에 올바르게 report되지 않았던 오류를 수정
● Table column headers에 나타나는 tooltip이 서로 맞지 않게 나타났던 오류를 수정
● “Perfect mapped"와 ”non-perfect mapped"의 report된 reads의 수가 일치하지 않았던 오류를 수정
● InDels and Structural Variants:
- CLC Genomics Workbench 6.5.1과 6.5.2 버전에서 나타난 deletions 오류를 수정
- Tandem duplications로 인한 insertion이 잘못 report되는 오류를 수정
- "Indels and Structural Variation"에서 입력값이 깨졌던 오류 수정
Changes
● NGS Core Tools 카테고리에 있는 Multiplexing의 두 가지 tools가 변경됨
- "Process Tagged Sequence"가 “Demultiplex Reads"로 이름이 변경되었으며, NGS Core Tools 폴더 아래에 위치하고 있음
- "Sort Sequences by Name"이 Sequencing Data Analysis 폴더 아래로 이동함
● De novo assembly legacy 플러그인 지원이 중단 됨
● Motif search : Motif search를 통해 만들어진 annotation은 "Region"이 아닌 "Motif" type으로 지정됨
● Toolbar의 "Download" 아래에 위치한 "Download Genome" tool이 “Download Reference Genome" tool로 이름이 변경됨.
● "Import" 툴바의 "Fasta" importer가 "Fasta Read Files"로 이름이 변경됨. "Fasta Read Files"는 옵션을 통해 read name까지 포함하여 import 할 수 있음.
Compatibility
● CLC Genomics Server 6.0와 동일함
● CLC Assembly Cell 4.2.1의 read mapping과 de novo assembler 부분이 동일함
> 관련 페이지 보러가기
CLC Main Workbench 7.0
New features and improvements
● New functionality for phylogenetic trees
- Phylogenetic trees를 이용한 분석을 위해 강화된 뷰어기능. 뷰어를 통해 사용자는 빠르게 high-quality, publication-ready figures를 확인할 수 있음
- Trees의 크기가 큰 경우에는, 다른 줌 기능을 이용하여 확인이 가능하며 전체 tree 구조를 미니맵을 통해 확인할 수 있음. 2가지의 tree layout 지원(circular layouts, radial layouts)
- Phylogenetic trees에서 nodes와 관련된 메타데이터의 importing, editing, visualization 지원
- K-mers를 기본으로 phylogenetic trees를 reconstruct하기 위한 tool. 입력 서열의 multiple alignment를 구성하기 위한 복잡한 과정을 피할 수 있음. K-mer based reconstruction tool은 특히 whole genome phylogenetic reconstruction에 매우 유용함
- Different substitution models의 statistic evaluation을 수행하기 위한 tool은 maximum likelihood tree construction이 사용됨. 이 tool의 결과값은 phylogenetic trees를 구성할 때, 추천하는 세팅을 나타냄.
- Distance based methods를 이용하여 trees를 생성할 때, Kimura 80 substitution model을 이용할 수 있는 옵션이 추가됨
- Distance-based tree reconstruction methods는 Jukes-Cantor substitution model 또는 Kimura protein ML distance estimate를 이용하여 trees를 그릴 수 있음
- Defined start tree를 ML inference tool을 통해 지원 가능
● Complete redesign of the graphical user interface including :
- 새로운 tool bar 사용법
- 새로운 로고, 색, splash screen
- 새로운 background graphics
- 새롭게 구성된 tool bar
- 새로운 tab 디자인.
● New concept for Side Panels and Views:
- Support for multiple screens : 화면의 탭을 드래그 하여 다른 스크린으로 이동가능
- Side Panels의 구성과 순서를 변경하여 사용가능
- Palettes를 화면에서 제거 및 위치 변경 가능
- Navigation Area와 Toolbox 축소 가능
● Zoom tools redesign:
- Zoom tool이 재구성됨
- Zoom slider가 화면 확대 상태를 나타냄
- Detailed zoom은 화면 확대 및 축소를 zoom slider를 드래그 하거나 커서를 움직여서 사용가능
- 새로운 zoom tool은 큰 sequences도 확대 속도를 빠르게 지원함
- Side Panel editors를 따로 분리할 수 있음
● Navigation Area에서 데이터를 복사하는 속도가 빨라지고 더 적은 메모리를 사용함.
● Workflows :
- 동일한 reference 데이터를 multiple elements에 한번에 적용 가능
- Workflows 안에 workflow를 포함할 수 있음. Inner workflow는 단일 elements로 unfolded 됨.
- Elements를 확인하는 동안 creator를 이용하여 parameters 이름을 다시 설정할 수 있음
- Invalid/unknown elements가 포함되어 있는 workflows가 보다 명확해짐
- Workflow의 크기를 정확하게 나타내기 위해 editor 안에 rulers를 넣을 수 있는 옵션을 Sidepanel에 추가 함.
- Workflow의 Fit Width 화면 보기 설정 지원
- Sidepanel에 "Minimap" section이 추가되어 전체 workflow를 한눈에 확인 가능함.
- Sidepanel을 통해 workflow의 디자인 변경 가능
- Workflows의 parameters를 확인 할 때 향상된 validation
- 최소 2개 이상의 tools에서 입력값을 받을 경우, target element의 입력값 또는 connections의 context 메뉴를 통해 정렬 됨
- Workflow에서 결과값의 이름을 설정할 수 있음.
- Workflow의 parameters는 wizard를 통해 다양한 포맷으로 export 가능
- 이전에는 전체 element를 삭제하고 다시 추가하여야 Reference parameter를 다시 설정 할 수 있었지만 지금은 바로 변경 가능
- 설치된 workflows의 알파벳 배열 지원
- Workflow의 graphics export시 전체 화면 또는 현재 화면으로 가능.
- cpw 파일을 workflow manager로 드래그하여 설치 가능
- Editor에서 larger workflows에 대한 속도가 향상됨
- New tools that are now workflow-enabled :
가. All tools in Statistical Tests
● 3D structure viewers :
- Property viewer : Side panel에 추가된 새로운 tab. 마우스포인터에서 atom에 대한 상세한 정보를 나타냄. 여러 개의 atom이 선택될 경우 거리, 각도, 이면각에 대한 정보를 제공. Project Tree에서 molecule이 선택 된 경우, molecule과 연관된 meta-data 정보를 제공.
- Issues List : Molecule structures 및 chemistry representation과 연관된 issues는 Molecule Projects의 Issue List view에 나열됨. Split-view with 3D viewer의 화면으로 확인할 때, 선택된 issue는 3D view에서 확대되어 나타남.
- General improvements to the PDB importer
- Project Tree에서 entry를 더블클릭하면 molecule 또는 atom group을 zoom-to-fit 되어 화면에 나타남.
- Atoms을 선택하면, atom context는 3D view에 나타나며, 선택된 부분에 대한 atom group을 생성할 수 있음.
● Extract consensus sequence가 consensus sequence와 reference sequence에서 annotation을 copy하는 것이 가능함.
● Mapping에서 consensus sequence를 뽑아낼 때, conflict 및 low coverage annotations가 reference의 position에 포함됨.
● fasta 포맷으로 export할 때, trim off 기능을 통해 trim annotation 지원
● Secondary peak calling 기능이 향상됨 : Distinct peak shape이 나타나는 peaks와 동일한 간격에서 나타나는 peaks만을 검색. 또한, trim annotations를 고려하여 trimming이 된 영역에서는 peaks를 검색하지 않음
● Advanced table filter에 "starts with"와 "contains" 옵션이 추가됨
● Excel 2010 files로 exporting시 발생했던 한계점 제거됨
- 여러 개의 tables가 하나의 엑셀 파일로 exporting
- Reports가 엑셀 파일로 exporting
- Hyperlinks가 엑셀 파일에서도 유지됨
● SignalP prediction가 업데이트되어 server-, batch-, workflow에서 지원
● Folder contents view : Subfolders에 아이템의 개수 표시
● Assemble Sequences tool에서 입력값으로 sequence lists 지원
● REBASE restriction enzyme list가 310버전으로 업데이트 됨
Bug fixes
● Workflows :
- Editor에서 "FitWidth" 대신 "100%" zooming이 활성화 됨
- 추가되거나 연결된 elements는 연결하고 추가된 곳 근처에 배치됨
- Workflow output 추가 후 undo 및 redo 기능 오류 수정됨
- 화면 하단에 위치한 화면확대 아이콘에서 마우스 우클릭을 통해 마우스 커서 설정 변경
- Server에서 실행하는 경우와 workbench에서 실행하는 경우의 workflow log information이 동일하게 지원됨
- Editor에서 elements를 확인할 때, "Reset to CLC Standards" 버튼이 지원되며 parameters의 default values가 다시 재설정 됨.
- 서버의 로그가 실행되어 workflow가 언제 취소 되었는지 상태를 나타냄.
- 추가 입력값을 제공하는 workflow의 elements의 경우에는 batch 기능 지원 안됨
● 데이터를 experiments에 추가할 때, 발생했던 오류를 수정
● Extract consensus sequence tool의 다양한 오류를 수정
● Ambiguous nucleotides 올바르게 translation 되지 않았던 오류를 수정하여, 아미노산으로 translation 되는 부분만 protein으로 나타냄. Stop codon은 proteion sequence에서 X로 나타남.
● BLAST 결과값의 filtering과 sorting에서 발생되었던 문제가 해결됨.
● Restriction maps, histogram data, primer tables를 csv 포맷으로 export 가능
● "Find Open Reading Frame" tool을 사용할 때, input sequence가 ORF table에 잘못 report 되었던 오류 수정
Changes
● Multiplexing의 두가지 tool이 변경됨
- "Process Tagged Sequence"가 “Demultiplex Reads"로 이름이 변경되었으며, NGS Core Tools 폴더 아래에 위치하고 있음
- "Sort Sequences by Name"이 Sequencing Data Analysis 폴더 아래로 이동함
● Motif search : Motif search를 통해 만들어진 annotation은 "Region"이 아닌 "Motif" type으로 지정됨
> 관련 페이지 보러가기
CLC Genomics Server 6.0
New server-specific features and improvements
● New recycle binconcept with individual recycle bins and automatic clean-up
- 각각의 사용자에게 individual recycle bin을 제공하여 데이터 삭제와 관련한 문제를 해결
- 서버 관리자를 제외하고 다른 사람은 recycle bin에 접근권한이 없음
- 서버 관리자는 모든 recycle bins을 제거할 수 있는 권한이 있음
- 서버의 모든 recycle bins은 오래된 순서대로 100개를 초과하면 자동으로 삭제됨. User interface에서 서버 관리자가 확인 가능함
- Special note for customers with database locations : 새로운 서버 버전을 실행할 때, data location을 새로운 recycle bin concept data location의 automatic upgrade를 새로운 recycle bin concept으로 수행하기 위해서 user connecting to the database가 tables과 indexes를 만들기 위해 권한이 있어야함. 권한은 제일 처음 서버를 실행할 때만 필요함.
● Gateway cloning tools 서버에서 사용가능
● Statistical analysis tools 서버에서 사용가능
● Create track list 서버에서 사용가능
● Motif search 서버에서 사용가능
● Signal Peptide prediction 서버에서 사용가능
● Node setup
- Administration interface의 job distributions 부분에서 fields를 populating하는 것이 쉬워짐
- 서버의 display name이 administration interface의 top graphics에 나타남
- Resync Job Nodes의 옵션이 help에 추가됨
● Queue management with job nodes가 단순화되고 실행하기 쉽도록 구성이 변경됨
- Workflow jobs가 서버에서 job nodes를 사용하여 특별한 방법으로 다루어 졌었음. Workflow가 실행되면, sub-process workflow의 부분이 자동으로 queue의 윗부분에 위치하게 됨.
- Queue 안에서 jobs를 위아래로 움직이기 위한 버튼이 workflow를 다루는 방법과 충돌하여 없어짐
● 폴더의 권한 설정 능력이 향상됨
● Server products에서 zip export가 가능함
Improvements shared with CLC Genomics Workbench
● Navigation Area에서 데이터를 복사하는 속도가 빨라지고 더 적은 메모리를 사용함.
● RNA-Seq on tracks : 많이 사용되고 있는 RNA-Seq Analysis tool이 새로운 differential expression analysis를 위한 statistical tools과 함께 업데이트되어 RNA-Seq을 연구하는 사람들에게 유용하게 사용될 것입니다.
- RNA-Seq Anlaysis의 결과값은 tracks을 기본으로 하여 tracks, expression values, fusion genes을 포함하고 있습니다. 다른 샘플의 tracks을 하나의 track list에 나타낼 수 있으며, 샘플간의 비교를 비주얼하게 확인할 수 있음
- Gene-level과 transcript-level의 expression results는 각각 다른 tracks에 결과값으로 나타나며, visualization을 위해 함께 사용이 가능
- “Relative RPKM'이라고 하는 새로운 column이 transcript-level expression track에 추가되어 gene에 대한 alternative transcripts의 relative expression을 확인하는데 사용할 수 있음
- 새로운 expressions tracks을 기본으로 하는 experiments는 read mappings, annotations과 함께 track list 브라우징 지원
- gene regions 뿐 아니라 전체 genome에 대하여 reads를 mapping하는 것이 가능함
- CLC Genomics Server 5.5 버전에서 포함되었던 read mapping 알고리즘이 RNA-Seq에서도 지원. 이를 통해 보다 빠르게 mapping을 진행할 수 있음. 최신의 annotation sets을 이용한 human 데이터 분석의 경우, 최소 16GB의 RAM을 필요로 하며, 24GB의 RAM을 사용할 것을 추천. 만약 문제가 발생할 경우, 플러그인을 통해 구 버전의 RNA-Seq Analysis tool을 사용할 것을 추천.
- Tracks을 사용하고 reference annotations를 조절하는데 편리하도록 parameter를 새롭게 구성
- Fusion genes table이 annotation track으로 변경됨
- Expression tracks의 expression values로 variant tracks을 annotation 할 수 있음
● New statistical testbased on EdgeR:
- Differential expression의 statistical analysis를 위한 tool이 확장되어 ‘Exact Test'을 포함. 테스트는 그룹을 pair로 비교하는 곳에 적용하여 사용이 가능하며 TMM normalizationdmf 수행함.
● New functionality for phylogenetic trees
- K-mers를 기본으로 phylogenetic trees를 reconstruct하기 위한 tool. 입력 서열의 multiple alignment를 구성하기 위한 복잡한 과정을 피할 수 있음. K-mer based reconstruction tool은 특히 whole genome phylogenetic reconstruction에 매우 유용함
- Different substitution models의 statistic evaluation을 수행하기 위한 tool은 maximum likelihood tree construction이 사용됨. 이 tool의 결과값은 phylogenetic trees를 구성할 때, 추천하는 세팅을 나타냄.
- Distance based methods를 이용하여 trees를 생성할 때, Kimura 80 substitution model을 이용할 수 있는 옵션이 추가됨
- Distance-based tree reconstruction methods는 Jukes-Cantor substitution model 또는 Kimura protein ML distance estimate를 이용하여 trees를 그릴 수 있음
- Defined start tree를 ML inference tool을 통해 지원 가능
● Tracks:
- dbSNP와 같은 큰 reference database를 사용할 때, Annotate with known variants와 Filter against Known Variants tool의 속도가 향상됨
- Table filtering of tracks : Region column에서 filtering을 할 때, "Overlap"과 "doesn't overlap" 사용이 불가능함.
- Track lists에서 variant tracks에 대한 tooltips에서 track의 variant number 정보 제공
- Identify Graph Threshold Areas tool에서 평균보다 높은 reads에서 intervals 확인이 가능함. "Identify Graph Threshold Areas" wizard의 "window-size" parameter 설정을 통해 가능.
- 이전에는 VCF 파일과 UCSC에서 variants를 importing 할 때, 작은 수의 variants가 무시되는 경향이 있었지만 이번 업그레이드를 통해 variants가 trimming 되고 올바르게 importing 됨. Download Reference Genome Data tool에서도 동일하게 적용됨
● Workflows :
- 동일한 reference 데이터를 multiple elements에 한번에 적용 가능
- Workflows 안에 workflow를 포함할 수 있음. Inner workflow는 단일 elements로 unfolded 됨.
- Elements를 확인하는 동안 creator를 이용하여 parameters 이름을 다시 설정할 수 있음
- Invalid/unknown elements가 포함되어 있는 workflows가 보다 명확해짐
- Workflow의 크기를 정확하게 나타내기 위해 editor 안에 rulers를 넣을 수 있는 옵션을 Sidepanel에 추가 함.
- Workflow의 Fit Width 화면 보기 설정 지원
- Sidepanel에 "Minimap" section이 추가되어 전체 workflow를 한눈에 확인 가능함.
- Sidepanel을 통해 workflow의 디자인 변경 가능
- Workflows의 parameters를 확인 할 때 향상된 validation
- 최소 2개 이상의 tools에서 입력값을 받을 경우, target element의 입력값 또는 connections의 context 메뉴를 통해 정렬 됨
- Workflow에서 결과값의 이름을 설정할 수 있음.
- Workflow의 parameters는 wizard를 통해 다양한 포맷으로 export 가능
- 이전에는 전체 element를 삭제하고 다시 추가하여야 Reference parameter를 다시 설정 할 수 있었지만 지금은 바로 변경 가능
- 설치된 workflows의 알파벳 배열 지원
- Workflow의 graphics export시 전체 화면 또는 현재 화면으로 가능.
- cpw 파일을 workflow manager로 드래그하여 설치 가능
- Editor에서 larger workflows에 대한 속도가 향상됨
- New tools that are now workflow-enabled :
가. Create Track List
나. Annotate with Flaking Sequences
다. Convert from Tracks
라. All tools in Statistical Tests
● Amino acid changes:
- Longest transcript에 대한 아미노산 변화를 reporting 하는 두 개의 새로운 columns가 추가됨.
- Transcript가 안쪽에 위치하고 있으면, coding regions의 variants up-and downstream이 DNA position으로 annotation 됨. 이러한 내용이 report 되려면, amino acid changes tool이 mRNA track으로 제공되어야 함.
● Extract consensus sequence가 consensus sequence와 reference sequence에서 annotation을 copy하는 것이 가능함.
● Mapping에서 consensus sequence를 뽑아낼 때, conflict 및 low coverage annotations가 reference의 position에 포함됨.
● Read mappings을 coverage, nucleotide insertions/deletions와 같은 상세한 per-base information을 포함하여 tabular file로 export 가능
● fasta 포맷으로 export 할 때, Trim annotations 기능 지원
● Secondary peak calling 기능이 향상됨 : Distinct peak shape이 나타나는 peaks와 동일한 간격에서 나타나는 peaks만을 검색. 또한, trim annotations를 고려하여 trimming이 된 영역에서는 peaks를 검색하지 않음
● Excel 2010 files로 exporting시 발생했던 한계점 제거됨
- 여러 개의 tables가 하나의 엑셀 파일로 exporting
- Reports가 엑셀 파일로 exporting
- Hyperlinks가 엑셀 파일에서도 유지됨
● SignalP prediction가 업데이트되어 server-, batch-, workflow에서 지원
● Assemble Sequences tool에서 입력값으로 sequence lists 지원
● REBASE restriction enzyme list가 310버전으로 업데이트 됨
Bug fixes
● 서버의 로그가 실행되어 workflow가 언제 취소되었지는지에 대한 정보를 제공함
1. 추가의 입력값을 제공하는 elements가 있는 workflow의 경우에는 batch 기능을 지원하지 않음
● Extract consensus sequence tool의 다양한 오류가 수정됨
● 많은 "Chromosomes"를 포함하는 tracks의 경우 extra disk space를 차지함.
● Creating detailed mapping report를 실행할 때 발생하는 오류가 수정됨
● Ambiguous nucleotides 올바르게 translation 되지 않았던 오류를 수정하여, 아미노산으로 translation 되는 부분만 protein으로 나타냄. Stop codon은 proteion sequence에서 X로 나타남.
Changes
● De novo assembly legacy 플러그인이 더 이상 지원이 되지 않음
Compatibility
● CLC Server Command Line Tools 2.1과 동일
● CLC Assembly Cell 4.2.1의 read mapping과 de novo assembler와 동일
CLC Server command line tools
CLC Genomics Server 6.0과 CLC Server Command Line Tools 2.1이 호환됨
New tools
● add_att_b_sites
● bp_reaction
● create_track_list
● empirical_analysis_dge
● gaussian_statistical_analysis
● kmer_tree_construction
● lr_reaction
● model_testing
● motif_search
● proportion_based_statistical_analysis
Tools that have added parameters
● amino_acid_changes
● --mrna-track
● consensus_sequence_extraction
● --keep-consensus-annotations
● --transfer-reference-annotations
● graph_threshold
● --window-size
Tools that have changed parameters
● import : Some importers have new names to comply with conventions
● com.clcbio.baseimplementation.importplugins.TrimLinkerLibraryImportPlugin is now trim_adapter_list
● com.clcbio.genomics.base.algo.rnaseq.smallrna.MirBaseImporter is now mir_base
● rna_seq: parameters removed
● --colorspace
● --downstream
● --exon-discovery
● --exon-discovery-min-coverage
● --exon-discovery-min-length
● --exon-discovery-min-reads
● --expression-level
● --len-fraction
● --max-distance
● --min-distance
● --min-similarity
● --mismatch
● --organism
● --strand-specific
● --upstream
● --use-annotations
● rna_seq: parameters added
● --auto-detect-paired-distances
● --color-error-cost
● --color-space
● --deletion-cost
● --genes
● --global-alignment
● --insertion-cost
● --length-fraction
● --mapping-type
● --mismatch-cost
● --mrna
● --reference-type
● --similarity-fraction
> 관련 페이지 보러가기