새로운 QIAGEN OmicSoft Lands API는 QIAGEN OmicSoft Lands의 데이터 전체에서 강력한 검색을 가능하게 합니다. 자체적으로 구축한 SQL 데이터베이스에 데이터를 수집할 필요없이 Land 데이터베이스 전체의 모든 메타데이터에서 데이터를 찾을 수 있습니다.
Figure 1. QIAGEN OmicSoft Lands API의 모식도. Python 또는 R 패키지를 통해 SQL 구문을 사용하여 QIAGEN의 선별된 Land 데이터베이스 내에서 일치하는 데이터를 찾습니다. 찾은 데이터는 다운로드 하거나 Python/R에 직접 로드할 수 있습니다.
QIAGEN OmicSoft Lands API는 여러 프로젝트에서 검색이 가능하도록 메타데이터에 사용되는 단어를 선정하고 관리하여 심도있게 선별된 데이터세트에 직접 접근할 수 있도록 합니다.
OmicSoft의 구조화된 메타데이터 및 데이터 테이블은 하나 이상의 행으로 검색하여 바이오마커 관련 질문에 대한 답변에 필요한 데이터를 정확하게 찾을 수 있습니다.
QIAGEN OmicSoft OncoLand 및 DiseaseLand 데이터세트는 샘플 수준, 비교 수준, 프로젝트 수준으로 연결시켜서 구조화 및 선별 과정을 거친 메타데이터를 가지고 있고, 이를 아래와 같은 각 샘플의 다양한 측정값들과 연결시켰습니다.
- RNA-seq 유전자 발현(gene, transcript, exon, junction, fusion and mutation)
- 마이크로어레이 발현(probe 및 gene)
- miRNA-seq
- DNA-seq mutation calls
- copy number
- 그 외 다양한 측정값
Figure 2. QIAGEN OmicSoft OncoLand 및 DiseaseLand 데이터세트 구조. 선별된 메타데이터(왼쪽)는 프로젝트 및 샘플 수준에서 샘플 그룹 간의 비교가 있는 여러 테이블 내에 표시됩니다. 선별된 각 데이터 유형(가운데)은 연결된 메타데이터, 데이터 값 또는 연결된 주석(오른쪽)에서 필터링할 수 있는 별도의 테이블로 표시됩니다.
QIAGEN OmicSoft Single Cell Land 데이터베이스 내의 단일 세포 데이터세트에는 프로젝트, 샘플, 클러스터, 세포 및 비교 수준에서 메타데이터(유전자 발현과 관련된 각 세포, 차원 감소 분석 등)가 구조화되고 선별되었습니다.
Figure 3. QIAGEN OmicSoft Single Cell Land 데이터베이스의 단일 세포 RNA-seq 데이터세트의 구조. 프로젝트, 샘플 및 비교 수준(왼쪽)에서 선별된 정보 외에도 단일 세포 데이터세트에는 메타데이터와 세포 및 세포 클러스터(오른쪽)를 설명하는 데이터가 포함됩니다.
초기 릴리즈는 아래와 같은 내용을 담고 있으며, QIAGEN OmicSoft DiseaseLand, OncoLand 및 Single Cell Land 데이터베이스 내에서 구독한 데이터세트에 대한 접근을 제공합니다.
- 650,000개 이상의 수동 선별 샘플
- 9,000개 이상의 오믹스 프로젝트에서 대표되는 1,400개 이상의 질병 및 700개 이상의 조직
- 강력한 검색 기능으로 6,000개 이상의 풍부하게 설명된 메타데이터에서 연구 전반에 관련된 샘플의 획득
- 124,000개 이상의 맞춤형 통계 모델 비교를 통해 연구에서 차등 발현 유전자 특징 확인
- Python(버전 3.7 이상) 및 R(버전 3.6.0 이상)을 지원