나만 알고 싶은 OmicsBox



'유전체 데이터는 점차 쌓여가고···쌓여가는 데이터 처리는 해야겠고···이왕 처리하는 거 효율적으로, 내가 원하는 방향으로 처리하고 싶은데···심도 있는 분석은 또 어떻게 진행해야 하는 걸까···' 이런 의문 품어보신 적 다들 있으시죠?! 있을 겁니다! 저 또한 그랬으니까요!

제 경우에는 OmicsBox라는 솔루션이 저의 이러한 의문을 해소해주었습니다. 제가 OmicsBox를 처음 접한 건 바야흐로 대학원 시절. 그 당시에는 OmicsBox로 리뉴얼 되기 전인 Blast2GO 버전이었습니다. 저는 그 당시 De Novo Transcriptome 분석을 진행했었고, BLAST 분석 이후의 후속 분석인 Functional Analysis(GO, KEGG, InterProScan)를 Blast2GO를 이용하여 진행했었습니다.

만약 그 당시의 저에게 Blast2GO가 없었다면, 저는 아마 졸업을 못 했을 겁니다. (생각만 해도 끔찍하네요.)
서론이 길었네요 :D 자, 그럼 이렇게 저를 무사히 졸업시켜주는데 일조했던 OmicsBox(구 Blast2GO)! 과연 어떤 기능을 하는 생물정보 솔루션인지 이제부터 차근차근 알아볼까요?



나만 알고 싶은 OmicsBox

OmicsBox 기능을 알아보기 전에 OmicsBox는 무엇인지에 대해 먼저 알아보겠습니다.

OmicsBox는 새로운 genome 분석을 위한 최고의 생물정보학 플랫폼(Platform)임과 동시에 산업, 학술 및 정부 연구기관의 생물학자를 위한 사용자 친화적인 생물정보학 데스크톱 애플리케이션(Desktop application)입니다. 이러한 OmicsBox는 기능 유전체학의 선두주자로서 세계적으로 인정받고 있으며, 이는 7,000개 이상의 과학 연구 인용으로 입증되었습니다. 또한, OmicsBox는 genomics, transcriptomics, metagenomics의 NGS 데이터 분석에 최적화(de novo 파트)되어 있으며, 필요에 따라 데이터 분석에 필요한 다양한 모듈(Module)을 결합하여 사용할 수 있습니다.


[그림 1]. OmicsBox OverView

  • 아래는 OmicsBox의 주요 기능을 나열해 봤는데요,
  • 클라우드 플랫폼(Cloud platform)을 활용한 애플리케이션(Application) 고속 실행 및 견고하고 안전한 백엔드(Back-end) 제공
  • Blast 결과의 Gene Ontology mapping
  • Functional Annotation
  • InterProScan domain 검색
  • GO-Slim Reduction
  • KEGG map mapping
  • 통계 정보 차트
  • 다양한 데이터의 import와 export format 지원
  • Eukaryote, prokaryote에 알맞은 model을 이용한 유전자 부위 예측
  • 발현값을 이용한 pairwise/time course 별 분석
이뿐만 아니라 OmicsBox는 아래와 같은 강력한 장점도 가지고 있습니다.



Advantages of OmicsBox

Powerful Tables



[그림 2]. Powerful Tables
풍부한 사용자 인터페이스(Interface)를 통해 대용량 데이터세트를 쉽게 처리할 수 있고, 모든 테이블은 필터링과 정렬을 할 수 있으며, 가장 중요한 것은 다른 결과 세트와 결합할 수 있다는 것입니다. 또한, 후속 분석 단계의 하위 집합을 쉽게 생성하고 추출할 수 있습니다.

Workflows


[그림 3]. Workflows

Workflow manager를 사용하여 생물정보학적 workflow를 생성, 실행 및 저장할 수 있으며, 선택한 분석 단계를 끌어와 workflow를 생성하고 모든 파라미터(Parameter)를 한 곳에서 구성하고 검토할 수 있습니다.
  
Genome Browser


[그림 4]. Genome Browser

Genome Browser는 여러 트랙(Track)을 통해 alignment(.bam), gene annotation(.gff) 및 variant 정보(.vcf)를 결합할 수 있습니다. 그뿐만 아니라 navigation, 필터 및 검색 옵션을 사용하여 쉽고 탐색적인 방법으로 결과를 확인할 수 있습니다.

Omics Cloud Platform



클라우드 플랫폼(Cloud platform)은 대부분의 무거운 작업이 수행되는 OmicsBox에 견고하고 안전하며 자동 확장이 가능한 백엔드(Back-end)를 제공합니다. 또한, 이 시스템을 사용하면 표준 PC에서 매우 까다로운 생물정보학 애플리케이션(Application)을 고속으로 실행할 수 있습니다.
 
자 어떤가요? 전반적으로 OmicsBox에 대해 간략히 알아보았는데, 글을 읽다 보니 내 데이터를 어떻게 처리하면 좋을지 구상이 잡히셨나요? {OK} 아직 잘 안 잡히셨다고요? 괜찮습니다.:-)
이제부터 설명해 드릴 OmicsBox의 4가지 모듈을 살펴보고 나면 구상이 잘 잡히실 겁니다.
그럼 한번 살펴볼까요?



Four modules of OmicsBox


[그림 6]. Four modules of OmicsBox

Genome Analysis
  • Quality Control : 샘플의 품질 관리를 수행하기 위해, FastQC와 Trimmomatic을 사용하여 Reads를 필터링하고, low quality bases를 제거할 수 있습니다.
  • De Novo Assembly : ABySS를 기반으로 하는 assembly 기능을 통해 reference genome 또는 특정 하드웨어(Hardware) 요구 사항 없이 전체 genome sequence를 재구성할 수 있습니다.
  • Repeat Masking : 다운스트림(Down-stream) 유전자 예측을 개선하기 위해 RepeatMasker를 사용하여 진핵생물 genome의 반복적이고 복잡성이 낮은 assemble된 DNA sequence를 마스킹(Masking)할 수 있습니다.
  • Gene Finding : Genome 구조를 특성화하기 위해 원핵생물(Glimmer 사용) 및 진핵생물(Augustus 사용) 유전자 예측을 수행할 수 있으며, 진핵생물 유전자 예측은 RNA-seq 인트론 힌트를 지원합니다.
  • Genome Browser : 트랙(Track) 형태로 annotation을 시각화하여 genome sequences(.fasta), alignments(.bam), intron-exon structure(.gff) 및 variant data(.vcf)와 결합할 수 있습니다.

Transcriptomics
  • Quality Control : 샘플의 품질 관리를 수행하기 위해, FastQC와 Trimmomatic을 사용하여 Reads를 필터링하고 low quality bases를 제거할 수 있습니다.
  • De Novo Assembly : Reference genome 없이 de novo transcriptome을 생성하기 위해 Trinity 프로그램을 이용하여 짧은 Reads를 조립할 수 있습니다.
  • RNA-Seq Alignment : 초고속 유니버설(Universal) RNA-seq aligner인 STAR를 사용하여 RNA-seq 데이터를 reference genome에 alignment 할 수 있습니다.
  • Quantify Expression : HTSeq 또는 RSEM을 사용하여 reference genome의 유무와 관계없이 gene 또는 transcript 수준에서의 발현을 정량화할 수 있습니다.
  • Differential Expression Analysis : NOISeq, edgeR 또는 maSigPro와 같이 잘 알려진 다양한 통계 패키지(Package)를 사용하여 실험 조건 간 또는 시간이 지남에 따라 차등적으로 발현된 유전자를 검출할 수 있습니다. 또한, 풍부한 시각화는 결과를 해석하는 데 많은 도움이 됩니다.
  • Enrichment Analysis : 차등 발현 결과를 functional annotation과 결합함으로써, Enrichment 분석은 과잉 및 과소 표현된 생물학적 기능을 식별할 수 있도록 해줍니다.

Metagenomics
  • Quality Control : 샘플의 품질 관리를 수행하기 위해, FastQC와 Trimmomatic을 사용하여 Reads를 필터링하고 low quality bases를 제거할 수 있습니다.
  • Taxonomic Classification : Kraken에서 현재의 종(세균, 고세균, 바이러스)을 식별하고, 다단계의 Pie chart인 Krona와 샘플 간의 비교 막대 그래프로 결과를 시각화할 수 있습니다.
  • Metagenomics Assembly : 클라우드(Cloud)에서 빠르고 쉽게 대규모 데이터세트를 조립하기 위해 MetaSPAdes와 MEGAHIT 중에서 선택할 수 있습니다.
  • Gene Prediction : 가능 유전자와 단백질을 식별하고 추출하기 위해 일반 Reads에는 FragGeneScan, 조립된 데이터에는 Prodigal을 사용할 수 있습니다.
  • Functional Interpretation : EggNOG-Mapper 및 PfamScan을 사용하여 높은 처리량의 functional annotation을 얻을 수 있고, 결과를 GO graph 및 chart로 시각적으로 표현하고 비교할 수 있습니다.

Functional Analysis
  • High-Throughput Blast and InterProScan : CloudBlast 및 CloudInterProScan을 사용하여 선택한 reference 데이터세트에 대해 빠른 sequence alignment 및 domain 검색을 수행할 수 있습니다.
  • Gene Ontology Mapping : UniProt 및 Gene Ontology Consortia의 최신 데이터베이스에서 사용 가능한 functional annotation을 사용하여 잠재적인 homologous와 domain을 연결할 수 있습니다.
  • Blast2GO Annotation : Blast2GO 방법론을 사용함으로써, source annotation 품질 및 ontology 계층을 고려하여 가장 신뢰할 수 있는 기능 label을 새로운 sequence 데이터세트에 유연하게 할당할 수 있습니다.
  • Enrichment Analysis : 서로 다른 enrichment 분석 방법 (Fisher Exact Test 및 GSEA)을 사용하여 과다 및 과소 표현된 분자 기능을 식별할 수 있습니다.
  • Functional Interpretation : 다양한 시각화를 통해 annotation process를 평가할 수 있을 뿐만 아니라 실험 및 기능 분석 결과의 생물학적 해석을 도울 수 있습니다.

Genome 분석, Transciptome 분석, Metagenome 분석 받고 Functional Annotation 분석까지! NGS 분석 대부분 분야를 섭렵한 OmicsBox, 어떠신 것 같나요? 구상이 어느 정도 잡히시고 있나요? 점점 OmicsBox 매력에 빠져들고 계신가요? :))
그럼 이쯤에서 이런 질문을 던질 수도 있습니다. "Genome 분석, Transcriptome 분석, Metagenome 분석, Functional Annotation 분석까지 기능은 매우 좋은데 어떻게 이용해야 할지 잘 모르겠어요···"
걱정하지 마세요! 저희에게는 앞서 언급되었던 장점 중 하나인 workflows가 있습니다!



OmicsBox Workflows

Genome Analysis Workflows
  • Eukaryotic Genome Analysis Workflow
  • Prokaryotic Genome Analysis Workflow
  • Long Reads Eukaryotic Genome Analysis Workflow
  • Long Reads Prokaryotic Genome Analysis Workflow

[그림 7]. Eukaryotic Genome Analysis Workflow
 

Transcriptomics Workflows
  • De Novo Transcriptome Characterization Workflow
  • Transcript-level Analysis Workflow
  • Gene-level Analysis Workflow



[그림 8]. De Novo Transcriptome Characterizatioin Workflow
 

Metagenomics Workflows
  • Taxonomic Classification Workflow
  • Functional Annotationi Workflow



[그림 9]. Taxonomic Classification Workflow
 

Metagenomics Workflows


[그림 10]. Functional Analysis Workflow
 
Raw data만 넣어주고, 각 단계의 파라미터(Parameter)만 잡아주면~ 자동으로 output까지 산출되는 workflow! 참으로 간단하죠? {OK}
OmicsBox workflow만 있으면 어렵던 유전체 데이터 분석이 앞으로는 재미있게 느껴질 수 있습니다.



마치며
이번 포스팅(Posting)에서는 OMICS 데이터 분석을 용이하게 해주는 생물정보학 솔루션 OmicsBox에 대해 알아보았는데요. Genome 분석부터 Functional Annotation 분석까지 많은 기능이 있는 아주 매력적인 솔루션이라고 생각이 됩니다. 더군다나 어떤 기능을 어떻게 사용해야 하는지 잘 모르더라도 강력한 기능인 workflow가 있어서 손쉽게 output을 얻을 수도 있구요. 만약 NGS 데이터 분석이 아직 어렵고 낯설게 느껴지는 분들이 계신다면 이번 포스팅의 주인공인 OmicsBox를 강력! 추천해 드립니다. 후회하지 않으실 거에요 :D
 
만약 OmicsBox와 친해지고 싶으시다면 consulting@insilicogen.com으로 메일 주세요.
친절히 안내 드리도록 하겠습니다.
마지막으로 긴 글 읽어주셔서 감사드리며, 모두 건강한 나날 보내시길 바랍니다.
감사합니다.
 
OmicsBox : BIOINFORMATICS MADE EASY


Posted by 人Co

2021/04/30 17:17 2021/04/30 17:17
, , , , , ,
Response
No Trackback , No Comment
RSS :
https://www.insilicogen.com/blog/rss/response/380



바이오-인공지능 기술을 실용적 소프트웨어로!


㈜인실리코젠은 첨단 바이오기술을 in-silico 상에서 구체화하고 가치를 만들어내는 선도기업입니다. 최근의 인공지능, 빅데이터 기술과 결합하여 의료계와 농림식품수산업계 등 바이오 산업 전반에 무한한 가능성을 제공하고 있습니다. 생명과학의 최신지식과 기술, 데이터를 의미기반 모델링하고, 예측 모델을 만들고, 성능을 개선하고, 사용자 인터페이스를 만드는 전체 과정에서 소프트웨어 기술의 중요성은 아무리 강조해도 지나치지 않습니다.
당사는 파이썬, R 언어로 데이터 분석, AI 모델을 구축하며, 파이썬 백엔드(django) API와 반응형 웹, Flutter, Android를 이용한 모바일 앱 개발을 주력으로 하며, 사내 Gitlab 프로젝트 관리하에 지속적 통합(CI)과 동료 간 코드리뷰를 기본 개발환경으로 활용합니다.   

귀하의 SW 개발 능력을 바이오-인공지능 분야에 발휘하고 싶은 분들과 함께하고 싶습니다.


[채용분야]

파이썬(Python) 프로그래머
- 지역 및 인원 : 본사(용인) 0명(신입, 경력)
- 담당업무 : Django 백엔드 서버 개발

Jupyter, pandas 데이터 분석, AI 모델 개발
- 자격요건 : 파이썬을 이용한 데이터 분석/웹 개발 경험

HTML / CSS / JavaScript 기본 활용 가능
- 우대사항 : 오픈소스 개발 경험 (Github 계정 공유)

반응형 웹 프론트엔드 개발 경험

모바일 앱 프로그래머
- 지역 및 인원 : 본사(용인) 0명(신입, 경력)
- 담당업무 : 모바일 앱 개발

Android, iOS 개발
Flutter 개발
- 자격요건 : 모바일 앱 개발 경험(Flutter 우대)
애플 앱스토어, 구글 플레이에 모바일 앱 등록 경험
- 우대사항 : 오픈소스 개발 경험(Github 계정 공유)


웹 퍼블리셔 / UI 개발자 / Front End Developer
- 지역 및 인원 : 본사(용인) 0명(신입, 경력)
- 담당업무 : 웹퍼블리싱

UI 개발
- 자격요건 : HTML5/CSS3 기본 지식

웹표준, 웹접근성을 고려한 마크업
반응형 웹, 크로스브라우징 이슈 개선 가능
(경력) 관련 업무 2년 이상- 우대사항 : Bootstrap 활용 및 Git사용

CSS 전처리기(SCSS) 사용
번들러 사용 경험
디자인 & 협업도구(XD, 포토샵, slack 등) 기본 활용
JavaScript를 활용한 동적구현 가능
Django 프로젝트 경험
인근거주자


[전형절차]

1. 서류전형 : 2021.04.28(수) ~ 2021.05.14(금)
     - 입사지원서(당사양식)
     - 포트폴리오 제출(자유 형식, URL포함)
     - 서류전형 합격자에게만 1차 면접 요청(이메일 통지)

2. 1차 실무자 면접 : 2021.05.10(월) ~ 2021.05.18(화)

     - 제출한 포트폴리오로 5분간 자기소개 PT 진행
     - 1차 면접 합격자에게만 2차 면접 요청(이메일 통지)

3. 2차 임원 면접  : 2021.05.17(월) ~ 2021.05.21(금)
     - 2차 면접 합격자에게만 3차 추가서류 제출 요청(이메일 통지)

4. 추가서류 제출  : 2021.05.20(목) ~ 2021.05.27(목)
     - 하단 제출서류 참고


5. 최종합격 통보 : 2021.05.28(금) 예정
     - 입사예정일 : 2021.06.27(월)


[채용형태]
신입(인턴 3개월 계약 포함), 경력(경력에 따라 수습계약 포함)


[근무환경]
- 근무제 : 주 5일 근무
- 복리후생 : 4대 보험, 퇴직연금 및 성과급, 유연근무제 (장기근속자)
- 휴가제 : 연차, 경조휴가, 충전휴가(장기근속자)
- 지원 : 경조사비, 주차비, 교육훈련비, 도서 등 지원


[접수방법]
서류제출방법 : E-mail 첨부 제출 (ms@insilicogen.com)


[제출서류]
1) 서류전형 시
 ① 자사 입사지원서 : 파일명 `입사지원서_성명_지원분야.docx`로 저장
 ② 개인정보 이용 동의서 포함

2) 1차 면접전형 시(서류전형 합격자에게만 1차 면접 요청_이메일 통지)
 공통 : 포트폴리오(PDF) 제출 및 발표(자기소개 및 경력 위주 내용, 5분 이내)

3) 3차 서류 제출(2차 면접 합격자에게만 3차 추가서류 제출 요청_이메일 통지)
 ① 공통 : 건강검진확인서 및 병력확인서 제출
 ② 경력지원 시
  - 전 근무지의 근로자 원천징수 영수증(퇴사연도, 직전연도)
  - 고용보험이력확인서 : 고용보험 사이트에서 발급 가능

Posted by 人Co

2021/04/27 15:28 2021/04/27 15:28
Response
No Trackback , No Comment
RSS :
https://www.insilicogen.com/blog/rss/response/379

메타버스에서-NFT(non-fungible-token)-가-만드는-마켓플레이스_20210413.gif

최근에 메타버스(Metaverse) 관련 기사, 디지털 화폐(digital currency) 관련 용어가 구글 트렌드(Google Trends)에서 급격하게 많아졌습니다.
블록체인(Blockchain) 기술의 발전으로 스마트 컨트렉트(Smart contract), Defi(Decentralized finance), 메타버스, NFT(non-fungible token)와 같은 용어들이 자주 언급되면서 간단하게나마 그 중의 가장 최근 붐(Boom)을 일으킨 메타버스와 NFT에 대해서 소개하겠습니다.





새로운 입학식이 생겼습니다. 바로 가상입학식입니다. 신종 코로나바이러스 감염증(COVID-19) 장기화로 각종 행사가 비대면으로 전환된 가운데 순천향대학교는 대면 입학식 대신 가상 입학식을 진행하였습니다. VR(Virtual Reality) 플랫폼(platform)을 통해 본교와 흡사한 맵으로 구현된 가상 공간에서 신입생들의 아바타(Avatar)가 참여하였습니다. 이렇게 현실이 아닌 가상 공간을 '메타버스'라고 말합니다. 메타버스란 초월(meta)과 우주(universe)에 합성어로 우주를 넘어서는 세계 즉, 3차원 가상 세계를 의미합니다.


[그림 1] 메타버스로 구현된 순천향대 대운동장에서 열리는 2021년 신입생 입학식 전경>

 
입학식을 넘어서 가상화폐 기술의 발전으로 이제는 가상세계의 부동산, 미술품, 게임 아이템 등을 매매하는 일이 현실이 되었습니다. 예를 들어 메타버스 게임 '디센트럴랜드(Decentraland)'는 가상세계의 부동산을 매매할 수 있는 웹 VR 방식의 3차원 게임으로 블록체인 기술의 가상화폐를 접목함으로써 현실 세계 부동산 거래와 흡사한 방식의 트렌드(Trends)를 볼 수 있습니다. 도심지의 부동산값은 비싸며 외곽으로 나가면 저렴합니다. 실제로 가상 부동산 1㎢ 정도의 땅이 한화로 6,500만 원 정도에 거래된 사례도 있습니다. 이 전에 온라인상의 거래는 서로 간의 채팅을 통해 현금거래로 이루어져 사기 및 해킹(Hacking) 등 안전성 문제로 거래하기 쉽지 않았지만, 블록체인 기술로 서로 간 가상화폐로 거래가 이루어지면서 이러한 문제를 해결하고 사용자들 사이 거래에 대한 신뢰가 높아지게 되었습니다.
 

[그림 2] 디센트럴랜드에서 판매되는 부동산 및 아이템. MANA 라는 토큰(token)으로 구매 가능
- 1 MANA 는 2021년 4월 7일 기준 약 1,100원

 
그러면 위의 디센트럴랜드에서 부동산이 내 소유임을 어떻게 확인할 수 있을까? 디센트럴랜드에서 땅은 NFT로 저장됩니다. NFT 는 'non-fungible token'의 약자로 대체 불가능한 토큰을 의미합니다. 일반적인 블록체인 기반 토큰(비트코인, 폴카닷 등)은 발행량이 정해져 있고 각각이 똑같은 가치를 가진다고(예로 1 비트코인의 가치는 누가 가지고 있든 똑같다) 하면 NFT는 발행량이 하나이고 그 하나의 원하는 txt, audio, video 파일 등을 저장하고 거기에 소유권(private key의 권한)을 가지게 되면 그 nft를 소유하게 되는 것입니다. 쉽게 말하면, 똑같은 만 원짜리 지폐라 할지라도 한국의 유명한 K-pop 가수 BTS의 사인이 들어간 지폐와 그렇지 않은 지폐는 가격이 다를 수 있습니다. 즉, 사인한 지폐는 비로소 대체 불가능한 것(non-fungible)이 되는 것입니다. 따라서 가상 부동산 데이터를 NFT에 저장하여 그 소유권을 가짐으로써 다른 어떤 누구도 그 데이터를 복제하거나 가져갈 수 없도록 하는 것입니다.
 
[그림 3] NFT의 대한 관심도 보여주는 구글 트렌드

 
이처럼 NFT 붐이 일어나면서 새로운 직종이 생겼습니다. 바로 디지털 아티스트(Digital artistist)입니다. 그들은 자신의 작품을 NFT화 하여 판매를 하고 있습니다. 비플(Beeple)이라는 예명으로 알려진 디지털 아티스트 마이크 윙켈만(Mike Winkelmann) 의 NFT 작품 '매일: 첫 5000일' (EVERYDAY: THE FIRST 5000 DAYS)의 경매 낙찰가는 6,934만 달러 (약 790억 원)였습니다. NFT 시장이 커지면서 디지털 아티스트들은 계속 늘어나고 있습니다. 이러한 NFT 광풍에 대해 비플은 CNBC 인터뷰에서 “인터넷이 처음 등장했을 때도 큰 호응을 받으면서 버블이 생겼고 붕괴된 바 있다”면서 “지금 NFT 버블이 있는 것도 사실이지만 NFT 기술은 피할 수 없을 것”이라고 말했습니다.
 

[그림 4] 디지털 아티스트 비플(Beeple)의 EVERYDAYS: THE FIRST 5000 DAYS , 뉴욕 크리스티 경매(Christie's)에서 3월 11일 약 780억 달러에 낙찰된 디지털 아트



 
이게 어떻게 가치 있는 자산이 될까 여전히 의문을 가질 수 있겠지만, 누군가의 작품을 산다는 건 그 작품뿐만 아니라 그 사람의 명성 및 역사를 같이 살 수 있기 때문입니다. 세계에는 수많은 (거의 똑같은) 레오나르도 다빈치(Leonardo da Vinci)의 모나리자(Mona Lisa) 작품이 있지만, 그의 작품만이 그 가치가 높은 이유입니다. 특정 개인은 그 모나리자 작품이 가치가 없다고 생각할 수 있지만, 시장에서 단 한 명만이라도 그 가치를 높게 본다면 가격은 거기에 맞춰지게 됩니다. 심지어 다빈치는 이제 세상의 존재하지 않기 때문에 가치는 더 상승하게 됩니다.



 
트위터 공동 개발자이자 CEO인 잭 도시(Jack Dorsey)는 “just setting up my twttr”이라는 자신의 첫 트윗을 NFT 로 만들어 경매에 올린 결과 290만 달러 (약 32억 원) 가격이 형성되었습니다. 심지어 AI 로봇으로 유명한 소피아(Sophia)도 NFT 제작 열풍에 합류했습니다. 기회는 모두에게 열려있습니다. 자신의 이더리움(ETH) 기반 지갑을 이용하여 nft 제작을 가능하게 해주는 nft 플랫폼 레어러블(Rarible)에서 누구나 쉽게 자신이 만든 이미지, 영상 등을 NFT 화하여 시장에 팔 수 있습니다. 특별한 본인의 사진, 작품을 NFT로 바꿔서 수익을 내는 것이 점점 대중화되고 있습니다.
 

[그림 5] NFT 제작 및 판매 플랫폼 레어러블
 
 

 

디지털 자산인 NFT는 결국 무형의 것입니다. 이러한 무형의 것에 사람들의 관심이 주목되고, 대규모 시장이 형성되고 큰돈이 오가는 것이 아직 믿기 어려운 건 사실입니다. 디지털 아티스트 비플이 말한 것처럼 NFT 트렌드의 버블(Bubble)이 있는 건 사실일 수도 있지만, 이 혁신적인 기술은 기존의 모든 사업 및 시장에 새로운 영향을 줄 수 있을 것 같습니다.




이 주제를 준비하면서 메타버스의 생태계가 생각보다 매우 크다는 것을 알게 되었습니다. 마치 영화 The Matrix(1999)처럼 언젠가는 현실과 메타버스와의 경계가 모호해지는 시대가 도래할 수도 있을 것 같습니다. 최초 인터넷망이 구축되었을 때부터 지금까지 인간의 삶의 모든 부분의 변화가 찾아왔듯이 블록체인 기술은 앞으로 많은 부분을 바꿔나갈 것입니다. 마찬가지로, NFT는 아직은 대부분 사람에게 매우 낯설고 생소한 용어이지만, 앞으로 5년, 10년 후에 이 용어는 누구나 다 아는, 혹은 누구나 하나쯤은 가진 그런 것일지도 모르겠습니다.






작성 : insilico Lab 임의현 컨설턴트

Posted by 人Co

2021/04/14 14:41 2021/04/14 14:41
, , , , , ,
Response
No Trackback , No Comment
RSS :
https://www.insilicogen.com/blog/rss/response/378



우리가 먹고 있는 청양고추, 사실은 독일 바이엘사에 로열티를 주고 종자를 구매 후 작물을 재배하여 섭취하고 있는 현실 알고 계셨나요? 그뿐만 아니라 제주 감귤, 파프리카, 고구마와 양파의 종자도 대부분 해외에서 사들여 먹고 있는 것입니다.
최근 세계적인 유전자 가위 업체들은 항산화·항노화 성분이 기존 콩보다 2배 이상 많은 콩을 개발해 미국 농무부(USDA)로부터 Non-GMO 판정을 받아냈다고 하는데요, 즉, 유전자변형식품이 아니라는 뜻으로 볼 수 있습니다.
이는 이미 선진화된 기술력을 가진 해외 기업들이 우리가 먹고 있는 식량을 좌지우지할 수 있는 여지가 더욱 커졌다는 말이기도 합니다.
다행히 우리나라에서도 디지털 육종 전환 사업이란 것을 통해 육종 기간을 6년에서 3년으로 줄이고 육성 품종의 상품화율을 5%에서 50%로 대폭 끌어올리는 것을 목표로 국내 종자 산업 첨단화를 위한 사업이 진행 중인데요,
이 디지털 육종에 표준화되고 객관화 된 표현형 데이터가 매우 중요합니다.
 
디지털 육종과 표현형 데이터? 다소 생소하게 느껴질 수 있겠지만, 블로그를 통해 그 궁금증 하나둘씩 해결해드리고자 합니다.
오늘 블로그는 종자 산업의 패러다임 변화, 디지털 육종과 표현형 데이터에 대하여 작성해보았습니다.




기후 및 환경 변화 등의 이유로 우수한 신품종을 빠르게 육성하기 위해서는 종묘단계에서 우수한 개체를 선발하는 것이 무엇보다 중요한데 이를 위해 경험 중심의 전통육종[1]에서 빅 데이터 기술과 인공지능기술(AI)로 신속한 의사결정이 이뤄지는 디지털육종[人Co블로그:https://www.insilicogen.com/blog/370]으로 전환이 필수적으로 요구되고 있습니다.

최근 유전자분석 기술(NGS)의 도움으로 유전체 정보는 폭발적으로 증가했으나 표현형[2] 정보의 측정 및 분석기술에 한계가 있다는 점이 육종 기술 도입의 한계로 지적되었습니다.

그러나 최근 RGB, NIR 카메라 및 영상 기술이 발달함에 따라 이를 이용해 크기, 수, 이상 현상 등 작물의 표현형을 정확하고 빠르게 대량으로 수집할 수 있게 되었고, 수집된 데이터를 바탕으로 다양한 기술을 이용해 영상정보(사진, 양상)를 디지털화하고 우수 경제 형질과 연계해 우수한 품종을 선발하는 표현체 이용 기술이 주목을 받고 있습니다.

이러한 표현체 연구는 작물의 형태적 특징을 영상 기술을 통해 수치화 및 객관화하여 분석하는 기술로써 표현형과 연관된 유전자의 연관 관계를 밝혀 그 특성을 이용한 우수 품종 개발을 지원할 수 있는 아주 유용한 방법이라 할 수 있습니다. 즉, 각 개체의 표현형질과 유전적 특성을 미리 알 수 있어 육종 시 원하는 형질을 가진 모본과 부본 간의 교배가 가능하므로 우수 경제 형질을 가진 개체를 선발할 수 있으며 육종 기간 단축을 통해 노력과 시간의 감소 효과를 얻을 수 있습니다.

따라서 전통농업기술과 분자육종, ICT 및 인공지능 등 첨단 기술을 접목한 표현체 연구를 기반으로 차세대 디지털육종 시스템으로 변환을 통해 육종 기간 단축과 우수후보 발굴 등 신품종 개발 효율성을 높일 수 있습니다.



 
[Fig.1] 표현형 자료를 이용한 벼 육종 자료 (출처:A quantitative genomics map of rice provides genetic insights and guides breeding Nature Genetics (2021))
 



 
이러한 표현체 연구를 위해서는 총 4단계의 과정으로 재구성하였습니다.
 

[Fig.2] 표현형 자료 예시
 

  • 데이터베이스 구축 단계
    • 각 재배 및 사육 단계에서 육안 또는 영상, ICT 장비를 이용해 데이터를 체계적으로 수집하는 단계로, 데이터를 수치화하고 객관화시켜 신뢰할 수 있는 표현체 빅데이터를 구축해야 함.
    • 기온, 습도, 날씨 등 다양한 환경 요소를 비롯하여 작물의 성장과 발달 단계에 맞는 정확한 정보(온톨로지)를 통해 수치화하여 수집하는 단계.
  • 지식정보 그래프 구축 단계
    • 수집 데이터를 '노드'-'엣지'의 그래프로 구현하는 단계로 서로의 데이터 관계를 명확하게 정의하여 표현형, 기능, 유전형의 관계를 체계적으로 구축하는 단계.
  • 연관 관계 분석 단계
    • 각 수집 요소에 대하여 알고리즘을 적용하는 단계로 표현형 및 환경정보와 유전형의 연관 관계에 대하여 중요도를 부여하여 특정 표현형에 대한 쿼리 결과의 순위를 제공하는 단계로 이를 뒷받침하는 유전형의 정보도 제공.
  • 맞춤형 분석 단계
    • 데이터베이스를 재구성하거나 탐색을 통해 자신과 가진 데이터를 비교하거나 분석할 수 있는 플랫폼을 제공하는 단계로 특정 표현형에 대한 집단 비교 분석 및 AI 기술 도입을 통해 최적의 교배 지침을 제공하는 단계.

기존 전통육종에서 디지털육종으로의 전환을 유도할 수 있는 표현형 데이터는 유전체 데이터와의 결합과 AI 기술 적용을 통해 새로운 미래 먹거리를 발굴에 활용할 수 있습니다.




그러나 이러한 표현형 데이터는 무엇보다 표준화와 객관화가 중요합니다. 특히 단위는 무척이나 중한데 이를 간과한 사례가 있습니다. 단위가 헷갈려 1,400억 원짜리 우주선이 폭발한 사례[중앙일보]에서 보는 것처럼 주요 단위인 야드와 미터법의 혼동으로 이와 같은 엄청난 피해를 남겼습니다. 표현형을 수집할 때 정확한 용어와 단위 사용은 필수 요소입니다. 이렇게 체계적으로 수집된 표현형 데이터가 유전형 데이터를 만났을 때 진정한 위력을 발휘할 수 있는 것입니다.


[Fig.3] 단위 헷갈려 1,400억짜리 우주선이 폭발[중앙일보]


 

 
이러한 사례를 보자면 "커피는 건강에 좋다?"라는 기사를 통해 확인할 수 있습니다. 커피는 산화방지제가 풍부하고 스트레스를 감소시켜 주며 간 건강에 도움을 준다고 알려졌지만, 과다 섭취하게 되면 골관절염과 비만을 높일 수 있습니다. 해당 연구결과는 'MR-PheWAS분석법'을 이용해 영국 바이오뱅크 내 30만 명의 헬스데이터를 질병정보와 연계 분석하여 얻어진 연구결과입니다. 여기서 MR-PheWAS(MR phenome-wide association studies, MR-PheWAS)분석법이란 의무기록정보 기반 표현체 연관 분석 방법으로 특정 집단 내의 다양한 개체들에서 나타나는 표현형과 유전형과의 연관성을 연구하는 방법으로, 이를 통해 단순히 커피를 마시는 사람과 비교하는 관찰적 기법이 아니라 임상 정보와 연계하여 위와 같은 연구결과를 도출하였습니다. 이러한 분석이 가능한 것은 임상 정보와 같은 방대한 표현형 정보가 바탕이 되었기 때문입니다. 즉, 데이터가 서로 융합이 될 때 더욱더 가치를 발하는 것입니다.
 
 

[Fig.4] 커피는 건강에 좋다? 지나치면 골관절염·비만 위험 키운다[연합뉴스]
(출처:다양한 커피잔[Cyril Saulnier 제공)

표현형 데이터는 말 그대로 야장(野帳)을 디지털화한 것입니다. 단지 기입하고 엑셀로 관리하는 용도가 아니라 적재적소에 활용할 수 이용할 수 있도록 데이터베이스 구축과 데이터의 시계열 분석 및 복합 쿼리를 통해 필요한 정보를 추출할 수 있도록 해야 합니다. 즉 디지털 야장(野帳)을 통해 개체 및 집단에 대한 데이터 분석, 가시화, 통계 분석을 지원할 수 있어야 합니다.
 
 
 
오늘 블로그에서 다루었던 디지털 육종 분야에서의 표현형 데이터는 단순히 아날로그식 기재방법으로 축적하는 것이 아닌, 대량의 표현형 데이터를 상황에 맞게 사용하기 위하여 데이터베이스 구축이 필요할 것입니다.
이를 위해 공공기관과 민간 기업에서 홍수처럼 쏟아지는 많은 양의 데이터를 적절히 관리하고 분석할 수 있도록 빅데이터 구축 사업을 꾸준히 진행하고 있는데요, 디지털 육종을 위한 표현형 데이터도 데이터베이스 구축을 통해 그 활용도와 효용성을 극대화할 수 있을 것입니다.



 
  • 표현형

표현형은 어떤 생명체의 겉으로 관측이 가능한 특정 모습이나 성질을 의미하며 유전형과 반대되는 개념.

멘델의 완두콩 실험을 설명하기 위해 처음 표현되었으며, 현대에 이르러서는 그 개념이 크게 확대되었습니다. 초기 멘델이 형질의 특성을 설명하기 위해 사용된 이 개념은 '유전자형이 곧 표현형으로 드러난다' 는 개념이었으며 완두콩의 '동그랗다'와 '주름지다' 등과 같이 실제 겉으로 드러나는 모양을 표현형이라고 부를 수 있습니다.

표현형은 우리가 흔히 마주할 수 있는 머리카락 색, 눈 색, 키 등과 같은 외향적인 모습뿐만 아니라 특징적인 행동, 발생, 생리학적 특성 또한 포함합니다. 이러한 표현형은 초기 유전형에 의해 결정되며 향후 환경적 요인에 의해 변할 수도 있습니다.

  • 육종의 개념

육종이란 농작물이나 가축을 개량하여 경제(실용) 가치가 더 높은 새로운 품종을 개발하고 증식하여 보급하는 기술입니다. 육종의 목표는 수량 증대와 품질 향상, 내재해성, 내병성, 맛, 향기(풍미), 모양, 사육 환경 등이 다양한 경제 형질로 정해질 수 있습니다.

육종의 대상은 농경을 시작한 이래로 산업적으로 유용한 형질(표현형)을 가진 모든 생물체가 그 대상이었습니다. 경주 능력을 목표한 '서러브레드' 경주마, 우리가 즐겨 먹는 마블링이 우수한 1등급 '한우', 매운맛의 강자 '청양고추', 가난에서 벗어나게 해준 수확량의 제왕 '통일벼', 밀을 대체할 벼 품종 '가루미' 등 동식물을 망라하고 인간에게 유용한 경제 형질을 가진 모든 분야에서 육종이 이루어져 왔습니다.

이렇게 다양한 특징을 가진 농작물 또는 가축을 만드는 것이 전통적인 분리육종만으로는 수십 년 이상을 필요로 하므로 현대 육종방법에서는 최첨단 과학기술을 사용하여 종자 개발을 진행하고 있습니다.

  • 전통육종과 분자육종

전통 육종 - 직접 식물 또는 동물을 교배하고, 재배(사육)하여 선발한 개체를 다시 재배하여 확인 작업을 거쳐 품종화시키는 방법이기에 최소 7년에서 20년 이상의 시간이 소요되며 겉으로 드러난 표현형만을 기준으로 하므로 육종의 목표가 되는 형질 외에 다른 형질의 내재성을 모르는 등 그 한계가 분명합니다.

분자 육종 - 육종기술에 분자 마커를 활용한 분자생물학 기술을 접목한 새로운 육종방법으로 마커를 통해 각 개체의 유전적 특성을 규명하고 효율적으로 우수한 개체를 판별하는 기술입니다. 유용한 형질을 가진 개체를 찾고 교배하는 것은 전통과 같으나 자손 세대의 재배 없이 분자마커를 이용해 원하는 개체를 찾을 수 있으며 많은 시간을 단축하거나 눈으로 확인할 수 없는 경우 등 개체 선발에 도움을 줍니다.

작성 : BS실 이규열 수석개발자
 


 

Posted by 人Co

2021/04/11 14:38 2021/04/11 14:38

人CoDOM Awards 2020, 영예의 수상자는?

 
안녕하세요? 人CoDOM의 네비게이션 MD협의회 입니다.

저희 인실리코젠은 매년 人CoDOM 우수작성자를 선정하는 행사가 있습니다. 올해는 노력상, 인기상 그리고 MD상으로 다양한 기준을 통해 우수작성자를 선정하였습니다. 과연, 영예의 수상자는 누구일까요?
 
 
 
 
수상자를 소개하기 전, 人CoDOM을 알고 계신가요?
이미 많은 분이 사용하고 계시지만, 생소하신 분들을 위해 간략하게 소개 하겠습니다.
 
人CoDOM은 생물정보 1위 기업인 ㈜인실리코젠에서 운영하는 생물정보(Bioinformatics) 분야의 지식 커뮤니티입니다. 人CoDOM의 특징은 위키 문법으로 작성되었기에 생물정보에 관심 있는 분이라면 누구나, 언제든지 작성하고 수정할 수 있다는 것입니다.
 
人CoDOM은 2014년부터 많은 생물정보 전문가와 개발자들의 노력으로 끊임없이 성장하여, 콘텐츠 수가 2,000편이 넘을 뿐만 아니라 월평균 이용자 수가 5만 명에 다다르고 있습니다. 人CoDOM은 크게 Article, Bioinformatics, Data Science 등의 카테고리로 구분되어 있어 관심 분야의 내용을 쉽게 작성하거나 구독하실 수 있습니다.
 
(주)인실리코젠의 모든 멤버들이 유익한 글로 人CoDOM을 빛내주셨습니다. 지난 2020년 한 해 동안 人Co인들이 공유해주신 내용 중, 人CoDOM 발전에 크게 이바지한 훌륭한 콘텐츠를 다양한 기준을 통해 선정해 보았습니다.
 
 
 
人CoDOM Awards 2020 - 노력상
 
첫 번째로 소개해 드릴 상은 노력상입니다.
[정보화사업/사업수행] 콘텐츠를 작성해주신 BS실 박병준 선임님께서 수상하셨습니다. 노력상은 사용자가 원하는 알찬 내용으로 작성해주신 콘텐츠로 선정합니다. 사업을 원활하게 수행하고 싶으시다면 [정보화사업/사업수행] 콘텐츠를 읽어보시는 걸 추천해 드립니다.
 
 
 
<노력상을 수상하신 BS실 박병준 선임님과 최남우 사장님의 기념사진>
 
노력상의 의미를 상을 받고 나셔야 알았네요. (웃음) 제가 人CoDOM을 쓰는 이유는 제가 하는 일을 다른 사람들이 편하게 이해할 수 있었으면 하는 마음으로 작성하고 있습니다. 앞으로도 그런 마음 변치 않고 쉽게 이해할 수 있는 글을 써보도록 노력하겠습니다. 감사합니다.
 
 
人CoDOM Awards 2020 - 인기상
 
두 번째로 소개해 드릴 상은 인기상입니다.
인기상은 [16s rRNA] 콘텐츠를 업데이트한 insilico Lab 조항철 주임님께서 수상하셨습니다. [16s rRNA]은 2020년 한 해 동안 가장 많이 구독된 콘텐츠로 인기상에 선정되었습니다. 미생물 분야에 입문한 연구자라면 필수로 짚고 넘어가야 할 [16s rRNA] 人CoDOM에서 바로 확인하세요.
 
 
 
<인기상을 수상하신 insilico Lab 조항철 주임님과 최남우 사장님의 기념사진>
 
우선 제가 업데이트한 콘텐츠를 방문해주시고, 사랑해주신 모든 분과 콘텐츠 원작자분께 감사의 인사 올립니다. 많이 부족한 내용이었음에도 생물학적으로 기본이 되는 내용이라 많은 분이 방문해주신 것으로 생각됩니다. 이분들 덕분에 상을 받을 수 있었고, 이번 기회를 발판 삼아 앞으로도 많은 분에게 도움이 될 수 있는 콘텐츠를 만들 수 있도록 노력하겠습니다. 다시 한 번 감사의 인사 올리며, 모두 건강한 나날 보내시길 바랍니다. 감사합니다.
 
 
人CoDOM Awards 2020 - MD상
 
마지막으로 소개해 드릴 상은 MD상입니다.
MD상은 작성된 모든 콘텐츠를 MD협의회가 살펴보고 투표한 결과와 함께 각종 측정지표에서 높은 점수를 받은 콘텐츠로 선정하였습니다. 영예의 콘텐츠는 insilico Lab 송하나 선임님께서 업데이트한 [계통수]입니다. 계통수의 정의부터 분석 방법 및 사례까지 알고 싶으시다면 [계통수]를 눌러 보시길 바랍니다.
 
 
 
<MD상을 수상하신 insilico Lab 송하나 선임님과 최남우 사장님의 기념사진>
 
안녕하세요. insilico Lab 송하나입니다. 人CoDOM은 생물정보학을 공부하시는 분들에게 매우 유익한 사이트가 아닐까 싶습니다. 저 또한 人CoDOM을 보며 부족한 부분을 공부했고, 이해한 내용을 바탕으로 연구자들에게 더 편리하게 연구할 수 있는 내용을 공유하고자 작성했는데요, 이 콘텐츠가 우수작으로 선정되어 매우 영광입니다(기본적인 이론의 틀을 잡아주신 초기 작성자분 감사드립니다). 생각지도 못한 선정에 약간은 놀랐지만, 더 좋은 양질의 콘텐츠를 제공해야겠다는 생각이 들었습니다. 人Co인 모두가 생물정보학 분야의 연구자들을 위해 부단히 노력하고 있습니다. 이런 人CoDOM이 널리 알려져 人Co인 뿐만 아니라 모든 연구자도 참여할 수 있기를 바라봅니다.
 
 
<시상식 이후 人CoDOM의 가치와 미래 방향성에 관해 설명하는 최남우 사장님>
 
"우리는 국내 생물정보 1위 기업입니다."
 
학창시절 모두 경험해 보았습니다. 열심히 공부한 친구들이 잘 정리된 노트를 공유하여 주변의 많은 사람에게 선한 영향을 끼치는 것을 발견했을 겁니다. 우리도 人CoDOM을 통해 생물정보 분야의 지식을 공유하여, 현업 연구자들과 미래 바이오 산업을 이끌어갈 인재들에게 도움을 주고 나아가 대한민국 바이오 산업의 발전을 이끄는 선순환 구조를 만들고 있다고 생각합니다. 지금처럼 학습한 지식을 주변과 공유하는 문화를 이어갔으면 합니다.
 
지난 7년 동안 人CoDOM에 2,024편의 콘텐츠가 등록됐습니다. 지금 이 순간도 人CoDOM에는 다양한 글들이 작성되고 있으며, 질적인 면에서도 빠르게 성장하고 있습니다. 앞으로도 기존 콘텐츠 업데이트와 신규 작성글을 통해 양질의 콘텐츠로 가득한 대한민국 대표하는 생물정보 지식의 공유의 장으로 발전했으면 합니다.
 
 
새로운 시작, 새로운 멤버
 
지난 한 해 동안 신규 작성과 기존 글 업데이트 등을 통해 人CoDOM의 우수한 콘텐츠를 만들어주신 모든 분께 이 자리를 빌려 깊이 감사드립니다.
 
 
<최남우 사장님과 신규 출범한 MD협의회 4기 위원들:
(왼쪽부터) 김형민 주임, 이용태 주임, 최남우 사장, 손효정 주임, 전지현 주임>
 
 
2021년에는 새로운 위원으로 구성된 MD협의회 4기가 출범하였습니다.
앞으로 더 나은 콘텐츠 제공과 한층 더 발전된 人CoDOM을 위해 노력하겠습니다.
많은 관심과 성원 부탁드립니다.
 
 
작성 : MD협의회
 

Posted by 人Co

2021/04/02 15:08 2021/04/02 15:08
Response
No Trackback , No Comment
RSS :
https://www.insilicogen.com/blog/rss/response/376