[구버전] 人Co BLOG

디지털 육종과 표현형 데이터 - 표현형 데이터가 디지털 육종 시대를 이끌다.

Posted at 2021/04/11 14:38
Filed under 생물정보

우리가 먹고 있는 청양고추, 사실은 독일 바이엘사에 로열티를 주고 종자를 구매 후 작물을 재배하여 섭취하고 있는 현실 알고 계셨나요? 그뿐만 아니라 제주 감귤, 파프리카, 고구마와 양파의 종자도 대부분 해외에서 사들여 먹고 있는 것입니다.
최근 세계적인 유전자 가위 업체들은 항산화·항노화 성분이 기존 콩보다 2배 이상 많은 콩을 개발해 미국 농무부(USDA)로부터 Non-GMO 판정을 받아냈다고 하는데요, 즉, 유전자변형식품이 아니라는 뜻으로 볼 수 있습니다.
이는 이미 선진화된 기술력을 가진 해외 기업들이 우리가 먹고 있는 식량을 좌지우지할 수 있는 여지가 더욱 커졌다는 말이기도 합니다.
다행히 우리나라에서도 디지털 육종 전환 사업이란 것을 통해 육종 기간을 6년에서 3년으로 줄이고 육성 품종의 상품화율을 5%에서 50%로 대폭 끌어올리는 것을 목표로 국내 종자 산업 첨단화를 위한 사업이 진행 중인데요,
이 디지털 육종에 표준화되고 객관화 된 표현형 데이터가 매우 중요합니다.

디지털 육종과 표현형 데이터? 다소 생소하게 느껴질 수 있겠지만, 블로그를 통해 그 궁금증 하나둘씩 해결해드리고자 합니다.

오늘 블로그는 종자 산업의 패러다임 변화, 디지털 육종과 표현형 데이터에 대하여 작성해보았습니다.

기후 및 환경 변화 등의 이유로 우수한 신품종을 빠르게 육성하기 위해서는 종묘단계에서 우수한 개체를 선발하는 것이 무엇보다 중요한데 이를 위해 경험 중심의 전통육종[1]에서 빅 데이터 기술과 인공지능기술(AI)로 신속한 의사결정이 이뤄지는 디지털육종[人Co블로그:https://www.insilicogen.com/blog/370]으로 전환이 필수적으로 요구되고 있습니다.

최근 유전자분석 기술(NGS)의 도움으로 유전체 정보는 폭발적으로 증가했으나 표현형[2] 정보의 측정 및 분석기술에 한계가 있다는 점이 육종 기술 도입의 한계로 지적되었습니다.

그러나 최근 RGB, NIR 카메라 및 영상 기술이 발달함에 따라 이를 이용해 크기, 수, 이상 현상 등 작물의 표현형을 정확하고 빠르게 대량으로 수집할 수 있게 되었고, 수집된 데이터를 바탕으로 다양한 기술을 이용해 영상정보(사진, 양상)를 디지털화하고 우수 경제 형질과 연계해 우수한 품종을 선발하는 표현체 이용 기술이 주목을 받고 있습니다.

이러한 표현체 연구는 작물의 형태적 특징을 영상 기술을 통해 수치화 및 객관화하여 분석하는 기술로써 표현형과 연관된 유전자의 연관 관계를 밝혀 그 특성을 이용한 우수 품종 개발을 지원할 수 있는 아주 유용한 방법이라 할 수 있습니다. 즉, 각 개체의 표현형질과 유전적 특성을 미리 알 수 있어 육종 시 원하는 형질을 가진 모본과 부본 간의 교배가 가능하므로 우수 경제 형질을 가진 개체를 선발할 수 있으며 육종 기간 단축을 통해 노력과 시간의 감소 효과를 얻을 수 있습니다.

따라서 전통농업기술과 분자육종, ICT 및 인공지능 등 첨단 기술을 접목한 표현체 연구를 기반으로 차세대 디지털육종 시스템으로 변환을 통해 육종 기간 단축과 우수후보 발굴 등 신품종 개발 효율성을 높일 수 있습니다.

[Fig.1] 표현형 자료를 이용한 벼 육종 자료 (출처:A quantitative genomics map of rice provides genetic insights and guides breeding Nature Genetics (2021))

이러한 표현체 연구를 위해서는 총 4단계의 과정으로 재구성하였습니다.

[Fig.2] 표현형 자료 예시

데이터베이스 구축 단계

각 재배 및 사육 단계에서 육안 또는 영상, ICT 장비를 이용해 데이터를 체계적으로 수집하는 단계로, 데이터를 수치화하고 객관화시켜 신뢰할 수 있는 표현체 빅데이터를 구축해야 함.
기온, 습도, 날씨 등 다양한 환경 요소를 비롯하여 작물의 성장과 발달 단계에 맞는 정확한 정보(온톨로지)를 통해 수치화하여 수집하는 단계.

지식정보 그래프 구축 단계

수집 데이터를 '노드'-'엣지'의 그래프로 구현하는 단계로 서로의 데이터 관계를 명확하게 정의하여 표현형, 기능, 유전형의 관계를 체계적으로 구축하는 단계.

연관 관계 분석 단계

각 수집 요소에 대하여 알고리즘을 적용하는 단계로 표현형 및 환경정보와 유전형의 연관 관계에 대하여 중요도를 부여하여 특정 표현형에 대한 쿼리 결과의 순위를 제공하는 단계로 이를 뒷받침하는 유전형의 정보도 제공.

맞춤형 분석 단계

데이터베이스를 재구성하거나 탐색을 통해 자신과 가진 데이터를 비교하거나 분석할 수 있는 플랫폼을 제공하는 단계로 특정 표현형에 대한 집단 비교 분석 및 AI 기술 도입을 통해 최적의 교배 지침을 제공하는 단계.

기존 전통육종에서 디지털육종으로의 전환을 유도할 수 있는 표현형 데이터는 유전체 데이터와의 결합과 AI 기술 적용을 통해 새로운 미래 먹거리를 발굴에 활용할 수 있습니다.

그러나 이러한 표현형 데이터는 무엇보다 표준화와 객관화가 중요합니다. 특히 단위는 무척이나 중한데 이를 간과한 사례가 있습니다. 단위가 헷갈려 1,400억 원짜리 우주선이 폭발한 사례[중앙일보]에서 보는 것처럼 주요 단위인 야드와 미터법의 혼동으로 이와 같은 엄청난 피해를 남겼습니다. 표현형을 수집할 때 정확한 용어와 단위 사용은 필수 요소입니다. 이렇게 체계적으로 수집된 표현형 데이터가 유전형 데이터를 만났을 때 진정한 위력을 발휘할 수 있는 것입니다.

[Fig.3] 단위 헷갈려 1,400억짜리 우주선이 폭발[중앙일보]

이러한 사례를 보자면 "커피는 건강에 좋다?"라는 기사를 통해 확인할 수 있습니다. 커피는 산화방지제가 풍부하고 스트레스를 감소시켜 주며 간 건강에 도움을 준다고 알려졌지만, 과다 섭취하게 되면 골관절염과 비만을 높일 수 있습니다. 해당 연구결과는 'MR-PheWAS분석법'을 이용해 영국 바이오뱅크 내 30만 명의 헬스데이터를 질병정보와 연계 분석하여 얻어진 연구결과입니다. 여기서 MR-PheWAS(MR phenome-wide association studies, MR-PheWAS)분석법이란 의무기록정보 기반 표현체 연관 분석 방법으로 특정 집단 내의 다양한 개체들에서 나타나는 표현형과 유전형과의 연관성을 연구하는 방법으로, 이를 통해 단순히 커피를 마시는 사람과 비교하는 관찰적 기법이 아니라 임상 정보와 연계하여 위와 같은 연구결과를 도출하였습니다. 이러한 분석이 가능한 것은 임상 정보와 같은 방대한 표현형 정보가 바탕이 되었기 때문입니다. 즉, 데이터가 서로 융합이 될 때 더욱더 가치를 발하는 것입니다.

[Fig.4] 커피는 건강에 좋다? 지나치면 골관절염·비만 위험 키운다[연합뉴스]
(출처:다양한 커피잔[Cyril Saulnier 제공)

표현형 데이터는 말 그대로 야장(野帳)을 디지털화한 것입니다. 단지 기입하고 엑셀로 관리하는 용도가 아니라 적재적소에 활용할 수 이용할 수 있도록 데이터베이스 구축과 데이터의 시계열 분석 및 복합 쿼리를 통해 필요한 정보를 추출할 수 있도록 해야 합니다. 즉 디지털 야장(野帳)을 통해 개체 및 집단에 대한 데이터 분석, 가시화, 통계 분석을 지원할 수 있어야 합니다.

오늘 블로그에서 다루었던 디지털 육종 분야에서의 표현형 데이터는 단순히 아날로그식 기재방법으로 축적하는 것이 아닌, 대량의 표현형 데이터를 상황에 맞게 사용하기 위하여 데이터베이스 구축이 필요할 것입니다.
이를 위해 공공기관과 민간 기업에서 홍수처럼 쏟아지는 많은 양의 데이터를 적절히 관리하고 분석할 수 있도록 빅데이터 구축 사업을 꾸준히 진행하고 있는데요, 디지털 육종을 위한 표현형 데이터도 데이터베이스 구축을 통해 그 활용도와 효용성을 극대화할 수 있을 것입니다.

표현형

표현형은 어떤 생명체의 겉으로 관측이 가능한 특정 모습이나 성질을 의미하며 유전형과 반대되는 개념.

멘델의 완두콩 실험을 설명하기 위해 처음 표현되었으며, 현대에 이르러서는 그 개념이 크게 확대되었습니다. 초기 멘델이 형질의 특성을 설명하기 위해 사용된 이 개념은 '유전자형이 곧 표현형으로 드러난다' 는 개념이었으며 완두콩의 '동그랗다'와 '주름지다' 등과 같이 실제 겉으로 드러나는 모양을 표현형이라고 부를 수 있습니다.

표현형은 우리가 흔히 마주할 수 있는 머리카락 색, 눈 색, 키 등과 같은 외향적인 모습뿐만 아니라 특징적인 행동, 발생, 생리학적 특성 또한 포함합니다. 이러한 표현형은 초기 유전형에 의해 결정되며 향후 환경적 요인에 의해 변할 수도 있습니다.

육종의 개념

육종이란 농작물이나 가축을 개량하여 경제(실용) 가치가 더 높은 새로운 품종을 개발하고 증식하여 보급하는 기술입니다. 육종의 목표는 수량 증대와 품질 향상, 내재해성, 내병성, 맛, 향기(풍미), 모양, 사육 환경 등이 다양한 경제 형질로 정해질 수 있습니다.

육종의 대상은 농경을 시작한 이래로 산업적으로 유용한 형질(표현형)을 가진 모든 생물체가 그 대상이었습니다. 경주 능력을 목표한 '서러브레드' 경주마, 우리가 즐겨 먹는 마블링이 우수한 1등급 '한우', 매운맛의 강자 '청양고추', 가난에서 벗어나게 해준 수확량의 제왕 '통일벼', 밀을 대체할 벼 품종 '가루미' 등 동식물을 망라하고 인간에게 유용한 경제 형질을 가진 모든 분야에서 육종이 이루어져 왔습니다.

이렇게 다양한 특징을 가진 농작물 또는 가축을 만드는 것이 전통적인 분리육종만으로는 수십 년 이상을 필요로 하므로 현대 육종방법에서는 최첨단 과학기술을 사용하여 종자 개발을 진행하고 있습니다.

전통육종과 분자육종

전통 육종 - 직접 식물 또는 동물을 교배하고, 재배(사육)하여 선발한 개체를 다시 재배하여 확인 작업을 거쳐 품종화시키는 방법이기에 최소 7년에서 20년 이상의 시간이 소요되며 겉으로 드러난 표현형만을 기준으로 하므로 육종의 목표가 되는 형질 외에 다른 형질의 내재성을 모르는 등 그 한계가 분명합니다.

분자 육종 - 육종기술에 분자 마커를 활용한 분자생물학 기술을 접목한 새로운 육종방법으로 마커를 통해 각 개체의 유전적 특성을 규명하고 효율적으로 우수한 개체를 판별하는 기술입니다. 유용한 형질을 가진 개체를 찾고 교배하는 것은 전통과 같으나 자손 세대의 재배 없이 분자마커를 이용해 원하는 개체를 찾을 수 있으며 많은 시간을 단축하거나 눈으로 확인할 수 없는 경우 등 개체 선발에 도움을 줍니다.

작성 : BS실 이규열 수석개발자

Posted by 人Co

Tag: 교배육종, 데이터육종, 디지털육종, 분자육종, 아이브리딩, 육종, 전통육종, 표현형데이터
Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/377

CLC Genomics Workbench를 이용한 SARS-CoV-2의 MinION 시퀀싱 데이터 분석

Posted at 2020/04/14 10:52
Filed under 생물정보

지난해 12월부터 지금까지 전 세계 보건의료를 극심하게 뒤흔들고 있는 SARS-CoV-2의 유전체는 29.8kb 염기서열로 구성되어 있으며 27개의 단백질을 코딩하는 14개의 ORF(Open Reading Frame)를 가지고 있습니다.

이번 SARS-CoV-2 관련한 환자 유래 바이러스 유전체 시퀀싱 데이터는 GISAID(https://www.gisaid.org/) 사이트에서 모두 공개하고 있습니다. 데이터베이스 내 유전체 계통분석 결과를 보면 바이러스 변이가 얼마나 빠르게 생겨나고 어떻게 확산되고 있는지 패턴을 확인할 수 있습니다.

NGS 장비를 활용한 유전체 해독 기술이 지속적으로 발전하면서 이번 COVID-19 사태에서는 메르스 때와는 다르게 감염 환자가 발생하고 늦어도 일주일 안에 유전체 정보가 해독되어 공개되는 것을 볼 수 있습니다.

중국 현장에서는 초소형 유전체 해독 장비인 MinION(Oxford Nanopore)을 활용해 환자 유래 SARS-CoV-2 유전체를 현장에서 24시간 내 시퀀싱 하는 데 활용하고 있으며, 중국 전역에서 발생한 다양한 이 바이러스 유전체 데이터 수백 개가 동시에 계속해서 공개되고 있습니다.

[출처] NANOPORE사의 MinION

MinION을 사용한 시퀀싱은 SARS-CoV-2의 진화를 추적하기 위한 빠르고 효율적인 방법입니다. 실험실 장비에 비용적으로 거의 투자하지 않고 몇 시간 안에 시퀀싱을 수행할 수 있지만, 샘플의 품질이 낮고 다른 출처의 RNA로 오염된 경우가 많기에 생물정보 분석이 굉장히 중요합니다.

이번 블로그에서는 metatranscriptomics 데이터의 한계를 극복하고, CLC Genomics Workbench를 사용하여 Oxford Nanopore MinION 장비에서 시퀀싱된 데이터를 최대한 활용할 수 있는 방법을 안내하도록 하겠습니다.

분석할 데이터는 중국 우한의 해산물 시장에서 처음 폐렴이 발생하였을 때의 샘플을 MinION 장비로 시퀀싱한 메타전사체 케이스입니다[Chan et al., 2020].

환자로부터 가래와 인후에서 면봉을 사용하여 기관지 폐포를 통해 샘플링 하였고, 질병의 직접적인 원인이 되는 바이러스 외의 RNA가 함께 포함되어 있으며, 염기서열에 비의존적으로 무작위 primer를 사용하여 새로운 병원체의 동정이 가능한 SISPA(Single-Primer Amplification) 프로토콜을 사용하였습니다.

CLC Genomics Workbench 20.0 버전 이상에서는 "Long Read Support(Beta)" 플러그인을 지원합니다. 해당 플러그인을 설치하면 Oxford Nanopore의 MinION 장비에서 시퀀싱한 raw 데이터를 import 할 수가 있습니다.

(Long Read Support Plug-in)

직접 시퀀싱한 데이터 외에 공개된 데이터를 기반으로 분석을 진행해보고 싶다면, SRA 데이터베이스를 연결하여 NGS raw 데이터와 메타데이터를 다운로드하여 분석에 사용할 수 있습니다.

분석에 활용한 데이터도 해당 논문 정보를 토대로 가래과 인후에서 면봉으로 채취한 2개의 샘플을 CLC Genomics Workbench내에 연동된 SRA에서 다운로드 해보았습니다.

(Search for reads in SRA)

더불어 변이 분석을 위한 참조 유전체 서열도 우한에서 등록된 최초의 SARS-CoV-2 바이러스 서열(MT135044)을 NCBI search 기능을 이용하여 준비하였습니다.

(NCBI search & Download)

해당 샘플에서는 바이러스 서열 농축을 위한 SISPA 프로토콜을 사용하였기 때문에, SISPA adapter를 제거하기 위한 adapter 서열을 별도로 저장한 후 trimming 과정을 통해 시퀀싱된 서열 내에 포함된 adapter를 제거하였습니다.

(Adapter trim list)

Long Read Support 플러그인은 PacBio 또는 Oxford Nanopore 장비에서 생산된 long read의 de novo assembly와 reference mapping 분석을 지원합니다.

Quality 및 adapter trimming 과정을 거친 2개의 시퀀싱 데이터는 중국 우한에서 등록된 SARS-CoV-2 참조 유전체를 기준으로 맵핑을 진행하였고, 전체 시퀀싱된 서열 중에서 샘플 내 코로나 바이러스 서열이 포함되어 있음을 확인할 수 있었습니다.

(Read mapping)

맵핑 리포트를 확인해보면, 인후 샘플에서는 채취된 샘플 내에 바이러스가 극소량이라 host genome 데이터가 많이 포함되었을 가능성을 나타냅니다.

참조 유전체 서열에 맵핑된 리드들을 기반으로 변이 분석을 수행할 때 CLC Genomics Workbench에서는 3가지 검출 알고리즘을 제공합니다.

이 중 Fixed Ploidy Variant Detection의 경우는 유전체 배수체를 기준으로 germline 변이 분석에 최적화된 알고리즘이지만, 시퀀싱 에러 모델도 함께 적용되어 있으므로 Oxford Nanopore 데이터의 변이 분석에 효과적일 수 있습니다.

분석 결과, 가래 샘플에서는 5개의 변이가 발견되었고, 인후 샘플에서는 3개의 변이가 발견되었습니다.

(Variant calls)

샘플링 날짜를 살펴보았을 때, 참조 유전체 서열인 MT135044의 경우는 2020년 1월 28일이고 MinION 2개의 시퀀싱 샘플은 2020년 1월 11일로 활동적인 발병 상황에서 시간이 지남에 따라 돌연변이를 추적할 수 있음을 나타냅니다.

추가로 해당 변이의 아미노산 변화에 영향을 미치는지도 확인할 수 있으며, 이를 기반으로 단백질 구조에도 변화를 일으키는지 3차원 형태로 확인할 수 있습니다.

(Protein model of a non-synonymous variant)

각 샘플별로 참조 유전체 서열에 맵핑된 consensus 서열을 별도로 저장하여 NCBI의 BLAST를 수행하면, 다른 샘플의 SARS-CoV-2 서열들과도 비교할 수 있습니다.

COVID-19 사태로 별도의 BLAST DB도 운영하고 있으므로, 필요 시 local 환경에 Betacoronavirus DB를 다운로드 받아서 Local BLAST 분석도 가능합니다.

(BLAST output hit table)

더불어 여기까지 분석은 워크플로우를 만들면 다량의 샘플을 분석할 때 굉장히 효율적으로 쉽게 운영할 수 있습니다.

(A workflow reproducing the bioinformatics pipeline)

이처럼 생물정보 분석은 전체 유전체 수준에서 전염병의 원인이 되는 병원체를 분석하고 비교할 수 있습니다. 더불어 메타 데이터를 이용하여 환자 유래의 바이러스 및 병원체의 유전체 정보를 함께 비교하면 발생 원인을 역으로 추적할 수 있습니다.

현재 (주)인실리코젠에서는 COVID-19 연구를 포함한 감염병 연구를 위해 CLC Genomics ProSuite(CLC Genomics Workbench를 포함한 바이러스 및 미생물 NGS 분석 패키지)와 Ingenuity Pathway Analysis(IPA, 유전자 네트워크 분석 솔루션)의 단기 라이선스를 지원하고 있으니 신청하시면 6월 15일까지 사용해보실 수 있습니다.

COVID-19 연구를 위한 단기 라이선스 신청하기

하루 속히 COVID-19 감염 확산이 종식되길 바라며, 앞으로 이러한 생물정보 솔루션들의 활용을 통해서 바이러스 및 병원체 발생을 조기에 감지하고 제어하는 공중 보건의 보호에 도움이 되길 바랍니다.

Chan, J. et al., A familial cluster of pneumonia associated with the 2019 novel coronavirus indicating person-to-person transmission: a study of a family cluster. Lancet, 395(15):514-523
Aiping Wu, Yousong Peng, et al., Genome Composition and Divergence of the Novel Coronavirus (2019 nCoV) Originating in China. Cell Host and Microbe, 27
GISAID, https ://www.gisaid.org/epiflu applications/next betacov app/

작성 : insilico Lab 김경윤 책임

Posted by 人Co

Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/342

MPEG-G, 유전체 파일 압축의 표준화를 위한 노력

Posted at 2019/12/17 13:13
Filed under 생물정보

1인 미디어와 동영상

2019년 현재, 1인 미디어 시대를 사는 우리에게 가장 친숙한 정보 매체는 동영상입니다. 유튜브 같은 동영상 플랫폼을 통하여, 동영상 파일을 업로드하거나 다운로드한 경험이 있을 것입니다. 이때 다양한 동영상 파일 형식들이 지원되고 있으며, 이 중 많이 사용되는 형식으로는 MPEG, MPEG2, MPEG4, MP4 등이 있습니다. 언급한 동영상 형식은 모두 MPEG와 동일하거나 발전된 형식이며, MPEG라는 키워드 자체는 생소하지 않으리라고 생각합니다. 이번 시간에는 이 MPEG가 무엇이며, 우리가 알고 있는 유전체와 어떤 관계가 있는지 알아보도록 하겠습니다.

MPEG이란?

MPEG(엠펙)은 1988년에 설립된 표준화 전문 그룹으로 풀네임은 Moving Picture Experts Group(동영상 전문 그룹)입니다. 좁은 의미로는 그 이름을 가진 코덱이나 파일 확장자이기도 하지만 넓은 의미이자 본래 의미로 따지면 코덱이나 확장자만이 아닌 표준 규격 자체를 포괄하는 용어입니다. 이 그룹에는 미국의 AT&T, 영국의 BritishTelecom, 일본의 NTT, 미쓰비시, 후지쯔와 같은 비디오 및 통신장비 업체들이 주로 소속되어 있습니다. 정지된 화상을 압축하는 방법을 고안하고 있는 JPEG과는 달리 MPEG은 시간에 따라 연속적으로 변하는 동화상 비디오, 오디오 데이터의 압축과 해제 방식을 규정하고 있습니다[그림 1].

[그림 1] MPEG 메인 사이트

(출처 : MPEG 사이트)

앞서, MPEG가 동영상의 표준 규격 자체 즉 표준화된 형식이라고 언급하였습니다. 이번 글의 중요한 주제이자 키워드가 될 수 있습니다. 먼저, 표준화의 정의는 여러 가지 제품들의 종류와 규격을 표준에 따라 제한하고 통일하는 것을 말합니다. 이와 비슷한 말로 정규화가 있습니다. 그럼 왜 표준화가 필요한 걸까요? 일반적인 정보 통신 표준의 의의는 기술의 공개 및 시스템 간의 호환성을 통한 신기술 확산 및 공유에 있습니다. 좀 더 자세히 말하면, MPEG의 표준화는 동영상 압축 및 압축 해제 기술의 확산 및 공유에 매우 큰 영향을 주었다고 할 수 있습니다. 현재, MPEG는 대부분의 디지털 미디어 콘텐츠에 적용되고 있으며, 다양한 형태로 다양한 플랫폼에서 확인할 수 있습니다[그림 2, 3].

[그림 2] 디지털 미디어 콘텐츠와 압축

(출처 : MPEG-G document, Workshop on Genomic Information Representation held in San Diego on 18th April 2018)

[그림 3] 압축 전송의 자유도

(출처 : MPEG-G document, Workshop on Genomic Information Representation held in San Diego on 18th April 2018)

유전체 생산 속도 증가와 압축의 필요성

인간의 유전체 지도를 해독하기 위해 13년간 진행된 인간 게놈 프로젝트(Human Genome Project)가 2003년 종료된 이후, 유전체 분석을 위해 필요한 비용은 기하급수적으로 감소하였습니다. 2014년 미국의 유전체 분석 장비 제조업체인 일루미나(Illumina)는 같은 해 1월 개최된 JP모건 헬스케어 컨퍼런스에서 1,000달러(약 110만 원)로 한 사람의 게놈 전체를 해독할 수 있는 게놈 분석 장비 HiSeq X10 출시를 발표하면서 1,000달러 게놈 시대를 이끌었습니다.
그 이후 2018년에 들어, Veritas Genetics는 999달러의 전체 게놈 시퀀싱 서비스 가격을 80% 인하하여 선착순 1,000명에게 199달러에 유전자 분석 서비스(결과 해석 포함)를 제공한 사례가 있습니다. 이는 1,000달러의 1/10 수준인 100달러(약 11만 원)로 한 사람의 유전체 서열 전체를 해독할 수 있는 100달러 게놈 시대가 곧 온다는 것을 예고합니다.
유전체 생산 비용의 감소는 관련 산업의 발전을 이끌고 있으며, 분석된 대용량의 유전체 데이터는 빅데이터 기술과 맞물려 유전체 분석 시장을 빠르게 발전시켰습니다. Google과 Amazon은 보유하고 있는 클라우드 시스템을 활용하여 유전체 빅데이터 클라우드 서비스를 제공하고 있으며, 23andme와 같은 개인 전장유전체 분석서비스 등 다양한 산업화가 이루어졌습니다. 또한, 국외 유전체 아카이브 중 하나인 EMBL-EBI에 따르면, 2018년부터 10 페타바이트(petabyte) 규모의 데이터를 서비스하고 있습니다(그림4). 이제는 페타바이트(petabyte)급의 생산 시대로 들어왔으며, 이는 현존하는 디지털 데이터 중 가장 빠르게 생산하는 유전체 빅데이터가 된 것입니다.

[그림 4] EBI, 데이터 서비스 용량
(출처 : EMBL EBI annual-report-2018)

대용량 유전체 데이터의 급격한 증가는 이를 저장하는 저장 매체의 발전 속도를 추월하였기에, 저장 및 관리하는 비용의 감소 및 전송의 필요성이 지속해서 제기되었고, 이는 MPEG와 같은 압축 표준이 필요한 이유입니다.

유전체 압축 표준화

유전체 압축에 대한 표준화는 2014년부터 이루어지고 있습니다. 2014년 3월 스페인의 발렌시아에서 진행된 108차 MPEG(Moving Picture Experts Group) 회의에서 유전체 데이터의 압축, 저장, 그리고 스트리밍에 대한 필요성이 최초로 제기되었습니다. 처음 시작부터, 비디오 압축 전문가와 생물정보 전문가에 의해 공동으로 작성되었습니다. 전통적으로 오디오와 비디오 데이터의 압축과 처리에 대한 표준화를 진행해온 MPEG에 유전체 데이터에 대한 표준 이슈를 제기한 것은 특이하지만, 디지털 데이터의 종류를 확장하면 MPEG에서 다룰 만한 표준이라고 볼 수도 있습니다. MPEG는 유전체 표준의 필요성을 받아들여, 미래 미디어 서비스로 대두하고 있는 몰입형 미디어(Immersive Media) 표준개발을 위한 MPEG-I 프로젝트를 2017년부터 시작하였습니다. 이 중 유전체 압축 관련된 표준화도 진행하고 있는데 이를 MPEG-G라고 합니다[그림 5].

[그림 5] MPEG 표준개발 로드맵
(출처 : 한국정보통신기술협회 TTA연구보서, MPEG뉴디미어 포럼 2019)

MPEG-G

생명 공학 표준 (ISO TC 276 / WG 5)을 위해 MPEG와 ISO 기술위원회가 공동으로 개발한 MPEG-G 표준은 유전체 데이터를 처리(분석, annotation 등) 시 발생하는 문제 해결 및 비용 절감을 위한 최초의 국제 표준입니다. 새로운 압축 및 전송 기술뿐만 아니라 메타 데이터의 형태로 연결하는 표준 규격 정보와 시퀀싱 데이터를 효율적으로 처리할 수 있는 상호 운용 가능한 애플리케이션 및 관계된 서비스업계 전반의 에코시스템을 구축하기 위한 API (Application Programming Interfaces)를 제공합니다.

에코시스템(ecosystem) – 원래 생물학 용어로, 자연환경과 생물이 서로 영향을 주고받으면서 함께 생존해 나가는 자연계의 질서를 말합니다. 이것을 1993년 미국하버드대 연구교수인 제임스 무어(Moore)가 비즈니스에 접목해 비즈니스 에코시스템이란 용어를 만들었습니다. 주로 IT 분야의 여러 기업이 몇몇 리더 기업을 중심으로 경쟁과 협력을 통해 공생(共生)하고 함께 발전해 나가는 모습을 지칭합니다.

MPEG-G 표준의 적용을 통하여, 압축 데이터에 대한 선택적 액세스(access), 데이터 스트리밍(streaming), 압축 파일 연결, 유전체 연구 집계, 시퀀싱 데이터 및 메타 데이터의 선택적 암호화 등 다양한 사례에서 필요한 데이터 압축 및 전송을 지원하게 됩니다. (그림 6.)

[그림 6] MPEG-G 표준을 활용한 에코시스템의 완벽한 지원
(출처 : : MPEG-G document, Workshop on Genomic Information Representation held in San Diego on 18th April 2018)

특히 고성능 컴퓨터 기술(HPC, High Performance Computing)과 연계하여, 유전체 아카이브의 익명데이터와 의학 및 헬스산업의 데이터를 연결하는 중요한 가교역할을 할 것으로 기대하고 있습니다[그림 7].

[그림 7] HPC환경의 유전체 분석을 위한 MPEG-G의 역할

(출처 : MPEG-G document, Workshop on Genomic Information Representation held in San Diego on 18th April 2018)

마치면서

정리하면, MPEG-G 표준은 현재 유전체 정보 처리의 효율 및 경제성을 고려한 규격이며, 유전체 압축 기술의 문제점과 한계를 해결하기 위한 가장 규모가 큰 국제 협력이자 노력입니다. 2019년 현재, MPEG-G 표준의 진행은 유전체 파일의 특징 및 규격의 표준에 대한 API 부분은 FDIS(Final Draft International Standard, 최종 규격 전 초안) 단계로 완료되었으나, 실제 적용을 위한 유전체 파일 형식에 따른 압축 방법이나 표준 압축 알고리즘 등 은 아직 연구 논문 수준으로 좀 더 시간이 필요합니다. 유전체 정보를 다루는 견해에서 MPEG-G 표준의 다음 소식을 하루빨리 기다려봅니다.

참고자료

나무위키 MPEG
MPEG 홈페이지
MPEG-G 홈페이지
MPEG-G document (Workshop on Genomic Information Representation held in San Diego on 18th April 2018)
Weekly KDB Report 2019. 10. 28
GEN(Genetic Engineering & Biotechnology News), Top 10 Sequencing Companies)
전자통신동향분석 제32권 제1호 2017년 2월 / 유전체 압축 및 저장 표준 동향
에코시스템이 주목받는 이유

작성 : 대전지사 홍지만 선임

Posted by 人Co

Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/334

나만 몰랐던 BLAST 꿀팁

Posted at 2019/09/11 16:26
Filed under 생물정보

19세기의 자전거란 현재와 달라서 금속의 바퀴로 이루어져 쉽게 사고로 이어지곤 했답니다.
이에 영국의 수학자 던롭은 사랑하는 외동아들 조니를 위해 고무 타이어를 발명하게 되고 공기타이어회사 CEO로 큰 부자가 되게 됩니다.
저 역시 필요 때문에 (더 빨리, 더 쉽게 처리하고 칼퇴하고자) 다음의 방법들을 발견하게 되었으니 평행이론에 따라 언젠가는 저도 큰 부자가 될..... 수 있을까요?

발단은 몹시 사소했습니다.
아래 그림처럼 결과를 만들면 매우 있어 보일 것 같았거든요.

<출처 : GraPhlAn 프로그램 위키 페이지>

그런데 내 손에 있는 건 단백질 서열 단 하나, 계통수를 그리기 위한 DB가 아직 구축되어 있지 않은 상황이었어요.
하지만 걱정 없죠. 백종원 대표님께 만능 간장이 있다면 우리에겐 만능 BLAST가 있으니깐요.
BLAST를 통해 맵핑되는 단백질들을 모은 후 이를 이용하여 계통수를 그려보기로 합니다.
BLAST에 대한 기본 설명이나 분석 방법 등은 위키 (Wiki) 기반의 커뮤니티 형성을 통한 생물정보 분야의 집단 지성 창출을 목적으로 운영되는 지식 커뮤니티인 人CoDOM을 참고해주세요.

그런데 여기서 문제 발생!!!
nr에 대한 BLAST를 다 끝내고 보니 (default setting의 tabular format으로 출력) 결과 파일에서 종명을 확인할 수 없었어요.
종명을 확인 못 하면 계통수를 그려도 계통별로 잘 묶였는지 확인도 어렵고 예쁜 색을 입혀줄 수도 없어요.

MH00089;   gi|761546247|ref|YP_009122458.1|   99.06   530   5       0   1   530   1   530   0.0   1045
MH00089;   gi|1314948409|ref|YP_009444547.1|   94.70   528   28      0   3   530   1   528   0.0   995
MH00089;   gi|1079486692|ref|YP_009307015.1|   94.89   528   27      0   3   530   1   528   0.0   991

< BLAST 수행 결과 예시>

종명 확인을 위해서는 NCBI에 GI number (또는 accession)로 검색해보는 수밖에 없는 듯 하여 매우 절망스러웠지요.
실제로 하나 검색에만 최소 클릭 5~6번이 소요되고 10개 넘어가면 웹 크롤링을 해야하는 건지 고민하게 됩니다.
이때 잘 읽은 메뉴얼 하나가 사람을 살립니다.
역시 오랜 역사를 자랑하는 생물정보 산증인 BLAST는 이미 해답을 제시하고 있었던 거죠.

아래와 같이 2단계를 순서대로 수행해 주시면 BLAST 결과에서 종명, taxid (중요), kingdom (계) 정보를 바로 확인할 수 있습니다.

1단계) taxonomy DB 세팅
먼저 nr로부터 계통 정보를 가져올 수 있도록 NCBI에서 제공하는 taxonomy DB를 세팅해 주어야 합니다.
아래와 같이 최신 버전으로 다운로드 후 환경변수에 추가해 주세요.
(이참에 nr DB도 최신 버전으로 변경해주고, 하는 김에 BLAST도 최신화해주는 게 어떨까요?)
참고로 제가 테스트했던 버전은 BLAST+ 2.2.31입니다.

$ wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/taxdb.tar.gz
$ tar zxvf taxdb.tar.gz
$ export BLASTDB=[download 위치]

2단계) BLAST 실행

BLAST 수행 시 결과 파일의 포맷을 6번, 즉 tabular로 지정하고 format specifiers에 staxids(species taxon id)와 sscinames (species scientific name), sskingdoms (species super kindoms)이 포함되도록 적어줍니다.

$ blastp -query query.faa -db nr -outfmt '6 qseqid sseqid pident evalue staxids sscinames scomnames sskingdoms stitle' -num_threads 20 -out query_vs_nr.table

짜잔~ 커맨드라인 하나로 손목 수명이 일주일 연장되었습니다 (감격).
하는 김에 stitle (species name)도 추가하였더니 이제 정말 NCBI 웹사이트 들락날락할 일 없어졌어요.

MH00089;        gi|761546247|ref|YP_009122458.1|        99.06   0.0     1610689 Sarocladium implicatum  Sarocladium implicatum  Eukaryota       cytochrome oxidase subunit I (mitochondrion) [Sarocladium implicatum]
MH00089;        gi|1314948409|ref|YP_009444547.1|       94.70   0.0     29910   Tolypocladium inflatum  Tolypocladium inflatum  Eukaryota       cytochrome c oxidase subunit 1 (mitochondrion) [Tolypocladium inflatum]
MH00089;        gi|1079486692|ref|YP_009307015.1|       94.89   0.0     71617   Tolypocladium ophioglossoides   Tolypocladium ophioglossoides   Eukaryota       cytochrome oxidase subunit 1 (mitochondrion) [Tolypocladium ophioglossoides]

< BLAST 결과 예시>

한계점)
하지만 결과를 보면 박테리아인지 진핵인지와 같이 계 (kingdom)에 대한 정보만 제시하고 있어요.
근연종의 단백질에 잘 맵핑이 된 것인지 전체 계통 정보를 확인하고 싶고 진핵생물 내에서도 딱정벌레목인지 총채벌레목인지 좀 더 세분화하고 싶은데 이 상태로는 너무 부족합니다.

제가 찾은 방법은 NCBI에서 제공하는 텍스트 포맷의 관련 DB에서 taxid 또는 학명(scientific name)으로 검색하는 것입니다.
참고로 최근 1~2년 사이 NCBI taxonomy DB가 업데이트되면서부터 taxid 별 full lineage 정보를 제공하고 있으니 꼭 최신 버전을 받아주세요.
new_taxdump.tar.gz 파일을 다운로드 후 그 안에 있는 fullnamelineage.dmp 파일을 확인하면 정보를 얻을 수 있습니다.

taxid | scientific name | full lineage
1610689 |       Sarocladium implicatum  |       cellular organisms; Eukaryota; Opisthokonta; Fungi; Dikarya; Ascomycota; saccharomyceta; Pezizomycotina; leotiomyceta; sordariomyceta; Sordariomycetes; Hypocreomycetidae; Hypocreales; Hypocreales incertae sedis; Sarocladium;        |

추가 팁 하나 더!)
BLAST 결과 출력시 파일 포맷을 여러 개로 하고 싶을 때가 있어요.

XML은 기본이니깐 꼭 있어야 할 것 같고 파싱하기 귀찮으니 tabular로도 해야 할 것 같고 또 alignment된 거 확인하고 싶으니 pairwise로도 남겨두고 싶을 때 어떻게 해야하는 거죠??

BLAST를 3번 하면 돼요. 하지만 오래 걸린다는 단점이 있어요.
이때 blast_formatter를 사용하시면 됩니다 (작업시간이 1/3로 줄어드는 매직)!!!
몰랐는데 BLAST 설치 디렉토리에 이미 blastp, blastn이랑 같이 자리잡고 있더라구요.
(역시 메뉴얼은 읽으라고 있는 거였어요.)
중요한 점은 처음 BLAST할 때 반드시 asn 포맷으로 출력해 주어야 한다는 것입니다.

$ blastn -db [nt] -query [query] -outfmt 11 -out [output].asn
$ blast_formatter -archive [output].asn -outfmt 5 -out [output].asn.xml
$ blast_formatter -archive [output].asn -outfmt 6 -out [output].asn.tabular
$ blast_formatter -archive [output].asn -outfmt 0 -out [output].asn.pairwise

출력 포맷은 아래를 참고하셔서 원하는 번호를 기재해 주시면 됩니다.

 0 = pairwise,
 1 = query-anchored showing identities,
 2 = query-anchored no identities,
 3 = flat query-anchored, show identities,
 4 = flat query-anchored, no identities,
 5 = XML Blast output,
 6 = tabular,
 7 = tabular with comment lines,
 8 = Text ASN.1,
 9 = Binary ASN.1,
10 = Comma-separated values,
11 = BLAST archive format (ASN.1),
12 = JSON Seqalign output,
13 = JSON Blast output,
14 = XML2 Blast output

<출력 가능한 BLAST 결과 포맷 목록>

이상 새롭지 않을 수 있을, 그리고 정말 저만 알았다면 너무 슬프고 민망할 것 같은 BLAST 꿀팁 소개를 마칩니다.
이 방법 외에도 오조오억 개의 다른 길이 있을 겁니다. 아시는 분은 제보 바랍니다.
당신은 우리와 함께 가시면 안 될까요??? (=스카우트하고 싶어요).

<출처 : 'Mnet 쇼미더머니8 화면캡처' 후 편집>

작성 : RDC 정명희 선임 연구원

Posted by 人Co

Tag: Bioinformatics, insilicogen, 생물정보학, 인실리코젠
Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/324

체외 진단기기(In Vitro Diagnostics, IVD)

Posted at 2019/06/10 15:55
Filed under 생물정보

체외 진단기기는 의료기기법 제2조에 포함하는 의료기기의 일종으로 질병의 진단과 예후, 건강 상태 판정, 질병 치료 효과 판정, 예방 등의 목적으로 인체로부터 채취된 대상물 인체로부터 채취된 대상물을 이용한 검사에 사용되는 의료기기를 말한다.

특성
타 의료기기 산업과 마찬가지로 IVD 산업은 높은 부가가치를 낼 수 있는 산업이나 소비자층이 일부 자가측정용 기기를 제외하고는 의료서비스에 종사하는 의사와 임상병리사로 국한되어 있어 안전성과 신뢰성을 중시하여 후발업체의 시장진입이 어려운 실정이다. 또한, 자가측정용 기기를 제외하고는 수요처가 병원과 검사센터, 보건소 등이나 품목 수가 매우 다양하며 Biology, IT 등 다양한 기술개발이 연계되어 계속 새로운 방법과 기기가 출현하는 분야이다. 체외 진단기기는 허가나 인증의 경우 환자에게 직접 적용되는 의료기기보다는 비교적 엄격하지 않다.

체외 진단기기의 분류
IVD 기기는 분류방법에 따라 다르게 나뉘고 있으며, 보건산업진흥원의 의료기기 16개 유형 분류에 따르면 체외 진단기기는 혈당측정기, 유전자분석기구, 체액 분석기기, 의료용 원심분리기, 혈액검사기기, 유전자분석기기, 소변 분변 분석기기, 체외 진단기기용 검사지 등으로 나누어 지고 있으며, 기술에 따라서는 8개의 세부분야로 나누어 지고 있다.

(출처:S&T Market Report vol. 40 (2016.03))

체외 진단기기 시장현황과 전망

체외 진단기기 시장은 약 522억 달러('14년 기준)로 '07년 이후 연평균 8.24%의 성장이 예상되고 있다. 현재 태동단계에 진입하여 지속적인 성장이 예상되며, 시장에서의 경쟁구도가 높고 기술변화가 빠르게 진행되고 있다. 미국이 가장 큰 154.9억 달러 규모를 형성하고 있으며, 그다음으로 서유럽지역이 138.4억 달러, 아시아 태평양 지역이 79.5억 달러 규모를 형성하고 있다 ('12년 기준). 특히 아시아태평양 지역의 경우 가장 높은 연간성장률(11.5%)로 향후 큰 시장이 형성될 것으로 전망된다. 분야별로 매출 규모를 보면 면역화학 시장이 35.8%의 시장점유율로 가장 큰 시장이고 다음으로 자가혈당측정 시장이 20.5%, POCT(point of care testing, 현장검사)시장이 11.8%의 시장 점유율로 시장을 구성하고 있다. 성장변화는 혈당 측정기가 속한 자가검사 시장과 분자유전검사 분야가 가장 급속도로 성장하고 있으며 기기의 성장 속도도 빠름을 알 수 있다.

(출처 : Medical Equipment Market Analysis & Forecasts to 2015, GlobalData (2009.05))

체외 진단 분야 시장은 NGS 기반의 분자진단의 경우 계속 높은 성장률을 보이며 전염병 진단과 같은 비종양학 분야로의 확장으로 성장이 촉진될 것으로 기대된다. 액체생검 기반의 동반진단검사는 FDA의 승인절차 간소화에 따라 본격적으로 시장이 확대될 것으로 전망되며, 종양 프로파일링에 활용될 것으로 기대된다. 기타 현장진단은 단순하고 저렴한 방식의 POCT의 수요가 지속해서 증가할 것으로 전망되며, 유전자 POCT와 암 POCT가 핵심 콘텐츠가 될 것으로 예측된다.

체외 진단기기 검정과 평가

체외 진단기기의 민감도(Sensitivity)와 특이도(Specificity)는 두 가지의 결과를 다룬다. 질환의 재발유▪︎무를 기준으로 나누고, 알고리즘 분석을 통해 재발 고위험, 저위험 두 그룹으로 나눈다. 따라서 재발이 된 그룹과 안 된 그룹, 재발 고위험군과 저위험군 등 총 4가지 그룹이 만들어진다. 이 4가지 그룹의 각 수를 이용하면 AUC(Area Under the ROC Curve)를 제외한 아래의 성능 항목을 평가할 수 있다.

(출처: 질병의 예후·예측에 사용되는 체외 진단용 의료기기 허가·심사 가이드라인 (2018. 08))

민감도(Sensitivity) - “실제로 병에 걸린 사람 중에서 얼마나 정확하게 병에 걸린 것으로 나타났는가”를 의미(Sensitivity = a/a+c)한다. 민감도는 치명적인 병을 테스트하거나 고위험군을 선별하는 경우 중요하게 고려해야 할 사항이다. 따라서 이런 경우에는 알고리즘을 통해 치료를 받아야 하는 고위험군을 매우 잘 규정해야 한다. 민감도는 실제 재발(또는 발병)한 사람 중 알고리즘 분석결과 재발(또는 발병)할 것이라고 구분한 사람의 비율을 의미한다.
특이도(Specificity) - “실제로 병이 없는 사람 중에서 얼마나 정확하게 병이 없다고 나타나는가”를 의미(Specificity = d/b+d))한다. 어떤 질병에 대한 저위험군을 선별하여 과도한 치료의 불필요성을 제시할 경우의 고려 대상이다. 특이도는 민감도와 반대되는 의미로, 실제 재발(또는 발병) 하지 않은 사람들 중 알고리즘 분석결과 재발(또는 발병)하지 않을 것이라고 구분한 사람의 비율을 의미한다.

체외 진단기기 허가 및 승인

체외 진단용 의료기기 분류

(출처: 질병의 예후·예측에 사용되는 체외 진단용 의료기기 허가·심사 가이드라인 (2018. 08))

등급별 허가 및 승인 절차

(출처: 질병의 예후·예측에 사용되는 체외 진단용 의료기기 허가·심사 가이드라인 (2018. 08))

맺음말

체외 진단 시장은 2014년 이후로 급격히 시장이 팽창하고 있으며, 앞으로도 지속해서 시장은 확대될 것으로 기대된다. 특히 국내의 경우 초고령화 시대와 정부의 규제 완화 정책이 맞물려 투자증가와 해외진출의 기회가 더욱 기대되고 있다. 다만 지속적인 가격 억제 정책으로 기업이 관련 제품을 생산하는데 어려움을 겪고 있으며 신흥부상국에서도 많은 관심을 보이고 있으므로 보다 적극적인 투자과 정부의 규제 완화 정책이 필요한 시점이다. 다행히 의료보험에서 새로운 검사 개발에 대한 인정이 매우 어려운 상황이었으나 최근 그동안 의약품으로 분류되어 어려움이 많았던 체외 진단 시약이 모두 기기와 함께 의료기기로 분류됨에 따라 국내 체외 진단기기 산업에 긍정적 효과를 기대해 본다.

마지막으로 신기술개발뿐 아니라 국익 창출을 위해서는 새로 찾은 마커를 검출하거나 측정할 수 있는 체외 진단기기 개발에 국가지원이 필요하다. 국내 체외 진단기기 업체는 대부분 중소규모의 기업으로써 국가적 지원 없이는 이러한 새로운 체외 진단기기와 시약 개발이 어려울 수밖에 없다. 따라서 정부는 투자비용이 많이 소요되는 대형 융합형 기기 개발과 같은 연구개발사업을 만들고 중소기업을 지원할 수 있는 다양한 정책을 수립해야 할 것이다.

참고자료

S&T Market Report vol.40 | 2016. 03
질병의 예후·예측에 사용되는 체외 진단용 의료기기 허가·심사 가이드라인 (2018. 08)
체외 진단기기(In Vitro Diagnostics) 현황 및 전망 (KEIT PD Issue Report, 2014. 04)

BS실 이기용 실장

Posted by 人Co

Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/314

IncoARG, 신속하고 정확한 항생제 내성 진단 키트 제작을 위한 플랫폼

Posted at 2019/05/21 13:05
Filed under 생물정보

봉와직염(蜂窩織炎: cellulitis)

군대 다녀온 남자들이라면 익숙하게 들어본 질병 중의 하나로 봉와직염이 있다. 웬만한 성인 남성들은 한 번쯤은 직간접적으로 겪어 본 흔한 질병의 하나이다. 군대에서 많이 걸리는 이유는 군화를 신고 오래 걷고, 발에 상처가 나도 제대로 치료를 못 해 덧나는 염증이다. 처음에는 그냥 무좀인 줄 알고 있다가 나중에야 심각함을 인지하는 나름 무서운 병이다. 환경이 열악하고 육체적으로 많은 일을 하며 잘 씻지 못하는 조건에서 많이 발병해서 군대에서만 걸리는 질병으로 인식하고 있지만, 최근에는 여러 이유로 면역력이 떨어진 상태에서 작은 상처 부위에 세균 감염되었을 때 많이 발생하고 있다. 상처가 마치 벌집 모양으로 번져간다고 해서 이러한 이름이 붙여지게 되었다.

봉와직염과 항생제

봉와직염은 진피와 피하 조직에 나타나는 급성 세균 감염증의 하나로 이들 세균이 침범한 부위에 홍반, 열감, 부종, 통증을 동반한다. 이의 주원인으로는 황색포도알균과 사슬알균 등에 의한 감염으로 병원 진료를 받게 되면 항생제 처방을 받게 된다. 그러나 이러한 봉와직염의 약 30%가 단순한 피부 감염인 가성 봉와직염(pseudocellulitis)으로 밝혀졌으며 이들 중 85%는 입원치료가 필요 없었고 92%는 불필요한 항생제가 투여됐는데 이는 봉와직염과 가성 봉와직염은 증상이 비슷해 구분이 어렵기 때문이다. 이로 인해 연간 13만 건의 불필요한 입원과 51억 5천만 달러의 불필요한 의료지출이 낭비되고 있다고 한다. 무엇보다 심각한 문제는 불필요한 항생제 투여가 항생제 내성을 부채질한다는 데 있다[1].

항생제와 내성

위의 사례처럼 우리가 흔히 접하는 봉와직염과 항생제를 살펴봤을 때도 항생제와 내성 문제가 대두하고 있다. 무분별한 항생제 남용과 오진으로 인해 항생제 사용량은 나날이 급증하고 있으며 그로 인해 항생제에 대한 내성을 가진 내성균이 출현하고 있다. 2016년 영국 정부가 발표한 항생제 내성균(AMR: AntiMicrobial Resistance)보고서에서는 현재 전 세계적으로 70만 이상이, 유럽과 미국에서 5만 이상이 내성 박테리아의 감염 때문에 숨지고 있으며, 인류가 특별한 조처를 하지 않으면 2050년에 이르러서는 1,000만 이상의 사망과 이에 따라 100조 달러 이상의 손실이 발생할 것으로 예측하였다[2].

[그림1] 인구 1,000명당 항생제 하루 사용량
(출처: 미국 국민과학운회보(PNAS)-생명공학정보센터))

최근 조사에 따르면 인구 1,000명당 항생제 하루 사용량은 고소득 국가를 비롯하여 저소득 국가까지 전반적으로 사용량이 증가하는 추세에 있다. 특히 주목할 점은 중상위 소득 국가에서 그 사용량이 기하급수적으로 증가하고 있다는 점이다. 이는 아마도 의료 복지의 수준이 상대적으로 양호해지면서 병·의원의 치료가 증가한다는 데 기인하였다고 추측해 볼 수 있다.

[그림2] 인체 항생제 사용량

[그림3] 황색포도알균 메티실린 내성률

[그림4] OECD 국가 항생제 사용량

(출처: 매일경제 (MBN) 2018.11.28. 항생제 남용심각... 30년 후엔 매년 1,000만 명 사망)

매년 유럽에서만 25,000명, 미국에서 23,000명 정도가 항생제 내성 균주에 감염되어 사망하고 있으며 패혈증은 시간당 9%씩 감소하는 생존율을 극대화하기 위해 항균제 감수성 검사 시간 단축이 매우 중요하다고 볼 수 있다. 즉 항생제를 빠르고 정확하게 처방하여 환자의 생존율을 높이고 동시에 항생제 내성 균주 발생을 억제해야 하지만 항생제 내성 검사의 경우 종동정부터 항생제 내성 검사까지 최소 16시간에서 40시간 이상의 시간이 소요되고 있다.

항생제 내성 균주로 매년 경제적 손실은 유럽에서 약 2조, 미국에서 66조 가량 된다고 추정하고 있으며, 이는 사망률 증가, 치료 기간 연장, 의료비용 상승 등 공중보건에 큰 위협이 되면서 사회경제적으로 큰 손실을 초래하고 있다.

항생제는 1928년 페니실린(Penicillin) 항생제의 발견 이후 1960년대까지는 항생제의 개발이 활발했지만, 새로운 계열의 항생제 부재와 기술의 한계, 그리고 빠르게 증가하는 각종 세균의 내성 문제 등으로 이후 항생제 개발은 감소하기 시작하여 항생제 오남용으로 인해 항생제 내성균이 증가함에 따라 유엔이 항생제 남용 방지 결의안을 채택(’16.09)하기도 하였다[3].

항생제 내성 기작

항생제의 역사는 1928년 플레밍(Alexander Fleming)이 페니실린(penicillin)을 발견하면서 시작되었다. 이 발견을 빌미로 2차 세계 대전 당시 상용화에 성공해 수많은 전염병 환자의 목숨을 구한 것은 익히 알고 있는 사실이다. 이후 질병의 원인이 되는 미생물의 사멸을 위해서 많은 항생제가 개발되었다. 항생제는 미생물이 생성한 물질로, 다른 미생물의 성장을 저해하여 항균작용을 나타내며 인체에 침입한 세균의 감염을 치료한다. 특히, 세균의 증식과 성장을 억제하는 약물이다. 항생제의 주요 작용 기전으로는 다음과 같다.

세포벽 합성 저해
단백질 합성 저해
핵산 합성 및 교정 저해

세균에는 대략 200개 내외의 필수 단백질들이 있으나 이 가운데 항생제의 표적으로 삼고 있는 유전자는 대략 3종류인데, 리보솜과 세포벽 생성에 관여하는 단백질 그리고 핵산의 구조 변형 및 합성에 작용하는 효소들이다. 이들의 성장과 증식을 억제함으로써 그 약제의 역할을 하는 것이다. 그러나 이러한 약제에도 내성을 가지는 미생물 특히 세균이 존재한다. 항생 물질에 대한 내성은 자연과 획득 내성로 구분할 수 있는데 특히 문제가 되는 것은 획득 내성으로 볼 수 있는데 획득 내성은 어떤 종이 갖고 있던 유전∙생화학적 성질이 변형되면서 해당 제제에 대하여 내성이 생기는 현상을 의미한다. 특히, 최근 들어서 문제가 되는 다양한 항균제의 오남용이 병원균 약제 내성의 선택적 발생을 부추김을 부정할 수 없다[4].

이에 신속하고 정확하게 항생제 내성을 진단하고 항생제를 처방하여 환자의 생존율 증대 및 항생제 내성 균주 발생을 억제가 필요하지만 현 항생제 내성 검사의 경우 최소 16시간에서 최대 2~3일의 시간이 소요되고 있다. 이는 초기 환자의 생존율을 낮추고 있으며 항생제의 오남용이 되는 근본 원인을 제공하고 있다. 따라서 단기간에 항생제 내성 여부를 판단하여 신속하고 정확한 처방을 통해 항생제 내성균 억제하는 것은 무엇보다 중요하다고 할 수 있다. 최근에는 기술의 발달로 RT-PCR 기술을 이용해 3시간 이내에 진단할 수 있어졌지만, 다양하게 변화하는 내성균의 유전자 정보를 추적할 필요가 있다. 특히나 한국에서는 항생제가 연간 1,000톤 정도가 사용 중이며 이는 한국 지역 환경의 변화에 따른 새로운 항생제 내성균의 출현이 예고된다.

IncoARG

이러한 환경변화에 따라 한국형 항생제 내성 유전자(다양성) 서열 및 정보를 수집할 수 있는 플랫폼 필요성이 주목받고 있다. 이미 ARDB 및 CARD와 같은 데이터베이스가 존재하지만, 한국인들에게서 발병한 항생제 내성균의 유전정보와 통합적으로 구성되어 있지 않다. 따라서 과거 50년 동안 수집 및 축적된 항생제 내성균 및 유전정보와 함께 최근 한국에서 발생하고 있는 내성균에 대한 유전 정보를 통합적으로 관리하고, 내성균의 변화에 대응할 수 있는 신속한 프로브 설계 기능을 필요로 한다. 분자 진단을 위해서는 해당 서열을 구별해 낼 수 있는 프로브가 필요한데 변이가 생긴 유전정보가 누락된 프로브라면 아무래도 그 감수성이 감소하기 나름이다. 이에 항생제와 관련된 세균 및 그들의 유전정보를 종합적으로 관리, 프로브 설계 기능을 갖춘 시스템을 (주)인실리코젠에서 개발하였는데 이른바 IncoARG이다. 주요 기능은 다음과 같다.

질병, 항생제, 세균 및 유전자의 상호 연관 DB 구축
항생제별 주요 세균 종에 대한 마커 후보 발굴
마커 후보에 대한 프로브 및 프라이머 디자인
항생제 내성 유전자의 딥러닝 기법을 통한 감수성 예측 모델 개발(예정)

[그림 5] IncoARG 화면 일부

어린이와 항생제

최근 항생제 내성과 관련하여 “국내 항생제 사용량, 여전히 OECD 1위 오명”, “CDC도 두 손 든 ‘악몽의 박테리아’.... 이대론 국내병원서 CRE 토착화 시간문제” 등과 같은 다양한 뉴스가 쟁점이 되고 있다. 실제로도 어린이들이 병·의원을 방문하게 되면 항생제는 거의 필수적으로 처방되고 있어 어린 나이에서부터 항생제에 노출된 것이 현실이다. 이에 부모들 사이에는 자식과 관련된 항생제 내성 문제를 외면할 수 없어 될 수 있는 대로 항생제를 처방하지 않는 병원이 인기라고 한다. 그러나 항생제를 전혀 사용하지 않는 것이 제일 나은 방법은 아니다. 특히 쉽게 치료할 수 있음에도 치료가 되지 않아 자주 병원을 방문할 뿐 아니라 환자에게도 감염이 확대될 수 있음을 충분히 인지해야 한다.

참고자료

"봉와직염 진단 중 30%는 오진"
https://www.mk.co.kr/news/photo/view/2016/11/774683/
Tackling Drug-resistant infections globally: Final report and recommendations, The review on antimicrobial resistance chaired by Jim O'Neill, May, 2016.
항생제 특허 분석 보고서. 2017년 농림분야 생명자원 특허 DB 수집 및 분석 사업
약제 내성 문제에 대한 정보학 관련 연구 동향. 오석준

BS실 이규열 책임 개발자

Posted by 人Co

Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/312

가상 세포를 사용한 세포 프로그래밍 언어

Posted at 2019/03/28 09:47
Filed under 생물정보

합성생물학 분야에서 컴퓨터 안에서 설계되어 작동하는 가상 세포(virtual cell)라는 개념이 있다. 단백질과 DNA, RNA 같은 분자물질 수준에서 생명현상을 연구하는 실험실 연구 방식과 달리, 세포의 대사 전반적인 과정을 컴퓨터로 구현해 생명 현상을 연구하고, 이를 미생물 공학에 응용하려는 방법이다. 이와 같이 세포는 사이버 공간에서 존재하므로, 소프트웨어는 세포의 대사 과정을 구현하는 중요한 연구 도구로써 사용되고 있다. 세포의 유전자 형질을 바꾸는 작업을 프로그래밍에 비유할 수 있는데, 즉 특정 대사 기능을 하는 DNA를 하나의 회로 설계로 간주하고, 이를 전자기기 논리회로 설계처럼 할 수 있는 합성생물학 프로그래밍 언어가 개발되었다.

"Cello" 라는 프로그래밍 언어는 미국 MIT의 합성생물학자인 Christopher Voigt와 보스톤대학, 미국표준기술연구소(NIST) 등의 연구진에 의해 개발된 생명체 DNA 회로 설계를 자동화하는 프로그램이다. 전자회로 프로그래밍 언어인 'Verilog'를 응용하여 세포의 유전자 회로를 설계하고, 이를 세포 내에 구현해 그 기능을 볼 수 있게 한 것이다.

[그림 1] cello logo (출처:http://cellocad.org)

유전자 회로 구성의 기본 원리는 유전자 발현을 조절하는 인자와 그 발현의 산물을 또 다른 유전자 회로의 활성인자(activator)나 억제인자(repressor)로 사용하게 하는 것이다. 유전자 회로의 입력으로는 산소, 당, 빛, 온도, 산성 등과 같은 환경 조건과, 다른 환경 조건을 탐지하는 감지인자를 직접 설계하여 줄 수 있다. 이러한 과정으로 활성화 및 생물학 반응을 일으키는 활성인자를 조합함으로써, 특정 대사 기능 유전자 회로를 설계할 수 있다. 이런 입력과 산출 과정에서 마치 전자회로 게이트들의 스위치 온/오프(on/off)와 같이 여러 유전자의 활성을 일으키거나 억제를 하면서 특정 반응의 회로를 구성하게 된다.

예를 들어, 두 개의 신호가 들어와 두 종류의 단백질을 발현하게 하고 그 발현된 두 종류의 단백질 모두가 합쳐져서 어느 다른 유전자 발현을 활성화하면 'AND 게이트'가 되고 억제하면 'NAND 게이트'가 되고, 둘 중 하나의 단백질만 가지고도 ON을 시킬 수 있으면 'OR 게이트'가 되는 원리이다.

유전자 회로 프로그래밍 언어는, 일반적인 프로그래밍 언어가 0, 1의 기계어로 번역되는 것과 마찬가지로 DNA 염기서열로 번역되고, 유전자 회로의 염기서열을 실제의 미생물 세포에 삽입해 실제로 설계에서 의도한 형질이 발현되는지 확인하는 과정을 거친다.

[그림 2] cello 프로그래밍 과정 (출처:http://cellocad.org)

이번 연구성과는 전자기기 논리회로 설계 방식과 마찬가지로 유전자 논리회로를 간편하게 구성할 수 있음을 보였다. 이는 유전자 회로도 결국에 활성화(activation)와 억제(repression) 등의 간단한 이진법적 스위치로 조절할 수 있음을 보여준 것이다.

이를 이용하여, 자동차를 실제 제작하기에 앞서 컴퓨터 가상 공간에서 세부 내용을 설계해 성능을 미리 확인해보듯이, 세포 생명의 부품이 되는 유전자 회로들을 프로그래밍 언어로 설계해 논리적 연산의 작동을 확인해봄으로써 살아 움직이는 세포의 새로운 형질을 미리 확인할 수 있다.

유전자를 변형해 대사 과정을 바꿈으로써 유용한 약물이나 희귀물질, 에너지 연료를 생산하는 미생물을 개발하는 과정은 무수한 시행착오를 거치며 이뤄지게 마련인데, 특정 대사 기능의 유전자 회로를 미리 설계하고서 제대로 작동하는지 확인함으로써 실제 미생물 실험의 시간과 비용을 대폭 줄일 수 있다.

또한, 단순히 시간과 비용만 줄이는 것이 아니라 우리가 그냥 생물학적으로 생각만 해선 설계하기 어려운 복잡한 회로들도 만들어 여러 가지 테스트를 해볼 수 있고, 최종 후보들에 대해 실제 실험을 할 수도 있다.

이처럼 감지와 반응의 유전자 회로를 정밀하게 설계할 수 있다면, 종양을 감지하면 약물을 분비하는 장내 미생물이나, 부산물의 독성이 많아지면 발효 과정을 스스로 멈추는 이스트 세포들 같은 유용한 물질을 분비 및 생산하는 미생물 같은 것을 만들 수 있으므로, 생물공학 분야에서 상당한 쓰임새가 있을 것이다.

더 정교한 회로들이 만들어질 수 있는 토대가 마련됐다는 것에서, 유전자 회로 설계의 자동화 기법이 합성생물학 분야에서 대표적인 연구결과가 될 만하다고 평가받았다. 앞으로 더 많은 회로를 제작하고 그 많은 회로가 서로 연결되어 더욱 복잡한 조절/대사 회로(regulatory/metabolic circuit)를 만들어가는 방향으로 발전할 것이다.

과거 (주)인실리코젠에서도 합성생물학 유전자 회로 디자인 및 관리를 위헌 시스템을 구축한 적이 있다. 좀 더 자세히 말하면, 유전자(DNA) 단위로 모듈화 데이터베이스를 구축 후 회로도를 직접 디자인하는 시스템을 구축한 사례이다. 이는 유전자회로 구성 방법에 관해서 관심과 시행착오를 겪었던 소중한 경험이었다.

[그림 3] 인실리코젠에서 구축한 유전자 회로 디자인 및 관리 시스템 (PartBank) 화면, 2014

생물 프로그래밍 기법은 복잡한 생물학 전문지식을 갖추지 못한 비전문가도 프로그래밍 언어의 도움을 받아서 원하는 기능의 유전자 회로를 손쉽게 설계할 수 있는 시대가 올 것이다. 이는 유용한 물질을 생산하는 ’세포 공장’의 활용 영역이 더욱 넓어지리라는 기대와 함께 바이오 해저드와 같은 안전과 환경 문제에 대한 우려와 대책도 더욱 필요해짐을 보여주는 것이기도 하다. 따라서, cello가 제시한 아이디어와 시스템 구축 경험을 잘 조합한다면, 다른 관점에서 생물을 정보화하는 재미있는 무언가를 보여 줄 수 있을 것이다.

참고자료

http://cellocad.org
http://scienceon.hani.co.kr/385489
https://youtu.be/SLn_SkL7vkQ <참조 3. Cello 데모영상>

작성 : 대전지사 신동훈 개발자

Posted by 人Co

Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/308

올겨울 내내 힘들었던 독감, 인플루엔자 바이러스….

Posted at 2019/03/02 22:44
Filed under 생물정보

언제부터인지 우리는 쌀쌀해진 기온이 코끝을 스치면 독감 예방주사를 맞고 겨울을 준비한다. 독감은 일반적인 감기와는 달리 전염성이 매우 크고 폐렴으로 이어지는 경우가 많아 일반인들에게도 다르게 인식되어 있다. 그도 그럴 것이 감기는 서로 다른 여러 종류의 바이러스들로 유발되지만, 독감은 '인플루엔자 바이러스'라는 명확한 질병체가 밝혀져 있고 그 치료제도 개발되어 있다. 그런데 왜 매번 다른 독감 예방접종을 하고, 증상이 조금씩 다를까? 그 이유는 매우 똑똑한 진화를 거듭하며 스스로 변화하고 있기 때문이다.

인플루엔자 바이러스 구조

[그림 1] 인플루엔자 바이러스의 구조

(출처 : 이일하 교수의 생물학 산책, 이일하)

독감 인플루엔자 바이러스는 nucleocapsid (NP)와 matrix (M) 단백질의 차이에 의해 크게 A, B 및 C형으로 구분된다. 이중 잦은 변이를 일으키며 사람에게 질병을 유발하는 것은 A형으로 바이러스 표면에 존재하는 헤마글루티닌(HA)과 뉴라미니데이즈 (NA)의 다양한 조합으로 그 형태를 변화시키고 있다. 현재 밝혀진 헤마글루티닌의 sub-type은 16개(H1~H16), 뉴라미니데이즈의 sub-type은 9개(N1~N9)로 대략적인 조합수를 생각해 봐도 144개의 다른 인플루엔자바이러스가 만들어질 수 있음을 알 수 있다. 그러나 더욱 문제가 되는 부분은 이러한 조합을 통한 변이 발생이 사람만을 숙주로 하는 것이 아니라 조류와 돼지에서도 발생이 되고, 서로 공유되어 더 다양한 변이가 발생할 수 있다는 것이다. 현재까지 보고에 의하면 사람에서는 주로 A/H3N2형, A/H1N1형 및 B형이 유행하고 있는데 변이를 통해 새로운 바이러스 주가 출현할 경우 유병률과 사망률이 많이 증가하는 것으로 보고되고 있다. 때문에, WHO를 중심으로 전 세계 인플루엔자 감시체계가 운영 중이며 그 유전자형을 밝혀 백신주와 처방제를 제시하는 등 유행에 대비하고 있다.

그렇다면 어떻게 올해 유행할 백신주를 제시하는 걸까?

일반적으로 WHO는 매해 2월 해당연도에 유행할 백신주를 제시하고 있는데, 이는 지난해 남반구에서 가장 유행한 A형 바이러스 2종류와 B형 바이러스 1종을 선정하여 북반구 지역의 나라들에 제시한다. 이를 백신화 한 것이 3가 백신이고, 여기에 B형 1종을 추가한 것이 4가 백신이 된다. 참고로, B형은 2개의 sub-type이 존재하는데, 이 중 한 종류의 항체만 가져도 나머지 한 종에 대한 방어를 어느 정도 수행할 수 있으므로 3가 백신만으로도 충분할 수 있다. 또한, 예방 접종 후 항체 형성은 2주, 효과는 6개월 정도 지속된다고 한다.

바이러스의 유전자형은 어떻게 판별되는 것일까?

유행하는 바이러스의 유전자형은 qRT-PCR을 통해 빠르게 확인한다. 이때, NP, M 또는 HA 유전자를 증폭시켜 유전자 염기 서열을 비교 분석 하게 된다. 각 sub-type은 재조합 변이에 따라 서로 유사 정도가 다른데, 그림 2와 같이 크게 두 그룹으로 구분되어 진다. 이러한 유전자 변이 정도에 따르면 H1, H2, H5, H6의 경우 모두 H1에서 변형된 형태로 볼 수 있다. 이러한 정보는 이후 임상학적 표현형이나, 숙주(사람, 조류, 돼지 등)의 기원을 예측할 수 있고, 나아가 예방, 예찰의 자료로 활용된다.

독감 즉 신종플루 치료제 타미플루의 기작은 어떻게 될까?

인플루엔자 바이러스는 숙주세포의 표면에 sialic acid를 포함한 receptor에 부착한 후 8개의 segments로 구성된 바이러스 유전체를 숙주세포의 세포질로 밀어 넣는다. 이때, 세포막 일부가 유입된 유전체 서열의 막을 형성하는 엔도좀을 형성하게 된다. 형성된 엔도좀 내부는 낮은 pH를 유지하게 되는데, 이로 인해 바이러스의 lipid layer, 즉, 껍질이 분해되고 바이러스 핵산이 세포질에 노출되게 된다. 노출된 핵산중 heterotrimeric influenza polymerase (FluPol)를 코딩하는 유전체만이 숙주세포의 핵 안으로 이동하게 된다. 이후 숙주세포의 polymerase CTD (c-terminal domain)를 인지하여 바이러스의 유전자를 역전사시키고 복제시킨다. 절대적으로 숙주 세포의 시스템을 활용하여 바이러스 유전자를 대량 복제시키는 시스템으로 이를 cap-snatching 이라 하며, 이로 인해 숙주 세포의 유전자가 발현되지 않는 것을 host shut-off라 한다.

숙주세포의 시스템을 이용해 다량 생산한 바이러스 단백질들은 다른 세포로의 이동을 위해 virus particle을 형성하고 숙주세포로 부터 떨어져 나와 다른 세포로 확산된다. 이때, 바이러스는 HA와 NA를 표면에 이미 배치하고, 숙주 세포의 표면에 존재하는 sialic acid와 HA가 최종 결합되는 구조를 형성한다. 이후 NA(neuraminidase)는 근처의 HA와 sialic acid 결합을 끊어 세포로부터 분리 되게 한다. 타미플루는 이러한 바이러스 생활사 중 NA의 활성을 억제하여 다른 세포로의 확산을 방지하는 방법으로 바이러스에 대응하고 있어야 한다. 바이러스의 증식은 일반적으로 감염 후 48시간 이내에 모두 이뤄진다. 따라서 타미플루의 복용은 감염 후 48시간 이내에 이뤄져야 NA 활성을 낮춰 세포 내 확산을 막을 수 있다.

작성 : RDC 신윤희 센터장

Posted by 人Co

Tag: Bioinformatics, insilicogen, 인실리코젠
Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/306

프로바이오틱스 (Probiotics)

Posted at 2018/11/05 09:06
Filed under 생물정보

[그림 1] 장내에 서식하는 다양한 미생물

https://www.probaclac.ca/best-probiotic-for-you

사람의 체내에는 수많은 미생물이 살고 있다. 체내 미생물들만 따로 추려 무게를 재면 약 1~1.5kg 정도라고 한다. 이러한 미생물들은 사람의 몸 곳곳에 존재하는데, 가장 많이 서식하는 곳이 바로 사람의 장이다. 미생물들은 여러 종이 서로 군집을 이루며 서식하게 되는데 이를 미생물 균총(菌叢, colony)이라고 한다. 사람의 장내에서 크게 다섯 종류의 Phylum(문)이 - Bacteroidetes, Firmicutes, Actinobacteria, Proteobacteria, Verrucomicrobia - 균총의 주를 이루고, 이 중 Bacteroides문과 Firmicute문이 약 80% 이상을 차지한다. 이 미생물 균총은 숙주가 섭취하는 음식이나 건강 상태 등에 의해 변화하며 영양소 대사 과정이나 면역 반응 등에 관여하는 것으로 알려졌다.

2006년 제프리 고든 박사는 비만한 쥐와 그렇지 않은 쥐의 장내 미생물을 무균 쥐에 각각 투입한 뒤 같은 먹이를 먹였을 때 비만한 쥐의 장내 미생물을 투입한 쥐가 더 살이 잘 찐다는 연구를 발표했다. 이는 장내 미생물이 숙주의 대사에 영향을 미친다는 점을 시사하여 학계에 큰 반향을 일으켰다. 이후 체내 미생물들에 관한 다양한 연구들이 진행되면서 이들이 비만 등의 대사성 질환뿐 아니라, 신경계 질환이나 노화 등 다양한 질환과 관계가 있다는 사실이 밝혀졌다.

이렇게 미생물 총이 인간의 건강에 미치는 영향들이 밝혀지면서 건강한 장내 미생물 균총을 도움이 된다고 알려진 프로바이오틱스(Probiotics)가 세계적으로 주목받고 있다. 세계보건기구(WHO)에 따르면 프로바이오틱스란 체내에 충분한 양이 투입되었을 때, 건강에 좋은 영향을 주는 살아있는 균을 뜻한다. 즉 하나의 물질이 아니라 살아있는 균들을 말한다. 이 균들 중 대다수는 유산균, 비피더스균 등이 발효 식품에서 주로 찾아볼 수 있는 균들이다. 최근 프로바이오틱스는 분말이나 발효유 등과 같은 형태로 상품화되어 건강기능식품으로써 약국 등에서 판매되고 있으며 국내 건강기능 식품 분야에서 빠르게 성장하고 있다. 2017년 기준 식약처의 조사에 따르면 프로바이오틱스는 홍삼, 비타민에 이어 세 번째로 큰 시장을 형성하고 있는 것으로 볼 수 있다(그림2 참조). 프로바이오틱스는 안정성과 기능성을 기준으로 선발되며, 한국의 식약처는 19종의 균을 프로바이오틱스 균주로 인정하고 있다(표1 참조).

[그림 2] 2017년 건강기능 식품 품목별 매출 현황
식품의약품안전처, 건강기능식품 생산실적 통계 (2017)

[그림 3] 프로바이오틱스 균주
프로바이오틱스의 안전한 사용을 위한 연구(2016) 한국보건의료연구원

장내에서 균총을 이루며 서식하게 되는 프로바이오틱스가 체내에서 어떠한 역할을 하는지 밝히는 연구가 지속해서 진행되면서 프로바이오틱스들의 메커니즘들이 밝혀지고 있다. 균주별로 다른 기능을 하는 것으로 알려졌지만, 지금까지 알려진 프로바이오틱스의 기능은 다음과 같다.

체내에서 소화되지 않는 탄수화물을 분해하고 지방산, 비타민 아미노산 등을 합성하여 소화 및 대사를 돕는다.
프로바이오틱스가 생산하는 대사물질들이 유해균의 증식을 억제하고 유해균이 장내 상피세포에 부착하는 것을 저해함으로써 장내 균총을 안정화시킨다.
면역 기능을 조절하는 cytokine의 발현을 억제하거나 유도하여 면역 기능을 개선하는 역할을 한다.
대사과정에서 생성되는 유기산 등이 콜레스테롤 합성을 저하해 전체 혈중 콜레스테롤 농도를 낮춘다.

[그림 4] 프로바이오틱스 섭취 시 기대되는 효과

http://www.bmbtrj.org/viewimage.asp?img=BiomedBiotechnolResJ_2018_2_1_1_226581_f1.jpg

그러나 프로바이오틱스의 효과는 알려진 것보다 크지 않다는 연구결과도 있다. 최근 한 연구에서는 프로바이오틱스를 섭취한 사람의 장내 미생물과 대변의 미생물을 조사한 결과 대변과 장내 미생물 균총의 일부만 연관성이 있다는 연구 결과를 발표했다. 프로바이오틱스를 섭취한 대다수 사람의 대변에서는 프로바이오틱스 균이 발견되었지만, 사람의 장내에서 균주가 정착하지 못한 경우가 더 많다는 결과를 보인 것이다.

[그림 5] 프로바이오틱스 섭취 시 발생할 수 있는 부작용

https://www.positivehealthwellness.com/infographics/5-possible-side-effects-probiotics-infographic/

부작용에 관한 사례도 보고되고 있다. 국내에서도 프로바이오틱스가 원인으로 추정되는 부작용 신고사례가 2009년 이후로 건강기능식품 부작용 신고센터에 꾸준히 접수되고 있다. 주로 나타나는 부작용으로는 복부팽만감, 두통, 설사, 알레르기 같은 면역 과민 반응 등이 있다. 또한, 과다 복용 등 잘못된 복용방법이나 섭취 위험군이 섭취한 경우 감염 등의 부작용에 의해 사망에 이르는 일도 있다. 특히, 미국 FDA에서는 프로바이오틱스 섭취 고위험군(면역억제환자, 구조적 심장질환 환자 등)을 따로 분리하여 프로바이오틱스 섭취에 주의할 것을 경고하고 있다. 또한, 장구균(Enterococcus)의 경우 항생제 내성을 가지게 하는 유전자를 가진 균주로 장내 미생물 균총 내에서 항생제 내성 유전자 확산 가능성이 우려되며 이에 관한 연구도 진행되고 있다.

아직 논란의 여지는 있지만, 여러 연구의 성과로 프로바이오틱스가 체내에서 어떤 역할을 하는지 밝혀지고 있고, 어쩌면 의료용 혹은 치료 약물로써 인류의 건강에 중요한 역할을 하게 되는 미래가 올지도 모른다. 다만, 현재까지의 프로바이오틱스는 어디까지나 건강보조식품임을 기억하고 복용하는데 주의를 기울여야 할 것이다.

참고문헌

건강기능식품 생산실적 통계 (2017). 식품의약품안전처
고재성. 2013. 장내 미생물총과 인간의 질병. Korean J Gastroenterol
프로바이오틱스의 안전한 사용을 위한 연구 (2016). 한국 보건의료 연구원
프로바이오틱스. 네이버 지식백과
장성재. 2018. 프로바이오틱스 분야의 현주소
https://m.blog.naver.com/logindrug/221172566869
https://www.ibs.re.kr/cop/bbs/BBSMSTR_000000000902/selectBoardArticle.do?nttId=15343
https://www.healthline.com/nutrition/probiotics-side-effects

작성자 : BS실 박혜선 주임

Posted by 人Co

Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/296

HIV 잠복세포와 AIDS(Acquired Immune Deficiency Syndrome)

Posted at 2018/10/19 08:40
Filed under 생물정보

"2013년 우리나라의 에이즈 감염자는 누계 1만 명을 넘어 공식적으로 에이즈 확산 위험 국가가 되었습니다. 2008년 백신 개발 국제 심포지엄에서, 한국은 에이즈 감염자가 잠복기를 거쳐 '폭발 직전'이라는 발표가 있었습니다. 한국에이즈학회 부회장은 '미국이나 태국의 사례를 보면 에이즈 감염자가 1만 명을 넘어서면서부터 신규 감염자가 기하급수적으로 증가한다. 우리도 이와 비슷하게 에이즈가 증가할 가능성이 크다'며(동아일보, 2008.4.4.) 한국이 에이즈 확산 위험 국가가 될 것을 경고한 바 있습니다."

한국은 "에이즈 위험국가?" 그것도 틀렸다. 中 발췌
http://www.newsnjoy.or.kr/news/articleView.html?idxno=220301

위와 같이 2014년에 건강한 사회를 위한 국민연대 블로그에 "한국은 에이즈 위험 국가?" 라는 글이 올라오면서 많은 이슈가 되었다. 하지만 최근에 이 블로그 글에 대한 해명 자료가 발표되면서 AIDS(후천성 면역결핍증, Acquired Immunodeficiency Syndrome)와 HIV(인간면역결핍바이러스, Human Immunodeficiency Virus)에 대한 대중의 관심이 높아지고 있다.
이들이 말하고 있는 "에이즈 위험 국가"라는 게 무엇인지 짚기 전, 또한 감염인이라고 하여 차별받지 않도록 먼저 HIV와 AIDS에 관해 공부해보도록 하자.

우리 몸의 면역시스템

우리 몸의 면역시스템은 다음과 같이 간단하게 설명할 수 있다. 먼저 우리 몸에 Non-self한 병원균(pathogen)이 들어오게 되면, 초기에 macrophage, NK cell 등의 대식세포가 병원균을 인식하고, 해당 병원균의 정보를 Helper T-cell로 전달하게 된다. 그 병원균의 정보를 통해 killer T cell이 해당 병원균을 직접 죽이거나 B cell을 통해 그 정보를 기억해 두었다가 이후에 다시 침투하였을 때 병원균이 작용하지 못하도록 항체를 만들어 물리치고 있다.

[그림1] 면역반응 시스템
출처 : https://www.quora.com/How-do-our-immune-cells-recognize-self-and-nonself

HIV와 AIDS의 정의

HIV는 Human Immunodeficiency Virus로 인간의 면역체계를 파괴하는 레트로 바이러스이다. 즉 단백질과 RNA로 된 바이러스로 구성되어 있다. 우리 몸에 침투한 HIV 는 바이러스의 정보를 다른 세포들에 전달하는 Helper T-cell 중 하나인 CD4+ T-cell 을 공격한다. 우선 CD4 T-cell 에 구멍을 뚫고, 자신의 RNA를 세포 속에 집어넣는다. 세포 안에 들어간 RNA는 ‘역전사효소’라는 효소를 만들어 DNA로 변신한 다음 CD4의 DNA 속에 끼어들어 간다. 다음은 CD4를 이용해 수백~수천 개 HIV로 증식한다. 충분히 증식한 HIV는 CD4의 ‘자살유전자’를 활성화시키는 것으로 알려졌다. 즉 이용가치가 끝난 CD4에게 ‘자살하라’는 명령을 내림으로써 CD4를 죽게 만드는 것이다. 이를 통해 CD4가 혈액 1ml 안에 2백 개 이상 떨어지게 되면, 우리 몸의 면역 체계가 무너지게 되어 평소 쉽게 퇴치했던 병균들이 우리 몸을 유린하게 된다. 이를 후천적 면역결핍 증후군(AIDS)라고 한다.

[그림2] HIV life cycle

출처 : https://blog.lass.org.uk/2011/09/28/hiv-treatment-at-500-cd4-level-would-put-half-of-patients-in-need-of-art-within-a-year-of-seroconversion/

HIV의 감염

HIV의 전파는 바이러스 또는 바이러스에 감염된 세포가 있는 체액의 접촉을 통해 이루어진다.

의학계 통계에 따르면 HIV가 체내로 유입될 확률은 보균자의 혈액을 직접 수혈받을 때가 95% 이상, 감염된 산모가 출산하였을 때 아기가 보균하게 될 확률이 25~30%, 의료행위 중 사고가 0.3%, 성관계를 통한 확률이 0.1~1%로 나타나고 있다. 그러나 대부분의 감염 즉, 약 98% 이상의 HIV가 전염되는 경우는 성관계를 통한 전염이라고 한다.
많은 사람들이 에이즈의 전염 경로를 오인하여 보균자들이 불가피하게 사회로부터 고립되는 경우가 종종 있다. 침, 땀 등의 타액 또는 감염인과의 피부접촉, 모기 등으로는 전염되지 않는다고 하니 특별한 의료사고가 일어나지 않는 한 AIDS에 걸릴 일은 상당히 드문 일이다.

[그림3] HIV 감염경로

출처 : http://m.koreahealthlog.com/news/articleView.html?idxno=22076

HIV 잠복세포

HIV 감염환자에 대한 anti-retroviral therapy 등의 치료법 도입으로 인해 HIV로 인한 사망률이 크게 낮아지고 있다. 그러나 HIV virus의 일부는 잠복감염 상태로 비활성화되어 CD4 T-cell 에 삽입된 채로 치료법으로도 완벽히 제거되지 않아 치료를 중단하게 되면 재활성화되는 것으로 알려졌다. 이러한 잠복감염 세포까지 완전히 제거하는 것이 HIV의 완전한 치료이므로 HIV 잠복세포의 메커니즘과 제거를 위한 연구가 다각도로 이루어지고 있다.

[그림 4] HIV의 잠복
출처 : HIV latency and reactivation model(Cohen et al., 2011)

HIV 잠복세포와 후성유전적 요소의 역할

HIV 잠복감염의 메커니즘을 밝히기 위하여 인간 게놈상의 virus 삽입 위치, Tat 혹은 Rev와 같은 virus 단백질의 역할, 숙주 세포의 전사 인자나 microRNA와 같은 조절인자, virus 삽입 위치의 히스톤 변형 혹은 메틸화와 같은 크로마틴 상태 등 다각도로 연구가 진행되고 있다. 그 중 특히 HIV 잠복세포 내의 삽입된 HIV 전사 작용이 후성유전적으로 이루어지고 있다는 보고가 아래와 같이 지속해서 이루어지면서 HIV 만성감염 세포에서 HIV 5' LTR의 후성유전학적 변형이 HIV의 전사 및 복제를 조절하는 것을 확인할 수 있었다.

히스톤 아세틸화를 제거하는 효소인 HDAC은 YY1, LSF, CBF1과 같은 숙주의 전사인자들에 의하여 HIV의 LTR에 결합하여 HIV의 전사를 억제함(Gordon et., al 2006, Ylisastigal et al., 2004, Williams et al., 2006).
전사 유도와 주로 관련이 있는 히스톤 아세틸화와는 달리, DNA 메틸화는 발현 유도와 억제 기능이 모두 알려졌는데, 그 중 H3K9me3 변형은 SUV39H1 효소에 의해 매개되어 HIV LTR에 heterochromatin 을 형성함으로써 전사를 억제함(du Chene et al., 2007).
다른 전사 억제효소인 CTIP2는 HDAC1, HDAC2, SUV39H1, HP1 단백질들을 유도하여 heterochromatin 을 형성함으로써 HIV 전사 억제를 유도함(Marban et al., 2007)

[그림 5] HIV 잠복세포를 조절하는 후성유전학적 기작

출처 : Epigenetic regulation mechanism of HIV latency cell(Coiras et al., 2009)

참고 영상

(1) HIV/AIDS 치료는 왜 그렇게 어려울까요 - 쟈넷 이와사(https://youtu.be/0TipTogQT3E)

(2) 인간 면역 결핍 바이러스, HIV란?(https://youtu.be/uMGtJa7jPo4)

작성자 : DSC 박 원

Posted by 人Co

Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/295

Search Results for '생물정보'

80 POSTS

디지털 육종과 표현형 데이터 - 표현형 데이터가 디지털 육종 시대를 이끌다.

CLC Genomics Workbench를 이용한 SARS-CoV-2의 MinION 시퀀싱 데이터 분석

MPEG-G, 유전체 파일 압축의 표준화를 위한 노력

나만 몰랐던 BLAST 꿀팁

체외 진단기기(In Vitro Diagnostics, IVD)

IncoARG, 신속하고 정확한 항생제 내성 진단 키트 제작을 위한 플랫폼

봉와직염(蜂窩織炎: cellulitis)

봉와직염과 항생제

항생제와 내성

항생제 내성 기작

IncoARG

어린이와 항생제

참고자료

가상 세포를 사용한 세포 프로그래밍 언어

올겨울 내내 힘들었던 독감, 인플루엔자 바이러스….

프로바이오틱스 (Probiotics)

참고문헌

HIV 잠복세포와 AIDS(Acquired Immune Deficiency Syndrome)

Categories

Recent Posts

Archives

Tag Cloud

Site Stats