[구버전] 人Co BLOG

임상유전체란?

유전체 염기서열 및 오믹스(Omics) 분석을 통해 얻은 정보를 이용하여 환자의 질병 진단과 맞춤 치료에 사용하고자 하는 분야이며, 차세대 염기서열 분석(NGS, Next Generation Sequencing) 기술의 비약적인 발전으로 최근 크게 성장하고 있다.

많은 의료 및 연구 기관들에서 임상유전체 정보를 분석하며 질병의 원인을 이해하고 진단과 치료에 활용하고자 하는 연구들이 활발히 이뤄지고 있다.

작년 3월, 우리나라는 차세대 염기서열 분석 기반의 유전자 패널 검사가 실시되면서 NGS를 통한 임상 유전체 데이터 생산이 급격하게 늘고 있고, 정밀의학 실현을 위하여 임상유전체 분야의 관심과 발달은 전 세계에서 미래 투자 산업으로 뜨겁게 떠오르고 있다.
.

<그림 1. 임상유전체 연구를 위한 NGS의 활용>

(사진출처 : https://www.researchgate.net/publication/235619509_Next_generation_sequencing_in_cancer_research_and_clinical_application)

.
임상유전체 분석을 쉽게 하는 방법

최근 NGS 데이터 분석이 대중화되긴 했지만 한정된 연구비 수준에서 NGS 데이터를 생산, 저장하고 분석하는 시스템을 구축하기는 쉽지 않다. 특히 대용량 데이터를 신속, 정확하게 분석하여 의미 있는 결과를 얻어내는 소프트웨어 기술들의 발전은 그 속도가 상대적으로 더딘 편이다.

또한, 일반적으로 대용량 데이터를 다루는 데 있어서 공개된 소프트웨어들은 커맨드라인 형식이 대부분이다 보니 생물정보를 접해보지 않은 연구자들에겐 더욱이 어려운 상황이다.

이러한 환경에서 대용량 임상유전체 분석을 쉽게 진행할 수 있는 솔루션을 소개해보고자 한다.
.

- NGS raw 데이터부터 변이 확인까지

일반적으로 NGS 시퀀싱 서비스를 수행하면 1차 분석결과까지 받게 되는 경우가 많다. 하지만 변이 분석은 파라미터를 어떻게 설정하느냐에 따라 결과가 다르고 원하는 영역의 변이 정보를 얻지 못할 경우가 있다.

Biomedical Genomics Workbench는 Human Genome의 NGS 데이터 분석에 특화된 GUI 기반의 소프트웨어이다. Somatic Cancer와 Hereditary disease의 변이 분석에 최적화되어 있으며, 다량의 샘플에 대한 복잡한 분석도 기본적으로 내장된 워크플로우 혹은 커스터마이즈한 워크플로우 제작을 통해 분석 효율성을 극대화할 수 있다.

더불어 다양한 NGS 플랫폼의 데이터 포맷을 지원하기 때문에 쉽게 raw 데이터부터 분석이 가능하고, 1000Genome, ClinVar, HapMap 등 다양한 public database들을 포함한 패키지를 손쉽게 다운로드 받아 사용할 수 있다.

그리고 변이분석 뿐만 아니라 RNA-seq 분석을 통해 발현량 및 발현패턴 분석까지도 수행할 수 있다.

<그림 2. 사용자 편의적인 인터페이스의 변이 분석>

(관련자료 : https://insilicogen.com/service/detail/85/)
.

<그림 3. 워크플로우의 제작>

- 의미있는 변이의 필터링

앞서 변이 정보들을 얻고나면 이 중에서 질병과 연관된 또는 질병을 일으키는 의미 있는 변이들을 찾아내야 한다. 하지만 수십만 개 변이 중에 원인이 되는 변이를 찾는 일은 단순하지 않다.

Ingenuity Variant Analysis(IVA)는 이러한 어려운 문제점을 해결해주는 변이 분석 플랫폼이다. 타겟 변이 리스트들을 생물학적 필터 기준을 통한 검증의 우선순위를 설정할 수 있고, 관심 phenotype에 관련한 변이 정보와 집단에 대한 통계분석 바탕으로 변이 정보를 필터링할 수 있다.

또한, 생물정보학적인 기술이 없어도 쉽게 다룰 수 있는 사용자 친화적인 인터페이스로 변이가 존재하는 유전자의 upstream/downstream의 1~2단계 내에서 변이 식별도 가능하다.

<그림 4. 변이정보의 필터링>

- 질병 유발 변이정보 확인

Human Gene Mutation Database(HGMD)는 문헌에 보고된 Human에서 유전질병을 유발하는 돌연변이 및 질병관련 정보들을 포함하고 있는 데이터베이스이다. 오랜 기간 전문가들의 큐레이션을 통해 안정화되었고, 현재 보편적으로 임상유전체 연구에서 활용되고 있는 데이터베이스이다.

온라인 버전의 경우는 쉬운 검색을 통하여 변이의 종류, 위치, 관련 질병 및 표현형, 표기되어 있는 논문 정보 등을 확인할 수 있고, 대용량의 변이 정보를 검색해야 하는 경우는 다운로드 버전을 통해 분석 파이프라인에 추가하여 활용할 수 있도록 제공되고 있다.

<그림 5. 데이터베이스 검색 시 제공되는 리포트>

이처럼 소개된 3가지의 솔루션은 현재 QIAGEN Bioinformatics의 제품군이다. QIAGEN은 Sample to Insight 전략으로 세계적으로 저명한 생물정보 기업들을 합병하면서 샘플 추출부터 생물정보 분석까지의 일련의 과정에서 연구자들이 문제를 직접 해결할 수 있는 환경을 만들고 있다.

하지만 단순히 솔루션만 보유한다고 정밀의학에 무조건 가까워지지는 않을 것이다. 구체적으로 어떤 임상 샘플을, 어떠한 기술을 이용하여, 질병과 연관된 해석을 통해 최종 결론을 내기까지 연구자들이 기술적인 부분을 많이 어려워하고 있다. 이러한 시장현황에 발맞춰 생물정보 기반의 임상유전체 분석 및 정밀의료 파이프라인 구축에 쉽게 활용 가능한 솔루션들과 컨설팅으로 (주)인실리코젠이 함께 할 것이다.

작성자 : Consulting팀 김경윤 선임

Posted by 人Co

인공지능이 우리 세상에 들어온다면 어떤 일이 일어날까?

로봇, 인공지능이 일상이 된 미래를 생각하면 “터미네이터(1984)”, “매트릭스(1999)”, “A.I(2001)”, "아이, 로봇(2004)”, “이글 아이(2008)”와 같은 영화들이 먼저 떠오른다. 이러한 영화에서 인공지능은 어떨 땐 인류를 위협하는 무기로, 또 어떨 땐 인공지능에 인간성을 부여하여 자신의 정체성에 고찰로 영화의 스토리를 그려나간다.

턱밑의 버튼을 누르면 가정용 로봇을 켤 수 있다.
예쁘게 포장되어 집으로 배송까지 완벽하게!
(사진출처 : http://www.channel4.com/programmes/humans)

영국에서 2015년도에 방영한 드라마에서 휴먼즈(Humans - 2015) 역시 로봇이 정체성과 자아를 찾아 나가는 과정을 그려내는 드라마이다. 그런데 드라마 시즌1의 1, 2편을 보면 우리의 일상에 스며든 로봇의 모습을 보여준다. 로봇은 이미 생활의 깊숙이 들어오면서 아버지의 노동을 대체하고, 보모, 간병인으로서 어머니의 역할을 대체하며, 인간만이 할 수 있다고 생각한 정신 상담사의 역할까지 로봇이 대체하는 모습을 보여준다. 영화에서 로봇의 이러한 모습은 가족으로서의 소외감을 가져오며, 순종적이며 자신의 말을 잘 들어주는 로봇으로부터 남편, 아내에게서도 느낄 수 없던 감정적 위안을 가져온다. 또한, 자녀들은 뭘 하더라도 로봇을 이길 수 없다는 박탈감에 인간으로서의 정체성을 위협받기도 한다. 이러한 로봇들은 일상생활에 인공지능이 스며들었을 때의 우리의 모습을 보는듯하여 터미네이터나 이글 아이 같은 영화처럼 극단적인 상황보다 더욱 현실적이고 무섭게 다가온다.

"7년이 걸려서 공부하면 뭐해 어차피 인조인간이 더 잘할 텐데!"

저 대사를 듣는 순간 정말 아무런 할 말이 떠오르지 않았다.

(사진출처 : http://www.channel4.com/programmes/humans)

인공지능. 머지않은 미래

인공지능은 "강한 인공지능" 과 "약한 인공지능"으로 나눈다. 약한 인공지능은 특정 지식에 대한 학습을 하고 이를 기반으로 결정을 내리는 인공지능이다. 약한 인공지능은 인공지능을 개발하는 사람이 몇 가지 기본적인 룰과 데이터를 입력하고 기계에 학습을 시켜 유의미한 결과를 판단하도록 한다. 그러므로 약한 인공지능은 목적에 따라 특정 데이터를 학습 및 판단하도록 개발되었으며 인공지능을 개발한 개발자의 목적에 따라 그 용도가 제한된다.

강한 인공지능은 소개한 영화와 드라마의 로봇들처럼 단순한 전문적 지식을 넘어 독립적인 자아를 가지고 있는 인공지능을 의미한다. 사물을 인지할 수 있는 지각 능력을 갖췄고, 이를 이해하고 생각과 결정을 내린다. 필요에 따라 스스로 데이터를 인지하고 학습하며, 보는 시각에 따라서 감정까지 있는 인공지능을 강한 인공지능이라고 정의한다. 강한 인공지능은 아직 현재 기술로 개발이 불가능하지만 여러 전문가들은 15~40년 뒤에 강한 인공지능 개발이 실질적으로 가능할 것으로 예측하고 있다.

강한 인공지능은 아직 개발되지 않았지만 약한 인공지능은 이미 수많은 개발이 이루어지고 활용되고 있다. 구글이 발표한 알파고는 난공불락의 섬이던 바둑을 점령하였고 자율 주행 자동차는 부분적으로나마 구현되어 테스트 중이며 몇몇 회사는 인공지능이 면접을 일부 대체하기 시작하였다.
약한 인공지능은 생각보다 실생활에도 많이 적용되어 있다. 자동차 자율운전의 1단계인 선택적 기능 제어는 이미 크루즈 기능으로 최근 차량에 탑재되었고 시리, 알렉스와 같은 음성인식 시스템은 언어의 수많은 억양을 학습하여 이를 단어로 인식할 뿐만 아니라 구글 번역 기능은 인공지능을 통해 훨씬 더 매끄럽고 자연스럽게 문장을 번역해준다. 또한, 페이스북은 우리가 올린 사진을 분석하여 촬영된 사람들에 대해 태그를 자동으로 달아주며, 유튜브, 구글 광고, 아마존에서는 우리가 자주 보고 흥미 있어 하는 주제를 토대로 맞춤형 동영상, 광고, 상품을 추천해준다.

인공지능은 이미 실생활에서 우리에게 좀 더 높은 질의 삶을 가져다주고 있으며 전문가들은 앞으로 인공지능으로 인해 발전할 미래 산업 가치는 무궁무진하다고 이야기한다. 하지만 인공지능이 우리의 장밋빛 미래만을 보장할까? 앞서 언급한 영화나 드라마에서처럼 인공지능이 양날이 검이 될 수 있다고 반박하는 전문가들도 많다.
이런 인공지능의 미래가치와 위험성에 대한 논쟁은 작년 7월 일론 머스크와 마크 저커버그가 트위터에서 벌인 논쟁 이후 본격화되었다.

관련 기사 : ‘AI 위협론자’ 머스크 vs ‘AI 낙관론자’ 주커버그
http://www.sisapress.com/journal/article/170598

인공지능은 문명 최대의 위협

테슬라의 CEO 일론 머스크는 과거부터 수차례 인공지능의 위험성을 경고하며 도입 이전에 선 규제부터 이루어져야 한다고 주장하였다.
테슬라는 FLI(자동작동 무기) 공동 질의서를 통해 인공지능이 탑재가 이루어진 자동 무기가 장착되면 큰 규모의 전쟁이 일어날 것이며, 전쟁 진행 과정도 사람이 인지하기 어려울 정도로 빨리 진행될 것이라 경고하였으며 이러한 인공지능 무기가 테러리스트들에게 넘어갔을 때 어떤 일이 일어날 수 있을지 주의해야 한다며 무기에 인공지능을 탑재하는 것은 판도라의 상자를 여는 행위가 될 수 있다고 경고하였다. 또한, 자율자동차에 대해서도 만약 자율자동차가 해킹될 경우 어떤 일이 일어나게 될지를 경고하며 인공지능의 도입 이전에 위험성을 인지하고 선 규제를 먼저 만들어야 한다고 주장하였다.

Wold Wide Web(WWW)의 창시자 중 한 명인 텀 버너스 리는 "기업용 인공지능이 회사의 수익을 위한 의사 결정을 하는 데 있어 기업의 공정성이 과연 유지될 수 있을까? 우리는 어떻게 받아들여야 하는가?" 라며 인공지능 도입의 위험성을 경고하였으며 (고)스티븐 호킹 교수, 빌 게이츠, 스티브 워즈니악 등 세계적 인사들 역시 인공지능이 강한 인공지능의 단계를 넘어선 "초인공지능" 단계에 접어들 경우 우리는 오히려 인공지능에 의해 지배받을 것이라고 경고하였다.

관련기사 : 스티븐 호킹 "AI 때문에 인류 멸종할 수도" 또 'AI 경고'
http://news.chosun.com/site/data/html_dir/2017/12/14/2017121401129.html

즉, 이들은 모두 사회가 인공지능에 지나치게 의존하게 될 경우, 인공지능이 여러 가지의 요인으로 우리가 예상할 수 없는 범위의 동작을 수행한다면 이미 되돌리기에는 늦을 것이라고 한목소리로 경고하고 있다.

인공지능의 미래 가치

위와 같은 여러 경고에도 불구하고 인공지능이 앞으로 우리에게 가져다줄 가치는 무궁무진하다. 글로벌 시장 조사 기관인 트랙티카 에서는 인공지능이 산업 전반에 걸쳐 영향을 미칠 것으로 예상하였으며 그 시장 규모는 2025년 기준 약 800억에 달할 것으로 예측하고 있다.

트랙티카 : 향후 (2016-2025) 인공지능 시장 전망
(출처 : http://www.bioin.or.kr/board.do?num=259141&cmd=view&bid=policy)

많은 전문가가 산업 전반에 인공지능을 도입함으로써 상당량의 노동력과 인건비 절감을 가져 올 것으로 예측한다. 이는 이미 아르바이트 수를 줄이고 무인 주문기가 속속 도입되고 있는 식당만 보더라도 확인할 수 있다.

또한, 인공지능을 이용하여 인건비 이외에도 수많은 자원을 효율적으로 아낄 수 있다. 예를 들어 버스, 철도, 배, 항공 등의 대중교통에서 현재 이용객들을 분석하여 시간별 대중교통 이용량을 예측하고 효율적으로 배분한다거나, 현재의 노선을 효율적으로 재배치한다면 많은 자원의 소모를 줄일 수 있다.

개개인의 입장에서도 인공지능을 이용하여 간편하게 통역하고 자율 운전으로 편하게 이동할 수 있게 되며 각종 산업 분야에서 개인별 맞춤 서비스를 통해 좀 더 나은 서비스를 보장받을 수 있다. 인공지능의 도입을 통해 수많은 장점을 얻을 수 있는데 이를 포기할 이유가 전혀 없다는 것이다.

인공지능의 숙제

앞에서 언급하였듯이 인공지능의 발전은 우리에게 많은 위협이 될 수 있다. 약한 인공지능이더라도 인공지능을 적용하는 분야에 따라 책임자가 없는 살상 무기가 될 수 있으며, 소통과 공감, 윤리적 감정이 배제된 의사결정이 이루어질 수 있다. 그리고 강한 인공지능을 넘어선 초인공지능의 단계에 접어들면 인공지능의 감정과 판단에 의해 우리의 삶이 위협받을 수 있다.
하지만 그럼에도 불구하고 현재 이미 많은 분야에서 약한 인공지능이 적용되었으며, 이로 인해 경제적 가치뿐만 아니라 개인의 삶 역시 급속도로 상승하고 있다. 인공지능이 우리 삶에 가져다줄 혜택을 버릴 수는 없는 것이다.

최근에는 이러한 인공지능의 혜택과 위험의 양면성에서 적절한 발전과 규제의 협의점을 찾기 위한 움직임들이 보이고 있다. 대표적으로 전 세계적 인공지능 산업 및 학계 전문가 17명이 인공지능 100년 연구를 목적으로한 AI100 연구단을 만들어 인공지능의 미래를 연구한다. 이들은 인공지능의 위험성으로 인해 인공지능의 잠재적 능력이 훼손되지 않도록 인공지능의 장점에 대해 토론하고 분석하며 연구한다.

A100 연구단의 모태가 된 2009년 아실로마학술회의 참석자들

(출처 : http://www.hani.co.kr/arti/economy/it/761039.html)

이외에도 인공지능의 규제에 관한 수많은 연구와 논의가 이루어지고 있으며, 이는 단순한 전문가 그룹을 넘어서 각 국가의 정책의 단계까지 논의되고 있다.

관련기사 : 英 의회 "AI의 사회·윤리·법률적 문제 발견, 규제 필요"
http://www.ciokorea.com/news/31563

이미 인공지능이란 주사위가 던져졌다. 어느 정도 인공지능이 궤도에 오르기 전에는 위에서 언급한 각종 문제점을 정확하게 예측할 수는 없으나 지금 글을 쓰고 동안에도 인공지능은 발전하고 있으며, 이를 발전시키는 연구자들과 위험성을 경고하는 전문가간의 실랑이는 계속될 것이다. 인공지능의 활용과 규제 사이에서 적절한 합의점을 찾는 문제는 앞으로 계속 풀어나가야 할 숙제이다.

작성자 : 데이터사이언스센터 권대건 주임개발자

Posted by 人Co

Search Results for '2018/04'

2 POSTS

임상유전체 분석을 위한 생물정보 솔루션

인공지능의 양면성

Categories

Recent Posts

Archives

Tag Cloud

Site Stats