한낮 더위에도 아랑곳하지 않고 야외 활동을 즐기는 9살 우리 아들의 호기심을 자극하는 가장 큰 것 중 하나는 우주 탐사와 해저 탐사이다. 아동 과학 도서의 절반 이상을 차지할 정도로 아이들의 호기심을 자극하는 이 얘깃거리들의 공통점은 무엇일까? 아마도 현실의 지식으로 해석되지 않은 신비로움일 것이다.
유한한 삶을 갖는 생물의 가장 기본적인 본성은 자손 번식이다. 바다 밑 깊은 곳을 비롯해 극한과도 같은 환경에도 생물은 관찰되는데, 오랜 세월 나의 자취를 남기기 위해 유전물질을 이용해 다음 자손에게 전달하고 변화되는 환경과의 상호 작용에 반응하며 변화를 축적해 종을 이어가는 것을 우리는 진화라 표현한다. 즉, 진화는 어떠한 환경이든 내 종을 이어가기 위한 노력으로 최선을 다해 진행되고 있고 이는 심해 속 생물들의 특징을 통해서도 확인된다.

그 첫 번째로 발광기관을 들 수 있다. 심해 속 동물들은 대부분 자웅동체이다. 넓디넓은 바닷속에서 자기 짝을 찾아 종족 번식을 한다는 것은 확률적으로 계산이 안 될 정도로 적을 수 있다. 이 때문에 대부분 자웅동체로 진화됐을 가능성이 크다. 그렇지 않은 경우, 이를 대신해 발달한 것이 발광기관이다. 캄캄한 바닷속에서 나와 같은 종족을 찾기 위해 무엇보다 크게 자극이 될만한 것은 빛이다. 이러한 발광 기관은 짝을 찾는데도, 먹이를 유인하거나 포식자를 피하거나 하는 데도 사용된다.


사실 수컷 아귀의 경우 태어나는 순간 부터 짝짓기를 위해 암컷을 찾아다닌다. 아귀는 어렵게 찾아낸 암컷을 절대 놓치지 않는 방법으로 몸을 하나로 만드는 방법을 택했다. 수컷은 암컷의 배를 물어 암컷의 피부가 본인과 연결되게 한 후 점차 하나의 몸으로 되게 하는데, 수컷의 입이 뒤로 이동해 아가미에 물을 공급하기 유용하게 변형되고 결국 수컷은 암컷의 부속물처럼 되어 영양분을 공급받게 된다. 곧, 암컷은 언제든 정자를 공급받게 되는 자웅동체와 같은 형태로 이후 종족을 이어 가게 된다.

두 번째는 근육 조직의 퇴화이다. 같은 면적당 동물의 밀집도가 극히 낮은 심해에서 먹이 대부분은 마린 스노우라 불리는 큰 생선들의 부식잔해물이다. 고래와 같은 큰 물고기가 죽고 나면 부패하여 심해로 떨어지는 눈과 같은 잔해물을 청소하듯 먹고 산다. 넓은 심해에서 살아 있는 생물을 헤엄쳐 잡아먹기에는 어려움이 많다. 에너지원이 될 먹이를 어쩌다 먹게 되는 생물이 살아남기 위해서는 에너지 사용을 최소화해야 하고, 이를 위해 택한 방법이 에너지를 소비하는 근육을 점점 퇴화시키는 것이다. 그래서 많은 심해 동물은 젤라틴 소재와 같이 특수한 재질로 되어 있으며, 이는 밀도가 물보다 낮아 물에서 쉽게 이동할 수 있다고 한다.


출처: http://m.blog.naver.com/vpaula/100144753111,
Blob fish라 불리는 물고기로 젤라틴성의 물질로 몸이 구성됨.

세 번째는 근육조직 퇴화와 유사하게 소화기관의 퇴화이다. 앞서 밝혔듯 대부분이 살아있는 생물을 잡아먹기는 쉽지 않은 환경이다. 마린스노우를 비롯해 암컷 아귀의 몸에 붙어 영양분을 공급받는 기생과도 같은 경우 외에도 박테리아와의 공생관계를 통해 소화기관을 최소화하고 삶을 살아가는 예도 있다. 심해담치류의 경우 몸의 일부에 박테리아가 잘 서식할 수 있도록 하고 이후 박테리아가 배설하는 부산물을 그대로 공급받으며 본인의 소화 기관을 모두 퇴화 시키는 경우가 그러하다.



출처 : http://www.fmkorea.com/393870071 심해담치류

깊은 바닷속 생물들은 어려운 환경과 상호작용하는 동안 근육과 소화기관을 퇴화시키면서도 가장 안정적으로 종족을 유지할 수 있도록 진화되었다. 진화는 1859년 촬스 다윈이 종의 기원에서 소개한 자연선택설에 기초하여 현재의 종이 환경과의 보다 적극적인 상호작용으로 탄생했다고 밝히고 있다. 심해라는 환경은 그러한 의미에서 앞서 언급된 점 외에도 높은 수압에 쉽게 이퀄라이징이 가능한 시스템을 비롯해 외부적인 자극이 거의 없는 즉 스트레스가 없는 환경에서 전체적인 생체 시계가 느리게 진행되는 점들이 진화의 결과물로 흥미로운 연구 대상이 된다. 최근 진화 연구는 다양한 유전체 연구를 통해 가속화되고 있고 이를 근간으로 흥미로운 환경에 적응된 종과 그 관련 유전적 기반이 무엇인지 밝히고자 하는 노력이 한창이다. 유한한 삶을 영원히 이어가고자 하는 종의 본능을 연구하기에 소재가 가득한 바닷속이다.


작성자 : R&D센터 BI그룹
신윤희 책임연구원

Posted by 人Co

2016/09/23 16:19 2016/09/23 16:19
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/223

한국폴리텍대학 임지희



Bioinformatics를 배우기 위해 짧은 시간 동안 다양한 곳에서 여러 경험을 해 본 저에게 人CoINTERNSHIP은 한 걸음 나아갈 수 있는 발판이었습니다. 그러므로 앞으로 이 분야에 대해 신중하게 생각하고 조금 더 가까워지고 싶으신 분들에게 꼭 추천하고 싶은 교육입니다. 각 관심 분야에만 빠지기 십상인 경우가 부지기수인데요. (주)인실리코젠에서 진행된 人CoINTERNSHIP은 교육과 인성이 함께 어우러지는 보기 드문 전문 교육이었습니다. 한 달 동안의 교육이지만 소속감을 충분히 느낄 수 있었고, 적극적인 자세를 통해 바로 피드백 받을 수 있는 좋은 환경 조건을 느낄 수 있었습니다. BI 교육과 업무 그리고 실습을 동시에 경험할 수 있으며, 비록 짧은 시간이지만 주어진 시간 동안 최선의 것을 배웠습니다. 회사에 계시는 분들 모두 멘토가 되어 선뜻 손 내밀어 주셨습니다. 그러므로 따뜻함을 느낄 수 있었고, 훈훈한 마음으로 교육받을 수 있었습니다. 그리고 함께한 인턴분들 덕분에 서로 의지하며 어려운 부분도 즐겁게 해낼 수 있었습니다.
앞으로 이곳에서의 한 달은 잊혀지지 않는 추억이자 진행형이 될 것입니다. 바쁘신 업무 중에도 신경 써 주시고 배려해 주셔서 감사드립니다. 그리고 이런 자리를 만들어 주신 최남우 대표님과 함께 이끌어주신 이사님들 그리고 선임님, 주임님, 선배님들 모두 감사드립니다. 좋은 가르침을 마음속 깊이 새기고 그 기운을 받아 어느 곳에서 Bioinformatics를 하던 기운을 불어넣을 수 있는 사람이 되도록 하겠습니다.
1년 중에 가장 더운 7월 한 달 동안 수고 많으셨습니다. 아마도 중복에 식당에서 전 직원분들과 함께 삼계탕 먹은 날은 잊지 못할 것입니다. 아무쪼록 건강하시고 행복하시길 바랍니다. 감사합니다.



한국폴리텍대학 신훈재



식품학 전공으로 식품회사에서 일하다 폴리텍대학을 통하여 생명 정보학을 처음 접하게 되었습니다. 1학기가 끝난 뒤 실무 적응 실습을 수행했어야 했는데, 人CoINTERNSHIP을 지원하여 약 1달 동안 (주)인실리코젠에서 함께 할 기회를 얻게 되었습니다.
人CoINTERNSHIP 커리큘럼은 매우 다양하고 잘 되어있습니다. 3일차까지는 회사 및 사회생활을 할 때 필요한 것들을 알려주시는데 매우 상식적인 내용이고 쉽게 쉽게 상황별로 이야기해주셔서 이해가 잘 되었습니다. 공통교육을 받으면서 인상 깊었던 부분이 3가지가 있었는데 첫 번째는 人CoDOM 이었습니다. 위키를 기반으로 만들어져 있고 Bio 분야에 관련된 정보들이 다양하여 배우는 사람 관점의 자료가 다양해서 매우 좋았습니다. 두 번째는 정은미 이사님께서 하셨던 말씀인데, 직원이지만 리더의 마음가짐으로 일하라고 말씀하셨습니다. 처음에는 리더의 마음은 무엇일까 고민을 했지만, 인실리코젠의 필수도서를 읽고 난 후 이해가 되었습니다. 세 번째는 보안인데, 군 복무를 공군 정보 특기로 하였기 때문에 보안에 대해 교육 받으면서 다시 한 번 중요성을 느낄 수 있었습니다. 2주차부터는 파이썬과 리눅스에 관해 기초부터 탄탄하게 알려주셨습니다. 학교에서 배웠던 내용보다 심화한 실무적인 내용으로 구성되어 있어 매우 만족스러웠습니다. 그리고 모든 직원분들이 친절하시고 소통도 잘되었고, 회사 문화까지 체험할 기회를 주셔서 감사하였습니다. 4주 동안 정말 시간이 아깝지 않을 정도로 좋았고 2016년 7월을 잊지 못할 것 같습니다.
마지막으로, (주)인실리코젠 최남우 대표님, 항상 웃으면서 대해주시고 또 바쁜 회사생활 속에서 약간의 자유를 느끼게 해주신 정은미 이사님을 비롯한 모든 분들께 감사의 말씀 전하고 싶고 人CoINTERNSHIP 이란 프로그램을 많은 취업 준비생들에게 추천해주고 싶습니다. "다시 한 번 인실리코젠에 감사드립니다."



경북대학교 신은경



2016년도 하반기 人CoINTERNSHIP에 참여한 신은경입니다. 제가 인턴십을 참여하게 된 계기는 Python, Linux, CLC Genomics Workbench, Main Workbench, 실제 생물 정보학에서 사용하고 있는 프로그램들에 대하여 배우고자 했던 이유와 앞으로 사회로 나갈 때 필요한 사회생활을 직접 경험하고 싶어 지원하였습니다.
(주)인실리코젠에서 한 달간 회사생활 하면서 다양한 업무들을 보고 경험해 보면서 모르는 문제에 대해서는 항상 눈높이를 맞춰 교육을 진행해 주시고, 알아듣기 쉽게 교육을 진행해 주셔서 처음 하는 프로그램들에 대하여 크게 거부감 없이 배울 수 있었습니다. 한 달 동안 회사에서 느낀 점은 직원분들 모두 맡은 일에 대하여 확신이 있고 일하는데 즐거움을 가진 모습을 볼 수 있었습니다. 이런 모습들을 보면서 저도 제가 비전을 가지고 즐겁게 일을 할 수 있는 생물정보학에서 분석 전문가가 되기 위해 노력을 해야 되겠다는 다짐을 다시 한 번 할 수 있었습니다. 인턴십을 하면서 저에 대하여 다시 생각해보고, 한 달이라는 짧은 시간 동안 같이 지냈던 인턴 동기들과 멘토 이제홍 주임님, 교육들을 담당하셨던 많은 선배님에게서 한 분도 빠짐없이 본받아야 할 점들을 많이 배우고 가는 것 같습니다. 한 달이 짧게 지나간 거 같아 무척 아쉽지만 제가 여기서 배우고자 했던 것들을 다 얻어 가는 것 같아 제 인생에서 기억에 남는 한 달이 될 것 같습니다.
폭염보다 뜨거웠던 7월 한 달을 만들어 주셔서 모든 분께 감사드립니다.



상명대학교 조혜리



‘생물정보학’이라는 전공분야를 대학교 3학년 때 처음 접하고, (주)인실리코젠을 교수님께 추천받아 人Co INTERNSHIP에 지원하게 되었습니다. 처음 인턴십 프로그램을 시작할 때는 새로운 사람들과 낯선 공간에서 일하게 되어 설레기도 하고 긴장하기도 했습니다. 4주가 지난 지금은 제 자신도 적응되었는지 처음에 가졌던 긴장감보다는 익숙함. 그리고 편안함이 더 자리 잡은 것 같습니다. 그래서 그런지 인턴십 프로그램이 끝난다고 생각하니 아쉬운 마음이 큽니다.
인턴십 과정 중 리눅스&파이썬 교육, CLC Genomics Workbench 교육 등 진행되었던 다양한 교육 프로그램이 모두 알차고 재밌었습니다. 그중 가장 제 기억에 남는 것은 자기소개 포트폴리오 발표가 아닐까 싶습니다. 발표준비를 하면서 자연스럽게 실무 능력이 향상되었고, 많은 사람에게 저를 표현할 수 있는, 더 많이 소통할 수 있는 계기가 된 것 같습니다.
매일 아침 일어나 출근을 하면서 피곤하기도 했지만, 퇴근하기 전 작성한 OJT를 보면서 저 스스로 뿌듯함을 느끼고 대견하기도 했습니다. 무엇인가를 완벽하게 익히기에 한 달이라는 기간은 짧은 시간이었지만 처음으로 해본 사회생활이라 많은 것을 느끼고 배울 수 있었습니다. 사회생활의 첫 발걸음을 좋은 곳에서 좋은 분들과 함께하였기에 더욱 의미가 큽니다. 아직은 제 경험이 부족하여, 회사라는 공간이 익숙하지 않던 저에게 따뜻한 시선으로 아낌없는 조언을 해주셨던 대표님을 비롯한 모든 직원분들께 감사드립니다.




Posted by 人Co

2016/09/07 14:31 2016/09/07 14:31
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/222

제 4차 산업혁명

최근 제 4차 산업혁명이라는 용어가 크게 이슈화되어 많은 사람들에게 회자되고 있어 이에 대해 짧게 간추려 보고자 합니다.


제 4차 산업혁명이란?
제 4차 산업혁명의 핵심 키워드는 융합과 연결이라고 할 수 있습니다. 이를 더 쉽게 풀어 이야기한다면, 제조업에 정보통신기술이 접목된 것이라 할 수 있습니다. 애초에 제 4차 산업혁명이라는 의미는 제조업 강국인 독일이 새로운 성장동력을 모색하는 과정에서 정립한 개념인 ‘인더스트리 4.0’을 확장한 것으로 그 범위가 더욱 확장되어 제조업뿐만 아니라 사회 전반에 일어날 엄청난 변화와 영향력을 내포하고 있습니다.
인류의 삶을 변화시킨 지난 1차, 2차 그리고 3차 산업혁명에 비하면 제 4차 산업혁명의 정체는 아직 불분명하지만, 산업생태계가 새로운 먹거리 중심으로 재편되어 인류에게 또 다른 혁신의 삶을 제공할 것임은 확실한 것 같습니다. 특별히 빅데이터, IoT, 인공지능과 같은 첨단기술과의 융합이 가져올 변화는 무궁무진한 듯합니다.
그럼 새로운 패러다임인 제 4차 산업혁명의 특징은 무엇일까요? 그 특징은 사람과 사물, 사물과 사물이 인터넷으로 연결되는 초연결성, 그 초연결성으로부터 파생된 막대한 데이터를 분석하고, 그 분석을 통해 일정 패턴을 파악해 내는 초지능성, 그리고 마지막으로 분석결과를 토대로 인간의 행동을 예측해 내는 예측가능성입니다. 이러한 단계를 거쳐 새로운 가치를 창출해 내는 것입니다.


<출처 : http://www.newspim.com/news/view/20160102000009>


국내외 정책동향
국내외적으로 제 4차 산업혁명의 정책적 동향을 살펴보면, 독일은 2011년부터 인더스트리 4.0을 통해 스마트 팩토리에 집중하여 정책적 지원을 추진하고 이를 추진하면서 노출된 문제점인 표준화, 보안정책, 중소기업 거부 등을 개선하기 위한 전략적 수정을 추진하고 있습니다. 미국은 2014년부터 ‘미국에서 만들기 (Making in America)를 통해 디지털 디자인과 3D 프린팅 역량강화로 시제품 제작기간 단축, 비용절감은 물론 혁신형 기업 창업 촉진을 정책적으로 지원하고 있습니다. 중국 또한 IT 경쟁력 강화를 통해 ‘중국제조 2025’를 발표하여 제조대국에서 제조 강국으로 도약하기 위한 전략을 추진하고 있습니다. 이에 뒤질세라 일본은 2013년 ‘세계 최첨단 IT 국가 창조선언’을 하고, 2016년 ‘로봇 혁명 신전략’을 내세워 미국, 독일에 비해 상대적으로 경쟁 우위에 있는 로봇혁명을 통해 IoT 시대에 로봇으로 세계를 리드할 전략을 추진하고 있습니다.
국내에서도 제조업의 창조경제 구현을 목표로 스마트센서, CPS(Cyber-Physical-System), 3D프린팅, 에너지절감, IoT, 빅데이터 등 스마트 제조기술개발과 더불어 이러한 스마트기술과 소프트웨어를 연결하여 이루어지는 지능화 산업 발전을 위한 R&D 예산 확대를 도모하고 있습니다.


제4차 산업혁명 주요 기술
대다수의 전문가들과 문헌에서는 제 4차 산업혁명의 주요기술로 ICT 관련 기술인 IoT, CPS, 빅데이터 그리고 인공지능(AI)을 언급하고 있습니다.

<출처 : 해외 ICT R&D 정책 동향, 정보통신기술진흥센터(2016)>

몬산토, 듀폰, 존 디어 등 다국적 기업들은 빅데이터를 활용한 '처방식 재배(prescriptive planning)'를 통해 농업 분야의 가치 창출을 본격화하고 있고, 국내에서도 각종 센서를 통해 환경정보, 생육정보, 에너지 정보, 농작업 정보 등을 통합적으로 수집, 분석한 빅데이터 기술을 활용하여 스마트 팜 산업이 확대되고 있습니다.
 
에필로그
생물정보분석 전문회사인 (주)인실리코젠은 유전체 분석 외에도 생물정보를 기반한 디지털융합사업, 다양한 정보화 사업을 수행해 왔습니다. 아마도 이미 10년 전부터 데이터의 가치를 알고, 데이터의 축척, 데이터 연결 그리고 데이터를 통합하는 4차 산업혁명의 주요 기술인 빅데이터 기술을 준비해 왔으며, 로봇 기술을 제외한 주요 기술들(빅데이터 기술, IoT, 머신러닝)을 꾸준히 연구, 개발하여 미래를 준비하고 있었던 것 같습니다.
현재 (주)인실리코젠은 수년간 준비해온 식품 빅데이터 정보를 이용하여 식품 산업의 제 4차 산업 혁명의 단초를 제공하고자 준비하고 있습니다. 아마도 식품 빅데이터 정보는 바이오 헬스, 진단 및 의료 산업을 비롯해 식품 산업으로까지 확대되어 더 폭넓게 견인하게 될 것입니다. 제 4차 산업혁명으로 산업의 패러다임이 대변신을 이루어 갈 때 (주)인실리코젠이 바이오 혁신 산업의 제 4차 산업혁명 그 중심에 서지 않을까 기대해 봅니다.




작성자 : R&D센터 DS그룹 신가희 책임 연구원

Posted by 人Co

2016/09/07 14:27 2016/09/07 14:27
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/221

Power with Simplicity

Sequencher는 DNA 서열 데이터를 빠르게 분석하여 결과를 제공하는 소프트웨어입니다. 특히, sanger sequencing 데이터로부터 assembly 후 variation 정보를 찾아주는데 포커싱 되어 있어 특정 영역의 SNP 분석에 굉장히 유용하게 평가되고 있습니다. 최근 5버전대로 업그레이드가 되면서 NGS 데이터까지 분석이 가능하도록 기능이 확장되었고, 커맨드라인으로만 분석 가능했던 퍼블릭 툴들을 초보자들도 사용하기 쉽도록 GUI를 제공하여 편의성을 더해주었습니다.



그럼 NGS 데이터를 이용하여 실제적으로 어떤 분석이 가능한지 살펴볼까요?


Next-Gen Sequencing

[Reference assembly]

Sequencher에서는 NGS 데이터를 이용하여 reference assembly 시 이용하는 3개의 큰 알고리즘(Maq, GSNAP, BWA-MEM)이 있습니다. Maq이나 GSNAP을 통해 assemgbly 분석을 진행하면 SNP 분석도 함께 가능하며, 그 결과 값은 Tablet이나 Maqview를 이용하여 확인할 수 있습니다. 커맨드라인으로 제공하던 BWA-MEM도 GUI를 통해 다양한 옵션값을 손쉽게 설정할 수 있습니다. GSNAP이나 BWA-MEM로부터 얻은 VCF 포맷의 variant 정보는 SAMtools를 이용하여 분석할 수 있습니다.





[De novo assembly]

Reference 정보가 없는 de novo assembly의 경우에는 Velvet 알고리즘을 지원하고 있습니다. Velvet 또한 GUI를 제공함으로써, Tablet으로 결과값을 확인할 수 있고, 다양한 옵션값을 쉽게 설정할 수 있습니다.




[RNA-seq]

최신버전에서는 Differential Gene Expression(차등유전자발현) 연구를 위해 가장 많이 이용되는 RNA-seq 툴 중 하나인 Cufflinks를 플러그인으로 사용할 수 있습니다. Cufflinks 는 SAM 파일로부터 align된 reads를 가지고 GTF annotation 파일을 이용해 다시 align 하며, 다른 isoform과 transcript를 찾아줍니다. 이후 Cuffmerge를 통해 Cufflinks에서 나온 두 개의 transcript 파일을 하나의 transcript consensus 파일로 만들어 줍니다. 이 파일은 차등유전자발현 분석을 하는 Cuffdiff에 사용됩니다. Sequencher는 Cuffdiff에서 나오는 최종파일들(volcano plot, scatter plot, bar chart)을 다루며 발현 레벨에서 차이점을 그래픽으로 보여줍니다.







Connections
[BLAST & primer-BLAST]
Sequencher Connections는 Sequencher의 통합 웹 확장 툴이며, 이를 이용하여 2개 이상의 분석들을 동시에 진행할 수 있습니다. 다중 BLAST를 진행할 수 있어, 각 서열의 분석 결과를 실시간으로 빠르게 얻을 수 있습니다. 같은 서열로 다른 파라미터 조건을 주어 BLAST가 가능하며, 동시에 Local BLAST 까지도 수행할 수 있습니다. 또한 primer design을 위한 primer-BLAST를 할 수 있고, 해당 서열의 특정 영역을 확인 후 Sequencher Project에 예측된 primer를 저장할 수 있습니다. BLAST 검색 결과를 Web view 탭을 통해 뷰어할 수 있고, 이는 36시간 내에 다시 불러올 수 있으며, 그 이후로는 접근이 어렵습니다.



[MUSCLE alignment]
만일 여러 개의 서열로 그룹 분석을 하고 있다면, 다중서열정렬 알고리즘 중 가장 빠른 MUSCLE을 가지고 alignment를 할 수 있습니다. Sequencher Connections에서는 MUSCLE alignment를 다양한 옵션값으로 할 수 있고, alignment 이 후 phylogenetic tree도 생성할 수 있어 서열간의 유연관계도 확인할 수 있습니다.



이렇게 Sequencher에서는 NGS 분석까지 가능하도록 툴들이 확장되고 있습니다. 특히나 커맨드라인의 툴들을 사용하기 어려운 일반 생물학자들도 쉬운 인터페이스를 가진 Sequencher를 이용하여 NGS assembly를 진행할 수 있습니다. 그럼 Sequencher를 통해 NGS의 다양한 분석을 진행해 보세요.


작성자 : Codes실 Consulting팀
송하나 주임 컨설턴트

Posted by 人Co

2016/09/07 13:21 2016/09/07 13:21
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/220

Inova Genomes : Sequenced Whole Genome Data

최근 QIAGEN Bioinformatics에서는 다양한 인종 및 질병/환자/가계 정보들이 포함된 Whole Genome Database를 런칭하였습니다. 이는 Inova Translational Medicine Institute 라는 의학연구소에서 병원과 함께 환자들의 medical history 및 genome sequence를 수집하였으며 이러한 데이터들이 기존의 질병 유전체 연구 또는 임상연구의 한계를 극복해줄 것이라 생각되어집니다.

Inova Translational Medicine Institute
Inova Translational Medicine Institute(ITMI)는 비영리 연구기관으로 다양한 분야의 연구자들이 유전체와 임상적 데이터를 사용 할 수 있도록 하는 것을 목표로 개인의 유전체와 임상 정보를 이용하여 맞춤의료를 위한 혁신적인 방법 개발에 힘쓰고 있습니다. ITMI는 2011년 2월 1일에 설립되어 clinical, bioinformatics, laboratory 세 분야로 나누어 100명의 과학자와 임상의사, 간호사, 유전자 카운슬러, 실험실 기술자들이 배치되어 있습니다.

Inova Genomes
ITMI에서 선보인 Inova Genomes는 다양한 인종 및 다양성을 가지는 human whole genome 시퀀싱 결과와 개개인의 진료 기록 정보(진료기록 정보 외에는 모두 기밀)가 함께 수집된 데이터베이스이며 약 2,100건의 가계 정보 및 약 7,000명의 whole genome sequence를 가지고 있으며 매 년 2,500명 정도의 데이터들이 추가되고 있습니다. 환자의 식별은 불가능하지만 각 정보가 Electronic Health Record와 연결이 되어있으며 증상에 대한 문진데이터, demographics, 처방이나 가계에 대한 정보들도 포함되어 있습니다. 또한 환자와 환자 가족들의 동의하에 등록이 되어 있고 시간이 지남에 따라 동일 환자의 데이터 업데이트가 가능합니다. 또한 100개 이상의 국가에서 다양한 가족의 정보 및 모든 주요 기관계의 다양한 phenotype 데이터를 보유하고 있습니다. 뿐만 아니라 RNA-seq, miRNA이나 methylation 데이터 같은 실험데이터들도 포함하여 유전체 레벨 외의 분석을 위한 데이터셋으로도 활용이 가능하며, 양질의 pre-annotated, pre-computed 실험적 데이터를 제공합니다.


표 1. Study별 Inova Genomes 데이터 통계(2015년 7월 30일 기준)



표 2. 질병/나라별 Inova Genomes 데이터 통계


Data-set

전체 데이터의 30%는 Complete Genomics 데이터 셋(coverage=60X)이며, 나머지 70% 데이터는 Illumina 데이터 셋(coverage=40X)으로 구성되어 있습니다. 그 중 Trio 데이터셋 62개, quartet 데이터 2개는 Complete Genomics나 Illumina 두 개의 플랫폼에서 모두 진행하였습니다. 아래 그림1 에서 보시면 320만개의 SNP가 공통적으로 발견이 되어 데이터의 높은 신뢰성을 보여줍니다.



그림 1. Inova Genomes SNP 데이터 퀄리티


Data-field
해당 데이터베이스 내에는 생 후 1000일 간의 종적연구를 위해 아래와 같은 다양한 데이터필드도 존재합니다.

- Demographics : age, gender, ethnic background
- Personal & family health history : family history cancer/diabetes/cardiac types
- Treatment/pharmaceutical records : drug name, dose, frequency
- Laboratory & diagnostic test results : glucose level, CBCs
- Clinical data : BMI, height
- Clinical encounter : Admission to NICU
- Etc.

지금까지 Inova Genomes의 특징에 대해서 알아보았습니다. Inova Genomes과 다른 데이터베이스를 비교해보면 먼저, Personal Genomes Project는 300명 미만의 genome 정보를 가지고 있지만 Inova Genomes는 약 7,000명의 genome 정보를 가지고 있어 human의 genome 정보를 수집하는데 필요한 시간과 비용을 상당히 줄일 수 있습니다. 그리고 1000 Genome Project의 경우 7X coverage를 가지고 있어 정확도가 낮지만 Inova Genomes의 경우에는 최소 40X의 coverage로 높은 정확도를 가지고 있습니다. Kaviar나 EVS는 유럽인들에 대해 집중이 되어 있는 반면, Inova Genomes는 다양한 인종들에 대한 정보를 다수 포함하고 있습니다. 그 밖에도, 데이터의 수집에 대한 환자의 동의가 있어 지속적으로 follow up이 가능하여 분석 결과의 지속적인 업데이트가 가능하고, 2,100건 이상의 혈연 정보가 등록이 되어있어 trio 분석이 가능하여 가계도 내 유전적 질병을 파악하거나 분석하는데 용이하다는 뛰어난 장점을 가지고 있으며, Inova Genomes 에 있는 데이터를 이용하여 cohort를 마음껏 구성하여 비교분석도 가능합니다.
점점 더 저렴해지고 있는 시퀀싱 비용으로 규칙 없이 시퀀싱 데이터만 빠르게 생산되는 현재 시대에 공개되어 있는 데이터는 많은데 비해 자세한 정보가 없어 활용하기 힘든 의미 없는 데이터들뿐인 요즘. 특히나 다양한 케이스의 trio 데이터를 찾기는 더더욱 힘드셨을 거라고 생각됩니다. Inova Genomes에서는 지금 우리가 겪고 있는 고민들을 해결해 줄 수 있도록 데이터 정보에 대한 체계화 및 데이터의 계속적인 업데이트, 다양한 trio 데이터셋의 제공으로 human 분야의 유전체 연구에 날개를 달아드릴 것입니다.


작성자 : Codes실 Consulting팀
서지혜 컨설턴트

Posted by 人Co

2016/09/07 10:42 2016/09/07 10:42
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/219

개요
생물정보 전문기업인 ㈜인실리코젠에서는 미래창조과학부의 지원을 받아 국가생명연구자원정보센터(KOBIC)의 위탁과제로 “대용량 바이오데이터분석 전문 인력 양성을 위한 교육 프로그램 개발”을 2014년 6월부터 2016년 5월까지 진행하였습니다. 저희 회사가 생물정보 전문인력 역량 강화에 관심을 가지고 자체적으로 사업을 운영한 것은 2012년부터였습니다. 人CoEDUCATION라는 명칭 아래 다년간의 사업 경험을 바탕으로 KOBIC의 차세대 생명정보학 인력 양성 사업도 효율적으로 운영할 수 있었습니다. 지난 2년간 수행했던 교육사업 내용에 대해 소개하고자 합니다.

차세대 생명정보학 교육의 필요성
NGS 시대의 인간 유전체를 포함한 다양한 유전체 연구가 급진적으로 발전하고 있으며, 이에 따른 차세대 유전체 정보 분석 전문가의 양성이 요구되고 있습니다. 따라서 KOBIC과 공동으로 유전체 연구 관련 생명정보학 지식과 프로그램을 개발하며 정기적인 워크샵을 통해 대학, 국가 연구기관 및 기업체에 유용한 유전체 정보 분석 전문가를 양성하고자 교육 프로그램을 진행하게 되었습니다.

차세대 생명정보학 교육 내용
1차년도 커리큘럼은 리눅스와 파이썬 등 최신 생물정보 분석을 수행하기 위한 기초 분석 교육에서 점진적 향상된 교육 진행을 목표로 하였습니다. 따라서 일반적인 NGS 분석과 동/식물 기반의 종 특이적 NGS 분석에 대한 교육 내용에 포커싱하여 커리큘럼을 설계하였습니다.
  • 제22회 : 리눅스 및 파이썬을 이용한 생물정보 이해 (2014년 10월 6일~8일)
    - Linux와 Python의 기본 이론을 확립하고 실습을 통한
      생물정보 기초 분석 능력을 습득
  • 제23회 : NGS 개요 및 RNA-Seq 분석 (2014년 11월 26일~28일)
    - NGS의 기본 개념을 이해하고 실습을 통하여 NGS 데이터 분석 및
      RNA-seq 분석에 대한 기초 분석 능력 습득
  • 제24회 : Public 온라인 툴을 이용한 NGS 분석 및 네트워크 분석 (2015년 2월 25일~27일)
    - Public 온라인 툴을 사용하여 NGS 데이터를 가지고 variant 분석,
      RNA-seq, 네트워크 분석을 이론과 실습을 통하여 익힐 수 있도록 함
  • 제25회 : R을 활용한 공개 및 NGS 기반 유전체 자료 분석 실습 (2015년 4월 1일~3일)
    - R을 활용하여 실제 유전체 자료 분석을 수행할 수 있도록 함
  • 제26회 : Transcriptome assembly 분석 (2015년 5월 6일~8일)
    - NGS 데이터를 이용한 전사체 풀 구성과 유전자 기능 분석 방법을 습득

2차년도 커리큘럼은 미생물, 식물, 동물 및 인간을 대상으로 하는 연구에 직접적인 활용이 가능하도록 테마별 교육 진행을 목표로 하여 각 연구대상별 생물정보 이슈사항을 반영하여 커리큘럼을 설계하였습니다.

  • 제27회 : Linux 및 Python을 이용한 생물정보 이해 (2015년 8월 17일~20일)
    - Linux와 Python의 기본 이론을 확립하고 실습을 통한
      생물정보 기초 분석 능력을 습득
  • 제28회 : 미생물 유전체 및 대사회로 분석 (2015년 10월 12일~14일)
    - 미생물 유전체 분석에 대한 전반적인 이해 및
      분석 전략 습득과 실습 (중/고급과정)
  • 제29회 : 식물 유전체 데이터 분석 및 활용 (2015년 12월 14일~16일)
    - 식물 유전체 분석에 대한 전반적인 이해와 분석 전략 및 실습
  • 제30회 : 미생물 유전체 및 대사회로 분석 (2016년 2월 22일~24일)
    - 미생물 유전체 분석에 대한 전반적인 이해 및
      분석 전략 습득과 실습 (초급과정)
  • 제31회 : 유전체 데이터 분석과 질병 연구 (2016년 4월 20일~22일)
    - 인간 유전체 데이터 분석과 질병 연구에 대한 전반적인 이론과
      실습을 통해 분석 능력 습득





차세대 생명정보학 교육 홈페이지

연구과제를 수행하면서 생물정보 교육을 위한 별도의 홈페이지 구축(KOBIC 차세대 생명정보학 교육 홈페이지 운영, http://kobicedu.labkm.net/labkm/)을 통하여 효과적인 교육 일정의 관리와 수강신청의 편의성, 교육 자료의 공유 및 수강생과의 커뮤니케이션이 가능하도록 하였습니다.




차세대 생명정보학 교육 만족도

총 10회의 교육 설문을 분석한 결과 교육의 이해정도 및 만족도, 교육생의 실력향상, 기대한 목표치의 부합성이 모두 70~80% 이상으로 높게 나타났으며 강사진의 능력, 수업분위기, 설명, 교육 자료 등도 높은 평가 결과를 보였습니다.

교육만족도


강사만족도

교육진행 만족도


기대효과
생물정보전문 인력양성 사업에 지속적으로 참여하면서 느낀 점은 사업의 질적 고도화가 필요하다는 것입니다. 실무능력 향상을 위한 교육기간 연장, 등급 체계의 교육, 실습시간 강화, 산학협력 프로젝트 수행 등이 병행되어야 하고, 배출된 인력이 어떠한 활동을 하고 있는지 학계 및 산업계의 기여도와 추적 조사도 병행되어야 할 것 입니다. 또한 맞춤형 인력 양성 체계를 구축하여 수요자의 요구에 부응하는 인력이 양성되어야 할 것으로 판단됩니다.

또한 이러한 교육 과정들을 통하여 국내 생물정보학을 위한 표준 교육과정 개발의 기초자료를 제공하여 국내 유전체 연구의 성장을 촉진하고, 생물정보 분석 인력 확보를 통한 국내 유전체 연구 효율성과 경쟁력을 향상시키는데 도움이 되었으면 합니다.

이번 연구과제는 완료되었지만 정기적인 생물정보 교육은 계속 이어서 진행될 예정입니다. 앞으로도 많은 관심과 참여 부탁드리겠습니다.



<주관부처>                            <주관기관>
   


Posted by 人Co

2016/09/06 17:52 2016/09/06 17:52
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/218

제4회 人Co PLAY 후기



여름의 시작! 6월의 첫 번째 금요일.
선선한 아침공기를 맞으며 人Co PLAY의 막이 올랐습니다. 모두가 즐거운 행사로 만들기 위해 일찍부터 모인 준비위원들, 새벽같이 출발하여 오신 대전지사분들, 그리고 늦지 않게 집결해주신 본사분들까지 人Co인의 단결이 있어 기분 좋게 시작할 수 있었습니다. 장소는 회사 앞 영덕레스피아 풋살경기장! 무려 48명의 人Co인이 한자리에 집결했습니다.

첫 순서인 사장님의 개회사와 추억의 국민체조로 몸과 마음 가짐을 다 잡았습니다. 단합대회 행사는 대중을 압도하는 이상민 주임님께서 맡아 주셨습니다.

두 번째 순서로 백만년 만에 다시 해보는 2인 3각!! 박빙의 랠리 속에서 요놈의 콩은 왜 이리도 미끄러운지... 그릇을 기울여도 보고... 결과는 C팀의 승리~!!

다음 게임인 짝 피구에 앞서 휴식 시간~ 휴식 시간인데... 분명히 휴식 시간인데~!! 경기시간 10분, 거친 남자들, 그들만의 리그가 시작되었습니다!

세 번째 게임, 짝 피구시간! 농구장으로 이동하였습니다. 남자는 공격 No~!! 여자를 보호해야 한다는 사명을 띠고 경기가 진행되었습니다. 관중들의 시선까지 집중시키는 피구왕...이 아닌 피구여왕들의 불꽃 슛~!! 첫 경기는 C, D팀이 공동 1위, A, B팀이 공동 2위로 끝났습니다. 순위를 가르기 위한 人Co 남직원들의 추가 경기가 진행되었습니다. 피구왕들의 치열한 경기 끝에 1, 2위전에서 C팀의 승리~! 3, 4위전은 B팀의 승리로 끝났습니다.

마지막 순서는 기다리고 기다리던 보물찾기 시간~! 人Co인 초유의 탐색전이 시작 되었습니다. 곳곳에서 찾은 이의 만족과 못찾은 이의 시무룩함이 관찰 되었습니다.

마지막은 人Co 가족 모두가 한대 모여 단체사진을 찍음으로써 단합대회 대단원의 막을 내렸습니다~

업무가 있으신 분들을 제외하고 삼삼오오 모여 제 각기 좋아하는 활동을 하였습니다~~ 평소 자리가 떨어져 있어 같이 하지 못했던 사원분들과 시간을 보낼 수 있어 의미있었습니다.



각자의 친목 활동을 즐겁게 마치고 人Co PLAY의 마지막을 장식할 하이라이트인 저녁 회식! 人Co 가족 모두가 함께 하였습니다. 특히 파견 업무 때문에 단합대회를 함께하지 못했던 분들도 함께 할 수 있어서 더욱 즐거웠습니다. 먼저 신입인턴들의 축하 메시지와 사장님의 거국적인 건배 제의를 통해 기분 좋게 회식이 시작되었습니다.


人Co PLAY를 마치며...

경동수
人Co PLAY의 기획, 준비, 그리고 진행까지, 전 과정에 참여할 수 있었던 점이 가장 좋았습니다. 또 브랜드위원회, 박우진, 서정한 선배님, 그리고 인턴동기들, 다수의 생각이 모여 실제가 되어지는 과정을 몸소 느낄 수 있는 좋은 기회 였습니다.

박선영
사무실을 벗어나 활동적인 게임들을 하고 다른 팀원분들과도 함께 하며 일상의 리프레쉬[!]가 되었습니다. 처음으로 회사 행사를 준비하며 설렘도 있었고 어려움도 있었는데, 동기들, 박우진 선배님, 서정한 선배님 그리고 많은 지도를 해주신 브랜드위원회 분들, 사장님의 도움으로 무사히 그리고 즐겁게 잘 마칠 수 있었습니다. 함께 고생한 동기들과 열심히 참여해주신 모든 人Co인 분들- 모두 감사합니다.!

박원
人Co PLAY를 준비하면서 회사의 행사 기획을 함에 있어 많은 분들의 협업을 통해 하나하나 일이 이루어져 감을 알게 되었고, 그 과정이 많은 분들의 고민과 의견 공유를 통해 이루어져 간다는 것을 깨달았습니다. 일을 진행하면서 그 가운데 어려움도 있었고 모르는 부분도 많았지만 브랜드위원회 분들의 많은 도움과 동기인턴들과 함께여서 극복할 수 있었습니다. 또한 人Co PLAY 당일에 많은 분들의 적극적인 참여를 통해서 준비했던 것보다 훨씬 더 즐거운 분위기에서 무사히 모든 일정을 마칠 수 있게 되어 감사드립니다.

백영민
지난 일주일 동안 기획, 준비 그리고 진행을 하면서 사내 행사 하나를 추진하는것이 얼마나 쉽지 않은 일인지 깨닫게 되었던 시간이었습니다. 동기들 뿐만 아니라 브랜드위원회, 박우진, 서정한 선배님의 의견을 조율하고 선배님들의 조언을 실행으로 만들어가는 과정이 정말 값진 경험이었습니다. 또한 더운 날씨속에서도 최선으로 참여해 주신 인코분들이 있었기에 人Co PLAY 행사를 무사히 그리고 뜻깊게 보낼 수 있지 않았나 생각합니다.

이승주
人Co PLAY를 준비하면서 동기들과 이야기 할 수 있는 시간을 가질 수 있어 좋았습니다. 개인업무와 함께 人Co PLAY 준비도 꼼꼼하게 수행했던 동기들! 처음 행사를 기획하고 준비하는 데 있어 항상 옆에서 조언해주신 브랜드위원회, 우진선배, 정한선배! 마지막으로 쨍쨍한 햇볕아래에서 人Co PLAY에 즐겁게 참여해주신 사장님, 人Co인 분들에게 다시 한번 감사인사 드리고 싶습니다.

Posted by 人Co

2016/09/06 17:08 2016/09/06 17:08
, ,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/217