MS office, 한컴 등 컴퓨터 상에서 각종 문서 및 data를 저장하고 가공하는 솔루션들은 익히 알고 계실 겁니다.
Office 솔루션의 특징은 진입장벽이 낮고 문서 및 data를 구성원 간에 공유하고 자유롭게 수정할 수 있으며, 해당 기능으로 인해 업무 효율성에 시너지를 생성시킵니다.
그러나 안타깝게도 생물학 연구실에서 생성되는 일부 data들은 office 솔루션으로 저장하고 가공하기에는 어려운 것들이 있습니다.
예를 들어 염기서열에 경우 기본적으로 A, T, G, C로 구성되어 있어 문서파일로 저장할 수는 있지만 유의미한 정보를 알아보기 어려우며 가공하기 또한 어려운 것이 현실입니다.
이는 생물정보 data 전용 솔루션이 있으면 쉽게 해결할 수 있습니다. CLC Main Workbench는 Bioinformatics 분야에서 염기서열 분석을 위한 가장 기본적인 소프트웨어로 DNA, RNA, Protein, Digital Gene Expression 등의 분자생물학 데이터를 통합 분석 할 수 있습니다.
이를 통해서 연구실 단위에서 생물정보 분석 및 공유를 원활하게 진행할 수 있는데요, 실제 연구실에서 개인 PC 단위로 설치하여 활용하고 있는 사례를 소개해 드릴까 합니다.



충북대학교 특용식물학과 생명공학 연구실 (이 이 교수님)



이이 교수님의 지도하에 인삼, 당귀, 더덕, 도라지, 잔대, 대추나무, 소나무, 은행나무 등 다양한 약용식물 및 특용식물의 유전정보를 바탕으로 우수품종 육성 및 식물의 종 판별, 유전 다양성 분석 등을 위한 분자표지 개발 및 약용식물에서 주요 약리성분 중 하나인 사포닌의 생합성에 관련하는 유전자 탐색 및 역할 구명 연구를 수행하며 다양한 작물에 대해 RNAi를 이용한 형질전환 식물 개발연구 등을 수행하는 연구실입니다.
저희 실험실에서는 오래전부터 CLC Genomics Workbench와 CLC Main Workbench를 사용해오고 있습니다. CLC Main Workbench는 바이오인포메틱스 전문가가 없는 일반 연구실에서 쉽게 DNA 염기서열과 아미노산 서열 등을 이용하여 클로닝, PCR, 계통분석 등을 할 수 있고, CLC Genomics Workbench의 경우 다양한 플랫폼으로 생산된 NGS 데이터를 활용하여 trim, assembly, Blast 등을 수행할 수 있었습니다.

이 프로그램의 가장 큰 특징은 Windows 환경에서 'GUI를 통해서 구동되므로 다양한 명령어를 숙지하고 있을 필요가 없어서 누구나 쉽게 배울 수가 있고, 속도가 매우 빠르고 적은 양의 메모리를 사용하여 그다지 용량이 크지 않은 메모리를 가지고 있거나 그리 빠르지 않은 CPU를 가지고 있는 PC에서도 구동이 가능하다는 점'입니다. 특히 우리 연구실처럼 '여러 개의 개체로부터 NGS데이터를 얻어서 비교분석을 하는 경우에 개개의 분석을 매번 하지 않고 batch mode를 사용하여 여러 개의 데이터를 순차적으로 분석하여 연구자의 시간과 노력을 아낄 수 있게 해주는 편리한 프로그램이었습니다.

따라서 이 프로그램을 활용한다면 포스트게놈 시대에 다양한 형태의 게놈 데이터를 이용할 수 있어서 연구실의 연구 능력을 한층 업그레이드시킬 수 있다고 생각됩니다.

건국대학교 의생명공학과 미생물대사공학 연구실 (강학수 교수님)



지노믹스 방법을 이용하여 미생물로부터 신규화합물을 찾아내고 이를 의약품으로 응용하는 연구 및 임상에서 쓰이고 있는 값비싼 단백질기반 의약품을 미생물에서 대량으로 생산할 수 있는 플랫폼을 개발하는 연구실입니다.


DNA 염기서열 기술이 발달하면서, 증가하는 생물정보의 데이터를 효율적으로 분석 및 관리하는 시스템의 필요하였습니다. 특히, 연구를 진행함에 있어 방대한 데이터베이스 내에서의 자료수집은 연구 결과와 연결되는 중요한 부분이라고 할 수 있습니다. CLC bio사에서 제공하는 CLC Main Workbench의 경우, 웹 기반 데이터베이스 내 검색, DNA 염기서열 분석 그리고 분자생물학 클로닝(cloning) 등의 다양한 분석 기능을 제공하고 있습니다. 그뿐만 아니라, '염기서열을 비교 분석한 결과를 이미지화하여 데이터 저장이 가능해 다른 연구자들과 정보를 공유할 수 있어 데이터를 손쉽게 다룰 수 있다는 점이 강점'이라고 생각합니다.

분자생물학을 기반으로 실험을 수행하는 연구실에 있어 'DNA 염기서열의 유전자 정보를 annotation 하는 것은 정말 중요한 일이라고 할 수 있습니다. 특히 염기서열 정보를 빠르게 수정 가능하며, Primer design과 molecular cloning tool은 실험을 디자인하는 데 있어 많은 도움이 되었습니다. 또, BLAST와의 연동 및 Sequence Alignment ' 를 활용한 계통수 분석의 사용은 실험 결과를 효율적으로 분석하는데 용이하였습니다. 앞으로도 CLC Main Workbench의 사용은 DNA 염기서열을 분석하고 이해하는 데 사용할 예정입니다.


이번 CLC Main Workbench의 사용은 생물정보 처리 시스템이 굉장히 중요하다는 생각이 들었으며, 효율적인 소프트웨어의 필요성을 느끼게 되었습니다. 생물학을 연구하는 과학자분들에게 CLC Main Workbench의 사용을 추천하려 합니다.

마치며

위의 두 연구실 모두 CLC Main Workbench를 통하여 연구실 내 생물정보 data 처리를 쉽게 저장하고 가공하여 연구를 원활하게 진행 중입니다.
생물정보 data 처리에 어려움을 느끼시거나 연구실 내에 data 포맷을 통일하고 싶으시다면 생물정보 전용 솔루션인 CLC Main Workbench를 한번 사용해 보시는 걸 추천해 드립니다.
마지막으로 사용 후기를 작성하여 주신 충북대학교 이이 교수님, 건국대학교 강학수 교수님께 감사의 말씀을 전합니다.


작성 : 김 성 민 주임 컨설턴트


Posted by 人Co

2019/02/15 14:21 2019/02/15 14:21
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/304



CLC Main Workbench는 Bioinformatics 분야에서 염기서열 분석을 위한 가장 기본적인 소프트웨어로 DNA, RNA, Protein, Digital Gene Expression 등의 분자생물학 데이터를 통합 분석 할 수 있습니다. 이러한 생물정보 기초 소프트웨어를 이용하여 대학 강의에 유용하게 활용한 사례를 세종대학교 신학동 교수님께서 공유해 주셔서 소개합니다.

교과 개요
  • 교과명 : 식품분자생물학 및 실험

  • 교수명 : 신학동 교수님

  • 수업 및 실습 장소 : 세종대학교 율곡관 101호 전산 실습실

  • 수업 기간 및 시간 : 2018년도 2학기 월, 수 13:30 ~15:00


교과 목표

이 교과는 식품분자생물학과 관련된 실험적인 방법 및 생물정보학 기술을 학습 및 응용하여 미생물의 생리학, 생화학, 유전체학에 대한 이해를 높이는 것을 목표로 하며 '식품 미생물학 및 실험' 교과를 선수강한 학생들을 대상으로 하는 심화 과정의 교과임.

주차 별 학습

[표 1] 주차 별 학습


교과 진행 방법

CLC Main Workbench의 설치 및 사전준비
대학 전산운영과와 협의를 통해 세종대학교 율곡관 1층에 있는 전산 실습실 사용을 승인받아 학과 차원에서 구매한 라이선스 21대(교수용 1대, 학생실습용 20대)를 사용하여 CLC Main Workbench에 대한 설치를 진행하였으며 학생들의 자리를 사전에 지정하여 프로그램을 운영, 관리하도록 하였음.
 
교과 진행 방식


[사진 1] 수업 진행 모습

실습에 앞서 해당 주차 생물정보학 분석에 사용되는 개념 및 분석이 가지는 의의에 대한 이론 수업을 통해 학생들에게 ‘무엇에 대한 분석이며 왜 필요한가’에 대한 이해도를 높였음. 이후 분석 실습에서는 강의실 앞에 설치된 대형 스크린을 활용하여 분석이 진행되는 과정을 보여줌과 동시에 학생들이 따라 진행할 수 있도록 지도하였으며 조교 2명이 수업에 보조로 참여하여 분석의 흐름을 놓치거나 문제가 발생한 학생들에 대해 안내해주며 모든 학생이 원활히 분석을 수행할 수 있도록 진행하였음.

학생들의 이해를 높이기 위해 수업 이후 수업 내용을 기반으로 한 과제를 통해 학생들의 이해도를 지속해서 확인했으며 질의·응답 시간을 통해 수업에서 다루지 못한 CLC Main Workbench의 기능과 응용 방법에 대해 추가로 안내하였음.




[사진 2] 학생 수행 과제물 (실험 노트)
 
교과 내용
[그림 1] 식품분자생물학 및 실험 수업에서 진행된 분석 모식도

학생에게 미지의 bacteria를 제공하고 최종적으로 주어진 bacteria의 학명과 기능을 예측하며 sequence data를 기반으로 target gene을 설정하여 primer를 설계하고 PCR에 성공하는 것을 목표로 함. 이를 위하여 학기 초반 실험을 통하여 미지의 bacteria로부터 genome을 추출하였으며 draft genome sequencing을 진행하였음. sequence file을 assembly 시켜 얻은 ‘.fasta’ 형식의 파일을 사용하여 CLC Main Workbench를 통해 생물통계학 분석을 진행함.

‘Nucleotide analysis’의 하위 기능을 활용하여 ORF(Open Reading Frame)를 예측하고 이 영역을 protein sequence로 변환하여 BLAST를 진행하였음. 이를 통해 CDS(Coding Sequence)의 기능을 예측해낼 수 있었고 총 50개 이상의 CDS를 찾고 기능을 정리하는 과제를 수행하였음. 정리된 CDS 정보를 통해 비슷한 기능을 수행하는 유전자가 모여있는 operon이 존재하는지 예측하는 과정을 거쳤음.

‘Design primers’ 기능을 활용하여 관심 있는 CDS 부분을 증폭시킬 수 있는 primer를 제작하고 최종적으로 학생들이 직접 설계한 primer를 주문 제작하여 PCR(Polymerase chain reaction) 과정을 수행하고 gel electrophoresis를 통해 primer가 적절하게 설계되었는지 확인해보는 과정을 거쳤음.


학생 만족도

전반적인 학생 만족도

학과 특성상, 컴퓨터를 통한 분석의 기회가 많지 않다는 점에서 수업의 내용이 신선하다는 평가가 많았으며 프로그램을 운용하는 데에 어려움을 토로하며 정형화된 학습 교안의 필요성을 언급한 학생도 있었음. 다루고 있는 내용에 비하여 프로그램의 구성 및 조작이 단순하여 분석이 용이했음을 다수가 언급했으며 많은 기능이 한 프로그램 안에 포함되어 있어 편리한 점을 이 프로그램의 가장 큰 장점으로 평가했음.

학생 평가 일부 소개

정○ (바이오융합공학과, 3학년)
수업을 통해서 염기서열분석 프로그램을 처음 사용해 봤는데, 생각보다 사용자가 쉽게 사용할 수 있도록 설계되어 있어서 수업을 듣고 금방 따라 할 수 있었다.


이○ (바이오융합공학과, 4학년)
이번 수업을 통해 처음으로 CLC Main Workbench를 사용할 수 있었는데, 물론 프로그램을 다루는 것이 생소하고 어려운 부분이 많았지만 다른 프로그램에 비해 사용 방법이 비교적 간단하고 직관적이어서 사용이 용이했다.

박지○ (바이오융합공학과, 4학년)
CLC Main Workbench에 대한 강의를 듣고 직접 진행해 보며 이전에는 이론으로만 접해보았던 부분을 실습해볼 수 있어서 유익했다. 특히 CLC program을 통해서 Primer region을 설정하고 직접 디자인하는 과정이 매우 유용해 기억에 남는다.

고든○ (식품생명공학과, 4학년)
CLC Main Workbench 이용함으로써 분석하고자 하는 유전정보를 거의 백지상태에서 여러 tool을 활용해 직접 정보를 기록하며 체계적이고 한눈에 보일 수 있도록 정리할 수 있어 매우 유용했다.


이상○ (식품생명공학과, 4학년)
CLC Main Workbench를 처음 사용해봐서 설명을 놓치면 따라가기 힘든 점이 있었으나 프로그램에 tool이 다양해서 이것저것 시도할 수 있던 점이 좋았다. 다양한 분석이 가능해서 여러 가지를 응용해 적용해 볼 수 있었던 것 같아 흥미로웠다.

CLC Main Workbench를 활용한 강의 내용을 좋은 글로 작성해 주시고, 공유해 주신 세종대학교 신학동 교수님께 진심으로 감사드립니다.


작성 : 용승천 주임 컨설턴트





Posted by 人Co

2019/02/08 14:58 2019/02/08 14:58
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/303