[구버전] 人Co BLOG

병원에 가지 않아도 나의 건강을 진단하고 치료한다?! - 라이프로그와 헬스케어

Posted at 2021/07/08 16:02
Filed under 정보공유

우리는 보통 "질병에 걸릴 것 같아서"가 아니라, 질병에 걸려 "발생하는 증상" 때문에 병원을 찾아 치료받곤 합니다. 따라서 증상이 늦게 발현되는 경우 혹은 증상을 알아채지 못한 경우, 치료 시기를 놓쳐 치료에 어려움을 겪거나 질병이 급격히 진행되는 일들이 자주 발생합니다.
또한, 만성 질환을 앓고 있거나 특정 치료법을 시행한 경우에는 환자가 입원하거나 매일 병원에 방문하지 못한다면, 자신의 건강 상태를 확인하고 예후를 지속해서 살펴야 하는 번거로움이 있습니다. 지금부터 소개할 "라이프로그" 데이터는 앞선 문제와 번거로움을 해소하는 데에 많은 도움을 주고 있습니다!

[그림 1] https://www.galendata.com/digital-healthcare-future-heathcare/

라이프로그란?

먼저 라이프로그(Life log)란 일상생활을 의미하는 'life'와 기록을 의미하는 'log'의 합성어이며, 문자 그대로 일상에서 기록 및 저장되는 모든 정보를 의미합니다. SNS에 업로드한 글, 일상적인 대화가 담긴 음성 파일 등 디지털로 기록 가능한 모든 데이터는 라이프로그라 할 수 있습니다.

특히, 헬스케어 분야에서 말하는 라이프로그는 병원에 방문하지 않고도 환자의 건강 상태를 실시간으로 업데이트하거나, 질환의 예후를 감지 및 예측하는 중요한 자료로 사용될 수 있는 PGHD(patient generated health data)의 확장된 범주로 분류되고 있습니다. PGHD는 데이터를 생성하는 주체가 질환을 앓고 있는 환자였다면, 라이프로그는 그 주체를 건강한 사람까지 포괄하는 개념입니다.

라이프로그의 등장

라이프로그는 자료를 저장하는 저장 장치와 데이터의 수집을 위한 센서가 더욱 정밀하게 발달하며, 그 양이 기하급수적으로 증가하기 시작하였습니다. 또한, IT 기술이 발전하고 정보와 지식을 공유하는 문화가 사회 전반에 자리매김함에 따라 더 많은 사람에 의해 다양한 종류의 라이프로그가 생산되고 있습니다.

라이프로그의 종류

[그림 2] https://www.artinsight.co.kr/news/view.php?no=45148

https://seouljobs.net/company/seoul-convc/noomkr/

https://www.acc.org/latest-in-cardiology

https://www.siilo.com/

라이프로그는 문자 그대로 일상에서 기록되는 모든 정보이기에, 그 종류가 정해져 있지는 않습니다. 모바일 기기의 사용 패턴부터 SNS 활동 로그까지 모든 개인의 삶에 대한 모든 데이터가 포함됩니다. 그 중 헬스케어 분야에서 자주 활용되는 라이프로그에는 크게 활동량 데이터, 영양 데이터, 자가 측정 임상 데이터, 커뮤니케이션 데이터 4가지가 존재합니다. 활동량 데이터는 라이프로그 중 가장 먼저 모이기 시작한 데이터이고, 웨어러블 디바이스를 통해 수동적인 방법으로 수집할 수 있습니다. 두 번째 영양 데이터는 활동량 데이터 다음으로 대두되고 있으며, 스마트폰에 직접 기입하는 형식으로 수집합니다. 식생활 변화를 헬스케어 분야에 적용할 수 있다는 장점이 있지만, 데이터의 형식이나 분석의 편차가 큰 편이라는 특징이 있습니다. 다음은 자가 측정 임상 데이터로 주로 환자를 대상으로 하며, 병원에서 측정해야 하는 임상 데이터를 환자가 수집할 수 있다는 장점이 있습니다. 그러나 사용자의 숙련도에 따라 정확도가 달라질 수 있다는 이슈가 있습니다. 마지막은 커뮤니케이션 데이터이며, 헬스케어 서비스 내 사용자의 대화 로그나 SNS 채널 내의 데이터 등이 포함됩니다. 위 4가지 카테고리 데이터는 현재도 많은 연구가 진행되고 있는 헬스케어 내의 라이프로그입니다. 이외에도 수많은 종류의 라이프로그가 존재하며 헬스케어 분야에 얼마든지 적용할 수 있기에 그 위상이 날로 증가하고 있습니다.

[그림 3] https://www.bioin.or.kr/InnoDS/data/upload/industry

데이터의 종류의 따라, 사람이 주체적으로 데이터를 모바일이나 웹 애플리케이션에 직접 기입해야 하기도 하지만, 특별한 행위 없이도 디바이스에 의해 자동으로 데이터가 수집되기도 합니다. 예를 들어, 헬스케어에서 활동량 정보의 경우, <table.1 활동량 정보 예시: 헬스케어 웨어러블 디바이스 주요 제품>에서처럼 우리에게 익숙한 애플워치, 핏비트 등의 밴드형 기기 외에도 다양한 종류의 기기에 의해 자동으로 데이터가 모여 활용할 수 있는 형태로 반환됩니다. 웨어러블 디바이스에 의해 수집된 데이터는 이동 거리, 활동 강도 등의 비교적 간단한 정보부터 약물 복용 여부 등의 감지하기 어려운 데이터까지 포함되며, 이들은 의료진에게 직/간접적으로 전달하는 서비스를 통해 임상 데이터와 연동하여 체계적인 수술 후 건강 관리, 만성 질환의 관리 등에 활용될 수 있습니다.

라이프로그의 활용사례

[그림 4] https://dobrain.co](https://dobrain.co/

첫 번째 사례는 "두브레인"이라는 아이를 위한 두뇌 교육 모바일, 태블릿 애플리케이션입니다. 언뜻 보면 모바일 게임과 유사해 보이지만, 아동이 두뇌 게임을 하면 쌓이는 데이터들을 이용하여 장애 여부나 발달 수준을 진단하고, 진단 결과를 기반으로 발달 테라피나 인지 교육 프로그램을 제공하는 서비스입니다. 이 서비스는 국내 의과대학 연구진들과 함께 두뇌 게임의 플레이 데이터를 라이프로그 데이터로 활용하여 발달 장애를 진단하는 알고리즘을 개발하였다고 합니다.

[그림 5] https://mhealth.jmir.org/2021/5/e21668
https://mhealth.jmir.org/2021/5/e21668

두 번째 사례는 아이의 체온을 관리해주는 "fevercoach"라는 모바일 애플리케이션에서 생성된 라이프로그 데이터를 활용한 연구 사례입니다. fevercoach 애플리케이션은 현재의 체온을 입력하면 아이가 어떤 상태이고, 어떤 행동을 취하면 좋은지를 제시해줍니다. 또한, 이 서비스에는 아이가 접종받은 백신의 종류와 열이 났을 때 어떤 해열제를 얼마만큼 복용하였는지를 기입할 수 있습니다. 이와 같은 아이의 기초 정보와 체온 변화 정보, 해열제 종류 및 복용량 정보는 라이프로그 데이터로 축적되어 해열제의 단일 복용과 복합 복용에 따른 체온 조절 효과를 연구하는 데에 기여한 바가 있습니다.

[그림 6] https://d-if.kr/ifood_gene/

세 번째 사례는 라이프로그 데이터 중 섭취음식 사진 데이터를 활용하여 비대면 영양관리 해주는 iFOOD-U 모바일 애플리케이션 서비스입니다. iFOOD-U는 매 끼니를 모바일 기기를 통해 촬영한 영상에서 각 식품을 인식하고, 식품별 영양 성분을 분석하여 영양 데이터를 생성합니다. 이 영양 데이터는 전문 영양사에게 전달되어, 고객의 식이 섭취행태를 파악하고, 이를 기반으로 레포트 형태의 더 나은 섭취 방안을 제시하는 근거 자료로 활용되고 있습니다.

라이프로그의 한계와 도전

라이프로그는 데이터를 생성하는 대상에 제한이 적고, 데이터의 수집이 비교적 간편합니다. 또 주로 개인이 수집하는 데이터이기에, 병원에 축적된 임상 데이터 혹은 유전체 데이터와 연계한다면, 그 활용 범위는 무한에 가깝다 해도 과언이 아닙니다. 그러나 라이프로그를 다른 원천 데이터와 연동하여 활용하는 것이 그리 쉬운 일은 아닙니다. 라이프로그는 개인이 생성하는 반면, 전자 의무 기록이나 임상 데이터들은 환자 혹은 개인이 방문하였던 여러 의료 기관에 산재하여 있기 때문입니다. 또한, 의료기관마다 사용하는 전자 의무 기록의 형식이 조금씩 다르기에 개인의 정보와 직접 연동하기 위해서는 데이터를 통합하고 정리하기 위해 많은 시간이 필요합니다.

덧붙여, 라이프로그는 다른 데이터와는 다르게 특정 기관에서 생성하는 데이터가 아니라, 다양한 방식으로 여러 사람이 생성하는 데이터입니다. 따라서 데이터의 소유권이 누구에게 있는지, 데이터를 활용하려면 데이터 제공에 따른 대가를 어떤 방식으로 산정해야 하는지 등의 데이터의 권리에 대한 이슈가 불거지고 있습니다. 권리뿐만 아니라 개인의 일상생활과 관련한 데이터이기에 사생활 침해나 가명처리와도 밀접하게 관련되어 있습니다. 다행히, 공공 기관에서도 데이터 3법과 같이 피해를 최소화하며 기술의 발전은 최대화하도록 법을 개정하고 규율을 정하기 위해 노력하고 있어, 데이터 관련 이슈는 계속해서 개선될 것으로 보입니다.

마치며

우리가 이 글을 읽는 와중에도, 작은 규모의 로그 데이터들은 계속해서 생성되고 있습니다. 이는 하찮고 용량만 차지하는 데이터로 취급될 수도 있지만, 누군가에게는 우리의 삶을 더 풍요롭게 만드는 가치 있는 자원으로 여겨지기도 합니다. 우리도 이번 기회로 라이프로그의 잠재력을 알았으니, 지금부터 라이프로그 데이터의 또 다른 의미를 찾아보면 어떨까요?

참고자료

http://www.incodom.kr/라이프로그(Lifelog)
https://www.medifonews.com/news/article.html?no=138287
Bang C, Nam Y, Ko EJ, Lee W, Kim B, Choi Y, Park YR. A serious game-derived index for detecting children with heterogeneous developmental disabilities: A randomized clinical trial. JMIR Preprints. 04/06/2019:14924
Park Y, Kim H, Park J, Ahn S, Chang S, Shin J, Kim M, Lee J. Comparative Analysis of Single and Combined Antipyretics Using Patient-Generated Health Data: Retrospective Observational Study. JMIR Mhealth Uhealth 2021;9(5):e21668
https://crcaustralia.com/media-releases/real-world-data/

작성 : AIDX 이주연 개발자

Posted by 人Co

Tag: healthcare, insilicogen, lifelog, 라이프로그, 비대면진료, 셀프진단, 웨어러블, 인실리코젠, 헬스케어
Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/387

8 Point Grid, 더 적은 결정 = 더 적은 시간

Posted at 2021/06/09 19:12
Filed under 정보공유

많은 사용자들이 이용하는 프로덕트(혹은 서비스)들은 정보가 잘 정돈되어 있거나 특별한 가이드 없이 짧은 시간 내 능숙하게 사용할 수 있습니다. 그러한 프로덕트들의 공통점은 '일관성'을 가지고 사용자에게 혼란을 야기하지 않습니다. 즉, 일관성 있는 UI는 예측 가능하고 중요한 정보가 더 돋보이도록 할 수 있습니다. 일관성을 맞추는 방법은 여러가지가 있겠지만 오늘 블로그는 레이아웃 그리드, 그 중 가장 일반적으로 사용되는 8 포인트 그리드에 관해 알아보도록 하겠습니다.

포인트(Point)란?

[그림 1] 하나의 단위, 포인트와 3가지 해상도

8 포인트 그리드를 알아보기 전에 포인트(point)가 무엇인지 알아보겠습니다. 포인트는 화면 해상도에 따라 달라지는 공간을 측정하는 값입니다. 가장 간단한 설명은 @1x 해상도에서 1pt는 1px입니다. @2x 해상도에서는 해상도가 X축과 Y축 모두에서 2배가 되어 너비 2px, 높이 2px가 되기 때문에 1pt는 4px입니다. 당연히 @3x 해상도에서는 1pt는 9px (3px x 3px) 입니다.

8 Point Grid 기본원리

[그림 2] 8 Point Grid 적용 예시

왜 하필 숫자 8일까요? 숫자 8과 관련된 몇 가지 이유는 다음과 같습니다. 첫 번째는 모든 다른 화면 디스플레이(안드로이드 @0.75x 및 @1.5x 포함)에서 완벽하게 확장할 수 있습니다. 두 번째 이유는 작업하기에 좋은 기본 단위입니다. 숫자 4와 8은 쉽게 곱할 수 있어 유연하고, 일관적이며 선명하게 제공합니다.

[그림 3] 가장 많이 사용되는 화면 해상도

(W3schools.com, Jan-2021 기준)

음... 이제 짝수가 좋다는 건 알겠습니다. 그럼 숫자 6이나 10은 안될까요? 일반적으로 분기점에 많이 사용되는 화면 크기는 적어도 하나의 축(일반적으로 둘 다)에서 8로 나눌 수 있습니다. 8 포인트로 스케일링을 하게 되면 6 포인트 시스템처럼 같은 변수에 의해 과부하가 걸리거나 10 포인트 시스템처럼 제한 없이 많은 옵션을 사용할 수 있습니다. 최종적으로 우리는 개발 친화적이고 사용자에게 보기 좋은 디자인을 결정해야 합니다. 그러려면 규칙을 따라 하고 반복하기 쉬운 시스템이어야 합니다.

2가지 방법

그러면 어떻게 사용하는 걸까요? 8 포인트 그리드의 기본 원칙은 디자인 내부 요소에서 8(8, 16, 24, 32, 40, 48 등)의 배수를 사용하는 것입니다. 이 시스템은 2가지 방법이 있습니다. 8의 배수로 정의된 그리드에 요소를 배치하는 "하드 그리드"와 개별 요소 사이의 8의 배수를 측정하는 "소프트 그리드"입니다.

[그림 4] 하드 그리드(Hard grid) 개념

"하드 그리드"는 요소별로 여백과 패딩을 추적하고 이러한 컨테이너를 벽돌과 같이 그리드에 배치하는 접근 방식입니다. 모든 요소가 이미 4 포인트 그리드로 디자인된 머티리얼 디자인은 자연스럽게 이 방법을 따릅니다.

[그림 5] 소프트 그리드(Soft grid) 개념

반면 "소프트 그리드" 방법에 관한 주장은 프로그래밍 언어는 그런 종류(하드 그리드 접근 방식)의 그리드 구조를 사용하지 않기 때문에 실용적이지 않다는 것입니다. 유연하고 최소한의 구조를 선호하거나 많은 시스템 UI 요소가 짝수 그리드로 정의되지 않은 iOS에 더 유리할 수 있습니다.

8 Point Grid 시스템을 통해 얻을 수 있는 가치

첫 번째로 일관된 UI를 개발하고 제공할 수 있습니다. 모든 측정이 같은 규칙을 따르면 자동으로 일관된 UI를 얻게 됩니다. 이는 사용자에게 신뢰할 수 있는 브랜드라는 느낌을 줄 수 있습니다. 또한, 모든 장치에서 균일한 안티앨리어싱 효과로 더 선명한 디자인을 전달할 수 있습니다.

두 번째는 '더 적은 결정은 더 적은 시간이 든다'는 개념입니다. 간격을 설정할 때 숫자 8만 기억하시면 빠르게 해결할 수 있습니다. 그러면 요소 간 퀄리티가 저해되지 않고, 일정한 리듬을 유지하면서 의사 결정을 최소화할 수 있습니다. 또한, 디자이너와 개발자 간의 쉬운 의사소통 시스템으로 매번 측정하지 않고도 8 포인트 단위로 쉽게 생각할 수 있습니다.

마치며

[그림 6] 예시 이미지

우리는 수치에 따라 움직이는 로봇이 아닙니다. 아주 드문 사례로 숫자가 정의되지 않았거나 8을 곱하지 않더라도 괜찮아 보이면 사용해도 됩니다.

오늘 소개해드린 8 포인트 그리드 시스템 역시 수많은 디자인 시스템 중 하나에 불과하며, 모든 그리드 시스템은 절대적인 규칙은 아닙니다. 다만 빠르게 변화하는 시대 흐름에 적응하며 사용자 경험을 극대화 시키기 위해 지속적인 개발 및 관리는 필수가 되었습니다. 그러기 위해서는 내부의 효율적인 소통과 적은 의사결정을 할 수 있는 환경이어야 하며, 시스템 활용은 그 방안 중 하나라 생각합니다. 인실리코젠은 서비스 규모와 성격에 따라 다양한 시스템을 적용하며 본질을 추구하고 있습니다.(여기서 말하는 본질은 디자이너는 사용성 경험 개선에, 개발자는 기능 로직 구현에 힘쓰며 더 나은 서비스를 만드는 것입니다.) 앞으로도 더 나은 것을 위해 시도와 적용을 하며 사용자가 만족할 수 있고 행복할 수 있는 프로덕트를 만들도록 노력하겠습니다. 긴 글 읽어주셔서 감사합니다.

참고자료

작성 : IX팀 이용태 주임디자이너

Posted by 人Co

Tag: 8PointGrid, 8포인트그리드, GridSystem, insilicogen, UI디자인, UXUI, UX디자인, 그리드시스템, 디자인가이드, 인실리코젠
Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/385

人CoINTERNSHIP 2020 하계 프로그램 후기 (제11기)

Posted at 2020/08/26 09:00
Filed under 회사소식

역사를 보면, 인류는 어떤 상황 속에서도 교육을 항상 지속하여 왔습니다.
그러한 교육에 대한 열정이 있었기에 현재의 문명을 이룰 수 있었다고 생각합니다.

COVID-19 상황이 지속되는 가운데 (주)인실리코젠은 철저한 방역지침을 준수하며, 생물정보 인재양성 프로그램을 진행하였습니다. 7월 6일부터 8월 14일까지 6주간 진행된 프로그램의 생생한 후기 함께 보겠습니다.

작성 : 人CoINTERNSHIP 제11기 수료생

이가희, 이솔휘, 이주연, 진종현, 황성경

Posted by 人Co

Tag: insilicogen, 人Co, 교육, 생물정보학, 인실리코젠, 인턴, 체험, 프로그램, 후기
Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/355

효율적인 시스템 및 서비스 디자인을 위한 UX 디자인 방법론, Wizard of Oz Prototyping

Posted at 2020/06/22 14:14
Filed under 정보공유

[Fig.1] 인실리코젠 IX팀

(출처:(주)인실리코젠)

올해 인실리코젠의 Descign(Design+Science+Management)팀 명칭이 IX팀으로 개편되었습니다. IX는 다양한 기술을 통합(Integration)하여 상호작용(Interaction)적인 서비스와 혁신적인(Innovation) 사용자 경험을 디자인하는 부서로 변화하였습니다. 금일 준비한 포스트도 부서의 방향성과 어울리는 콘텐츠로 준비하였습니다.

사용성 테스트의 니즈

[Fig.2] Usability Testing Illustration

(출처: https://usabilitygeek.com/remote-usability-testing-best-practices/)

편리한 시스템과 서비스를 디자인할 때 필요한 요소 중 하나는 사용성 테스팅(Usability Testing) 입니다. 테스팅은 예측하지 못했던 문제나 유저(User)들의 어려움을 찾아낼 수 있도록 도와주는 데 큰 역할을 합니다. 그럼 언제 사용성 테스트를 진행하는 것이 좋을까요? 일반적으로 디자인(기획) 단계에서 구상한 아이디어를 프로토타입 하여 진행합니다. 테스트 과정 중에 문제를 미리 발견하여 기업이 투여 시간과 비용적인 손실을 최소화할 수 있게 도와주기 때문입니다. 현재 이를 도와주는 다양한 테스팅 방법들이 존재합니다. 그중 Wizard of Oz(WOZ) 테스팅 기법을 소개해 드리려 합니다.

Wizard of Oz(WOZ) 테스팅은 어떤 건가요?

[Fig.3] Wizard of Oz Film

(출처 : https://thecinematheque.ca/films/2019/the-wizard-of-oz)

누구나 한 번쯤은 오즈의 마법사(Wizard of OZ) 영화를 보셨을 것입니다. 이쯤 되면 테스팅 방법과 오즈의 마법사 스토리와의 연관성에 대해 궁금증이 생기실 듯합니다. 극 중 마법사인 오즈는 자신의 진짜 모습(서커스에서 마술하는 사람)을 복화술로 숨기고 엄청난 대마법사인 것처럼 모두를 속입니다. 마법사 오즈처럼 Wizard of Oz 테스팅도 사용자들이 실제 개발되지 않은 서비스를 실존하는 서비스처럼 착각하게 하여 테스팅을 진행하는 방법입니다. 아래 IBM의 ‘The listening type writer’ 일러스트 이미지를 보시면 조금 더 이해가 되실 겁니다. 사용자가 컴퓨터 마이크에 “Dear Henry”라고 말을 하면 커튼 뒤에 또 다른 사람(wizard)이 직접 사용자의 말을 듣고 타이핑을 해줍니다. 이를 모르는 사용자로서는 컴퓨터가 출력해주었다고 생각하며 편리한 기능이라고 생각할 것입니다.

[Fig.4] Wizard of Oz Prototyping

(출처: https://www.simpleusability.com/inspiration/2018/08/wizard-of-oz-testing-a-method-of-testing-a-system-that-does-not-yet-exist/)

어떻게 활용되나요?

WOZ 방법론은 가설을 빠르게 검증할 수 없는 AI(인공지능) 프로젝트에서 많이 활용되며 데이터가 없거나 기술이 완벽하지 않은 상황에서도 테스트를 진행할 수 있습니다. 또한, 시스템에 대한 사용자의 반응을 확인하며 반복적인 테스트를 통해 사용자 경험을 점진적으로 발전시킬 수 있습니다. 테스팅을 진행하기 전 명심해야 할 부분은 얻고자 하는 인사이트가 무엇인지 결정하는 것과 테스트 시 사용자들이 느끼기에 그럴듯하게(Believable) 프로토타입을 제작해야 합니다. 그리고 너무 복잡한 인터페이스 보다는 간단한 형태의 기능을 테스트하는 것이 효율적입니다.

인실리코젠에서는 생물정보를 활용하여 다양한 시스템을 개발하고 있습니다. 사용자 친화적이며 효율적으로 서비스를 디자인 및 개발을 하기 위하여 WOZ 방법론에 대해 알아보았습니다. 향후 직접 프로젝트에 적용해본 후 그 효과나 장단점에 대해서 알려드리겠습니다.

출처

[Reference 1] "Wizard of Oz testing – a method of testing a system that does not yet exist.", 2020년 6월 10일 접속, https://www.simpleusability.com/inspiration/2018/08/wizard-of-oz-testing-a-method-of-testing-a-system-that-does-not-yet-exist/

[Reference 2] "Making the machine believable: Wizard of Oz-ing AI applications.", 2020년 6월 12일 접속, https://uxdesign.cc/making-the-machine-believable-wizard-of-oz-ing-ai-applications-293cfbb0f244

[Reference 3] "[인공지능 in IT] 인공지능 UX 디자인 – 디자인 프로세스로 사용자 경험 설계하기.", 2020년 6월 12일 접속, https://www.donga.com/news/article/all/20190515/95530568/1

작성 : IX Team 김지인 주임 UX/UI 디자이너

Posted by 人Co

Tag: insilicogen, ix, UX, wizard of oz, woz
Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/349

이미지를 이용한 딥러닝의 개요

Posted at 2020/06/01 19:28
Filed under 지식관리

최근 여러 분야에서 딥러닝에 대한 관심이 많아지고 있습니다.
생물정보 분야에서는 MRI나 CT 같은 의료 이미지로 학습한 뒤, 질병을 진단하는 연구가 많이 진행되고 있습니다. 그렇다면 이미지를 이용한 딥러닝은 어떤 방식으로 진행될까요?

이미지 딥러닝은 어떠한지 알고 싶어도 코드 위주의 설명이 많아, 코드가 익숙하지 않은 분들은 시작부터 벽이 세워진 느낌이 드셨을 거예요. 코드가 익숙하신 분이시든 그렇지 않은 분이시든 이미지 딥러닝의 입문자분들께 개념 잡는 것에 대해 조금이나마 도움이 되셨으면 하여 알고리즘 개념 설명 위주로 이 글을 준비하였습니다. 그럼 이미지 딥러닝을 하기 위한 알고리즘에 대해 알아보기에 앞서, 컴퓨터는 이미지 파일을 어떤 방식으로 인식하는지에 대해 알아볼까요?

우리가 이미지를 인식하는 방식과 컴퓨터가 이미지를 인식하는 방식은 많이 다릅니다. 우리는 이미지를 눈에 보이는 모습을 그대로 받아들이지만, 컴퓨터의 경우는 숫자로 된 형태로 인식합니다. 숫자는 색의 명암을 나타내며, 0에 가까울수록 어두운색이고 255에 가까울수록 밝은색입니다. 그렇다면 색상은 어떻게 표현할까요? 흑백 이미지의 경우에는 1개의 채널로, 컬러 이미지의 경우엔 RGB(R-Red, G-Green, B-Blue) 3개의 채널로 빨강, 초록, 파란색 각각의 명암을 이용하여 이미지의 색상을 표현합니다.

[그림 1] 컬러 이미지의 구조 - Insilicogen (IX Team)

컬러 이미지는 각 픽셀을 채널별로 실수로 표현된 3차원 데이터입니다. 흑백 이미지는 2차원 데이터로, 1개의 채널로만 구성되어 있습니다.

[그림 2] 컬러 이미지의 3차 구조

(https://medium.com/@luigi.bungaro/the-power-of-machine-learning-applied-to-image-recognition-with-cnn-de7fc49b4d29)

위의 그림처럼 높이가 4 pixel, 폭이 4 pixel의 이미지일 경우,

컬러 이미지 데이터의 shape은 (4, 4, 3)

흑백 이미지 데이터의 shape은 (4, 4, 1)

로 표현합니다.

컴퓨터가 이미지를 어떤 방식으로 인식하는지에 대해 간단하게 알아봤습니다. 그럼 이제 이미지 딥러닝에선 어떤 알고리즘이 주로 사용되는지 알아볼까요? 딥러닝을 이용하여 이미지를 분류할 때에는 주로 CNN(Convolutional Neural Network) 알고리즘이 많이 사용되고 있습니다. 그렇다면, 이 CNN 알고리즘이 나오기 이전에는 어떻게 학습을 했을까요?

CNN 알고리즘 이전에는 Fully-connected Multi-layered Neural Network의 학습 방식을 이용하여 이미지 딥러닝을 수행했습니다.

[그림 3] Fully-connected Multi-layered Neural Network

(https://www.jeremyjordan.me/convolutional-neural-networks/)

형상을 가졌는지에 대해 알 수 없고, 각각의 픽셀을 1차원적으로 보게 됩니다. 이러한 학습 방식으로 인하여 이미지의 크기가 커져서 픽셀의 수가 많아진다거나 은닉층(Hidden layer)의 수가 증가하면 학습시간 및 학습해야 하는 매개변수(Parameter)의 수가 기하급수적으로 증가하게 됩니다. 또한, 이미지가 살짝 회전되었거나 gif처럼 이미지가 움직이는 상태라면 이를 같은 이미지라고 인식하지 못하므로, 조금이라도 변화가 생길 때마다 새로운 입력으로 이미지 데이터를 처리해 주어야 합니다. 그럼 이미지를 분류하기 위해 Fully-connected 학습 방식처럼 이미지의 모든 픽셀이 꼭 중요할까요? 그렇지 않습니다. 이미지의 특성을 찾는 데에 중요하게 작용하는 픽셀이 있지만, 단순히 배경인 부분이라 픽셀 정보를 가지고 있지 않더라도 이미지를 구분하는 데 큰 영향을 주지 않기 때문입니다. 이미지 분류를 하는 데 중요하지 않은 픽셀은 제거하고 학습을 하기 위해 고안된 알고리즘이 바로CNN(Convolutional Neural Network)입니다.

그렇다면 CNN 알고리즘은 어떠한 구조를 이루고 있을까요?

[그림 3] CNN 알고리즘의 구조

(https://www.quora.com/What-is-max-pooling-in-convolutional-neural-networks)

CNN은 크게 이미지의 특징을 추출하는 부분과 클래스를 분류하는 부분으로 나뉩니다. 특징 추출 영역은 합성곱층(Convolution layer)과 풀링층(Pooling layer)을 여러 겹 쌓는 형태(Conv+Maxpool)로 구성되어 있습니다. 그리고 이미지의 클래스를 분류하는 부분은 Fully connected(FC) 학습 방식으로 이미지 분류를 합니다.

합성곱이란, 주어진 이미지 데이터를 합성곱 필터(Convolution filter)를 통해 이미지 분류에 중요하게 작용할 feature들을 추출하는 데 사용됩니다. CNN 알고리즘 이전에 사용되었던 FC 알고리즘과 달리, 이미지의 형태를 유지하기 때문에 합성곱층을 지나더라도 인접한 픽셀에 대한 정보를 알 수 있습니다. 그렇다면, 합성곱에서 사용되는 합성곱 필터는 무엇일까요? 우선, CNN에서 필터는 커널(Kernel)이라고도 합니다. 필터는 이미지의 공용 매개변수(weight)로 작용하며, 주어진 이미지를 슬라이딩하면서 이미지의 feature들을 찾아냅니다. 여기서 공용 매개변수라고 하는 이유는 합성곱을 진행할 때, 하나의 이미지에 대해서 하나의 필터가 사용되기 때문입니다. 일반적으로 (3, 3)이나 (4, 4)와 같은 정사각 행렬로 정의가 되고, 주어진 이미지를 지정된 간격(Stride)만큼 순회합니다. 그럼 합성곱 필터를 이용하여 합성곱 연산은 어떤 방식으로 진행되는지 알아보기 위해, 아래의 그림으로 설명하겠습니다.

[그림 5] Convolution 연산

(https://indoml.com/2018/03/07/student-notes-convolutional-neural-networks-cnn-introduction/)

위의 그림에서 주어진 이미지 데이터의 크기는 6x6이고, 필터의 크기는 3x3입니다. 이미지를 순회하는 간격(stride)은 1입니다. 연산은 이미지와 필터가 서로 겹쳐지는 부분은 곱을, 각각의 곱은 합하는 방식으로 진행됩니다. 위의 그림에서 Result 아래에 적힌 연산을 참고하시면 이해가 더 쉬우실 거예요.

[그림 6] Convolution layer
(https://eg.bucknell.edu/~cld028/courses/379-FA19/NN/convTF-Walk-Thru.html)

위의 그림은 합성곱 연산이 진행되는 방식입니다. 이 그림 역시 필터가 이미지를 순회하는 간격은 1입니다. 이처럼 합성곱을 진행하여 얻어진 결과를 피처맵(Feature Map, 위의 그림에서는 오른쪽의 분홍색)을 만듭니다. 여기서 피처맵은 주어진 이미지에서 특징들을 추출한 것이고, 액티베이션맵(Activation Map)이라고도 합니다. 피처맵은 여러 가지의 의미로 사용되지만, 액티베이션맵은 주로 합성곱층의 최종 출력 결과를 의미합니다.

합성곱층에서 필터와 스트라이드의 작용으로 이미지(피처맵)의 크기는 입력 데이터보다 작아지게 됩니다. 그렇다면 합성곱층을 지나면 이미지가 자꾸 줄어드는데, 계속 반복적으로 합성곱층을 지나면 이미지가 없어지지 않을까? 라는 생각이 들게 되죠. 이를 방지하는 방법이 패딩(Padding)입니다. 패딩은 입력 데이터의 외각에 지정된 픽셀만큼 특정 값으로 채워 넣는 것을 의미하고, 보통 0으로 값을 채워 넣습니다.

[그림 7] Padding
(https://d2l.ai/chapter_convolutional-neural-networks/padding-and-strides.html)

위의 그림을 보면, 3x3 이미지의 외각에 0이 채워진 것을 볼 수 있습니다.

[그림 8] Pooling

(https://www.quora.com/What-is-max-pooling-in-convolutional-neural-networks)

지금까지 합성곱에 대해서 알아보았습니다. CNN 알고리즘에서 이미지 특징을 추출하는 부분에서 합성곱층 다음으로 나오는 층은 풀링층(Pooling layer)입니다. 합성곱층의 출력 데이터(액티베이션 맵)를 입력으로 받아, 출력 데이터의 크기를 줄이거나 특정 데이터를 강조하는 용도로 사용됩니다. 풀링층을 처리하는 방법으로는 Max, Average, Min Pooling이 있습니다. 정사각 행렬의 특정 영역 안에 값의 최댓값, 평균 혹은 최솟값을 구하는 방식이고, 주로 Max Pooling을 사용합니다. 앞의 합성곱처럼 인접한 픽셀값만을 사용한다는 것은 비슷하지만, 합성곱처럼 곱하거나 더하는 연산 과정이 없어서 학습이 필요한 부분이 없고 입력 데이터의 변화에 영향을 적게 받습니다. 이는 최댓값, 평균값, 최솟값 중 하나를 구하는 것이기 때문에, 입력 데이터가 조금 변하더라도 풀링의 결과는 크게 변하지 않습니다.

앞에서 설명해드렸던 바와 같이, CNN은 크게 특징 추출(Feature extraction) 부분과 분류(Classification) 부분으로 나뉩니다. 특징 추출은 합성곱층과 풀링층이 반복적으로 수행되고, 분류는 앞에서 추출된 Feature들이 Fully-connected layer 학습 방식을 이용하여 어떤 이미지인지 분류합니다.

참고) 학습시킬 이미지가 부족하시다면! 이미지 학습을 위한 open data source

이미지 분류하기 위해 이미지를 학습시킬 때, 하나의 클래스(ex. 강아지 클래스, 고양이 클래스)당 최소 1,000장이 필요합니다. 학습을 많이 시키면 많이 시킬수록 이미지를 분류하는 정확도는 당연히 올라갑니다. 그렇다면, 이미지 학습을 하기 위해서 많은 양의 이미지 데이터가 필요하겠죠? 딥러닝이 활성화되면서 공개 이미지를 수집하는 데이터베이스가 많아졌고, 대표적으로 ImageNet과 Kaggle 등이 있습니다. 이미지를 학습하는 데 필요한 이미지 데이터를 공개적으로 제공하는 사이트이므로, 아래 사이트를 들어가시면 이미지 딥러닝 활용에 여러 방면으로 도움이 될 것입니다. :)

[그림 9] ImageNet

(http://www.image-net.org/)

[그림 10] Kaggle

(https://www.kaggle.com/)

CNN 알고리즘에 대해서 더 자세하게 설명해 드리고 싶었지만, 그러면 본 취지에 맞지 않을 것 같았어요. 제가 생각하기에 이미지 딥러닝의 입문자분들께 가장 필요한 부분 위주로 이 글을 작성하였습니다. 이 글에 적힌 것들을 바탕으로 궁금한 부분이 생길 때마다 조금씩 조금씩 자료를 찾다 보면, 깨닫지 못한 사이에 이미지 딥러닝에 대해 많이 알게 되실 거예요. 조금이나마 도움이 되셨길 바라며, 너무 두려워하지 마시고 힘내시길 바랍니다. :D

작성 : RDC 김주연 사원

Posted by 人Co

Tag: CNN, insilicogen, 딥러닝, 인실리코젠
Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/346

인실리코젠 창립 15주년

Posted at 2019/10/30 12:48
Filed under 회사소식

날씨가 좋은 2019년 10월 1일, 인실리코젠은 15주년을 맞이하였습니다.

광교 Alleyway의 세상의 모든 아침에서 식사를 하며 추억의 사진과 영상을 찍었습니다.

많은 분들이 웃는 모습으로 행사에 참여해주셔서 감사했습니다.

영상을 같이 보실까요??

브랜드 위원회 : 김지인

Posted by 人Co

Tag: 15주년, Bioinformatics, insilicogen, 세상의 모든 아침, 인실리코젠
Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/328

나만 몰랐던 BLAST 꿀팁

Posted at 2019/09/11 16:26
Filed under 생물정보

19세기의 자전거란 현재와 달라서 금속의 바퀴로 이루어져 쉽게 사고로 이어지곤 했답니다.
이에 영국의 수학자 던롭은 사랑하는 외동아들 조니를 위해 고무 타이어를 발명하게 되고 공기타이어회사 CEO로 큰 부자가 되게 됩니다.
저 역시 필요 때문에 (더 빨리, 더 쉽게 처리하고 칼퇴하고자) 다음의 방법들을 발견하게 되었으니 평행이론에 따라 언젠가는 저도 큰 부자가 될..... 수 있을까요?

발단은 몹시 사소했습니다.
아래 그림처럼 결과를 만들면 매우 있어 보일 것 같았거든요.

<출처 : GraPhlAn 프로그램 위키 페이지>

그런데 내 손에 있는 건 단백질 서열 단 하나, 계통수를 그리기 위한 DB가 아직 구축되어 있지 않은 상황이었어요.
하지만 걱정 없죠. 백종원 대표님께 만능 간장이 있다면 우리에겐 만능 BLAST가 있으니깐요.
BLAST를 통해 맵핑되는 단백질들을 모은 후 이를 이용하여 계통수를 그려보기로 합니다.
BLAST에 대한 기본 설명이나 분석 방법 등은 위키 (Wiki) 기반의 커뮤니티 형성을 통한 생물정보 분야의 집단 지성 창출을 목적으로 운영되는 지식 커뮤니티인 人CoDOM을 참고해주세요.

그런데 여기서 문제 발생!!!
nr에 대한 BLAST를 다 끝내고 보니 (default setting의 tabular format으로 출력) 결과 파일에서 종명을 확인할 수 없었어요.
종명을 확인 못 하면 계통수를 그려도 계통별로 잘 묶였는지 확인도 어렵고 예쁜 색을 입혀줄 수도 없어요.

MH00089;   gi|761546247|ref|YP_009122458.1|   99.06   530   5       0   1   530   1   530   0.0   1045
MH00089;   gi|1314948409|ref|YP_009444547.1|   94.70   528   28      0   3   530   1   528   0.0   995
MH00089;   gi|1079486692|ref|YP_009307015.1|   94.89   528   27      0   3   530   1   528   0.0   991

< BLAST 수행 결과 예시>

종명 확인을 위해서는 NCBI에 GI number (또는 accession)로 검색해보는 수밖에 없는 듯 하여 매우 절망스러웠지요.
실제로 하나 검색에만 최소 클릭 5~6번이 소요되고 10개 넘어가면 웹 크롤링을 해야하는 건지 고민하게 됩니다.
이때 잘 읽은 메뉴얼 하나가 사람을 살립니다.
역시 오랜 역사를 자랑하는 생물정보 산증인 BLAST는 이미 해답을 제시하고 있었던 거죠.

아래와 같이 2단계를 순서대로 수행해 주시면 BLAST 결과에서 종명, taxid (중요), kingdom (계) 정보를 바로 확인할 수 있습니다.

1단계) taxonomy DB 세팅
먼저 nr로부터 계통 정보를 가져올 수 있도록 NCBI에서 제공하는 taxonomy DB를 세팅해 주어야 합니다.
아래와 같이 최신 버전으로 다운로드 후 환경변수에 추가해 주세요.
(이참에 nr DB도 최신 버전으로 변경해주고, 하는 김에 BLAST도 최신화해주는 게 어떨까요?)
참고로 제가 테스트했던 버전은 BLAST+ 2.2.31입니다.

$ wget ftp://ftp.ncbi.nlm.nih.gov/blast/db/taxdb.tar.gz
$ tar zxvf taxdb.tar.gz
$ export BLASTDB=[download 위치]

2단계) BLAST 실행

BLAST 수행 시 결과 파일의 포맷을 6번, 즉 tabular로 지정하고 format specifiers에 staxids(species taxon id)와 sscinames (species scientific name), sskingdoms (species super kindoms)이 포함되도록 적어줍니다.

$ blastp -query query.faa -db nr -outfmt '6 qseqid sseqid pident evalue staxids sscinames scomnames sskingdoms stitle' -num_threads 20 -out query_vs_nr.table

짜잔~ 커맨드라인 하나로 손목 수명이 일주일 연장되었습니다 (감격).
하는 김에 stitle (species name)도 추가하였더니 이제 정말 NCBI 웹사이트 들락날락할 일 없어졌어요.

MH00089;        gi|761546247|ref|YP_009122458.1|        99.06   0.0     1610689 Sarocladium implicatum  Sarocladium implicatum  Eukaryota       cytochrome oxidase subunit I (mitochondrion) [Sarocladium implicatum]
MH00089;        gi|1314948409|ref|YP_009444547.1|       94.70   0.0     29910   Tolypocladium inflatum  Tolypocladium inflatum  Eukaryota       cytochrome c oxidase subunit 1 (mitochondrion) [Tolypocladium inflatum]
MH00089;        gi|1079486692|ref|YP_009307015.1|       94.89   0.0     71617   Tolypocladium ophioglossoides   Tolypocladium ophioglossoides   Eukaryota       cytochrome oxidase subunit 1 (mitochondrion) [Tolypocladium ophioglossoides]

< BLAST 결과 예시>

한계점)
하지만 결과를 보면 박테리아인지 진핵인지와 같이 계 (kingdom)에 대한 정보만 제시하고 있어요.
근연종의 단백질에 잘 맵핑이 된 것인지 전체 계통 정보를 확인하고 싶고 진핵생물 내에서도 딱정벌레목인지 총채벌레목인지 좀 더 세분화하고 싶은데 이 상태로는 너무 부족합니다.

제가 찾은 방법은 NCBI에서 제공하는 텍스트 포맷의 관련 DB에서 taxid 또는 학명(scientific name)으로 검색하는 것입니다.
참고로 최근 1~2년 사이 NCBI taxonomy DB가 업데이트되면서부터 taxid 별 full lineage 정보를 제공하고 있으니 꼭 최신 버전을 받아주세요.
new_taxdump.tar.gz 파일을 다운로드 후 그 안에 있는 fullnamelineage.dmp 파일을 확인하면 정보를 얻을 수 있습니다.

taxid | scientific name | full lineage
1610689 |       Sarocladium implicatum  |       cellular organisms; Eukaryota; Opisthokonta; Fungi; Dikarya; Ascomycota; saccharomyceta; Pezizomycotina; leotiomyceta; sordariomyceta; Sordariomycetes; Hypocreomycetidae; Hypocreales; Hypocreales incertae sedis; Sarocladium;        |

추가 팁 하나 더!)
BLAST 결과 출력시 파일 포맷을 여러 개로 하고 싶을 때가 있어요.

XML은 기본이니깐 꼭 있어야 할 것 같고 파싱하기 귀찮으니 tabular로도 해야 할 것 같고 또 alignment된 거 확인하고 싶으니 pairwise로도 남겨두고 싶을 때 어떻게 해야하는 거죠??

BLAST를 3번 하면 돼요. 하지만 오래 걸린다는 단점이 있어요.
이때 blast_formatter를 사용하시면 됩니다 (작업시간이 1/3로 줄어드는 매직)!!!
몰랐는데 BLAST 설치 디렉토리에 이미 blastp, blastn이랑 같이 자리잡고 있더라구요.
(역시 메뉴얼은 읽으라고 있는 거였어요.)
중요한 점은 처음 BLAST할 때 반드시 asn 포맷으로 출력해 주어야 한다는 것입니다.

$ blastn -db [nt] -query [query] -outfmt 11 -out [output].asn
$ blast_formatter -archive [output].asn -outfmt 5 -out [output].asn.xml
$ blast_formatter -archive [output].asn -outfmt 6 -out [output].asn.tabular
$ blast_formatter -archive [output].asn -outfmt 0 -out [output].asn.pairwise

출력 포맷은 아래를 참고하셔서 원하는 번호를 기재해 주시면 됩니다.

 0 = pairwise,
 1 = query-anchored showing identities,
 2 = query-anchored no identities,
 3 = flat query-anchored, show identities,
 4 = flat query-anchored, no identities,
 5 = XML Blast output,
 6 = tabular,
 7 = tabular with comment lines,
 8 = Text ASN.1,
 9 = Binary ASN.1,
10 = Comma-separated values,
11 = BLAST archive format (ASN.1),
12 = JSON Seqalign output,
13 = JSON Blast output,
14 = XML2 Blast output

<출력 가능한 BLAST 결과 포맷 목록>

이상 새롭지 않을 수 있을, 그리고 정말 저만 알았다면 너무 슬프고 민망할 것 같은 BLAST 꿀팁 소개를 마칩니다.
이 방법 외에도 오조오억 개의 다른 길이 있을 겁니다. 아시는 분은 제보 바랍니다.
당신은 우리와 함께 가시면 안 될까요??? (=스카우트하고 싶어요).

<출처 : 'Mnet 쇼미더머니8 화면캡처' 후 편집>

작성 : RDC 정명희 선임 연구원

Posted by 人Co

Tag: Bioinformatics, insilicogen, 생물정보학, 인실리코젠
Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/324

Special Culture Day 2019 !

Posted at 2019/07/12 10:57
Filed under 회사소식

드디어 본격적인 여름이 시작된 것 같습니다.

이번 Culture Day가 특별했던 이유 3를 공개합니다.

1. 블루베리와 함께

심재영 선임님 아버지께서 정성으로 키우신 유기농 블루베리를
직원들의 건강을 위해
사장님께서 선물하셨습니다!! 짜잔~

새콤달콤한 블루베리를 맛보며, 오전 업무를 마치고,

극장으로 고고~~~!

2. 인코인턴십 분들과 함께

우리 회사와 특별한 인연으로 만난 13명의 인턴과 함께하였습니다.

이제 영화 보러 가실까요! 슝!! 아~참!! 팝콘이 빠지면 안 되겠죠?

팝콘 세트 주문 후 들어가겠습니다 ~~

이번 스파이더맨 파 프롬 홈은 16살 Peter Parker의 히어로로 성장하는 스토리입니다. 청소년인 Peter Parker는 MJ라는 여학생을 좋아합니다. 그래서 단체로 유럽 여행을 갈 때 그녀와 잘 되기 위한 계획을 세웁니다. 그런데 히어로서의 막중한 임무가 주어지게 되고 내적 갈등을 겪습니다. 그때 새로운 히어로, 미스테리오의 꾀에 넘어가 아이언맨이 준 안경을 그에게 주게 되는 실수를 하게 됩니다. 너무 많은 내용을 말하면 아직 안 보신 분들에게 스포일러가 되기 때문에 나머지 내용은 영화관에서 ~

영화 관람 후 맛난 저녁식사를 위해 풀잎채로 향했어요~

맛있는 건강식을 먹으며 Culture Day를 마무리했습니다 ~

3. 동일 생일자 3명과 함께~

끝으로 세 번째 특별했던 이유는 생일자가 세 분이었다는 것입니다.

오랜 시간 함께 일해오신 김형용 박사님, 신가희 박사님, 그리고,

직원 모두의 생일을 챙겨주시는 장은철씨까지 세 분의 생일을 축하드립니다~

마지막으로 단체 컷 찰칵 ~

지금까지 인코 문화 중 하나인 컬처데이에 대한 이야기였습니다.

모두에게 또 하나의 추억이 되었길 바랍니다.

브랜드위원회 제5기 김지인

Posted by 人Co

Tag: 2019, CultureDay, insilicogen, spiderman, 인실리코젠
Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/318

올겨울 내내 힘들었던 독감, 인플루엔자 바이러스….

Posted at 2019/03/02 22:44
Filed under 생물정보

언제부터인지 우리는 쌀쌀해진 기온이 코끝을 스치면 독감 예방주사를 맞고 겨울을 준비한다. 독감은 일반적인 감기와는 달리 전염성이 매우 크고 폐렴으로 이어지는 경우가 많아 일반인들에게도 다르게 인식되어 있다. 그도 그럴 것이 감기는 서로 다른 여러 종류의 바이러스들로 유발되지만, 독감은 '인플루엔자 바이러스'라는 명확한 질병체가 밝혀져 있고 그 치료제도 개발되어 있다. 그런데 왜 매번 다른 독감 예방접종을 하고, 증상이 조금씩 다를까? 그 이유는 매우 똑똑한 진화를 거듭하며 스스로 변화하고 있기 때문이다.

인플루엔자 바이러스 구조

[그림 1] 인플루엔자 바이러스의 구조

(출처 : 이일하 교수의 생물학 산책, 이일하)

독감 인플루엔자 바이러스는 nucleocapsid (NP)와 matrix (M) 단백질의 차이에 의해 크게 A, B 및 C형으로 구분된다. 이중 잦은 변이를 일으키며 사람에게 질병을 유발하는 것은 A형으로 바이러스 표면에 존재하는 헤마글루티닌(HA)과 뉴라미니데이즈 (NA)의 다양한 조합으로 그 형태를 변화시키고 있다. 현재 밝혀진 헤마글루티닌의 sub-type은 16개(H1~H16), 뉴라미니데이즈의 sub-type은 9개(N1~N9)로 대략적인 조합수를 생각해 봐도 144개의 다른 인플루엔자바이러스가 만들어질 수 있음을 알 수 있다. 그러나 더욱 문제가 되는 부분은 이러한 조합을 통한 변이 발생이 사람만을 숙주로 하는 것이 아니라 조류와 돼지에서도 발생이 되고, 서로 공유되어 더 다양한 변이가 발생할 수 있다는 것이다. 현재까지 보고에 의하면 사람에서는 주로 A/H3N2형, A/H1N1형 및 B형이 유행하고 있는데 변이를 통해 새로운 바이러스 주가 출현할 경우 유병률과 사망률이 많이 증가하는 것으로 보고되고 있다. 때문에, WHO를 중심으로 전 세계 인플루엔자 감시체계가 운영 중이며 그 유전자형을 밝혀 백신주와 처방제를 제시하는 등 유행에 대비하고 있다.

그렇다면 어떻게 올해 유행할 백신주를 제시하는 걸까?

일반적으로 WHO는 매해 2월 해당연도에 유행할 백신주를 제시하고 있는데, 이는 지난해 남반구에서 가장 유행한 A형 바이러스 2종류와 B형 바이러스 1종을 선정하여 북반구 지역의 나라들에 제시한다. 이를 백신화 한 것이 3가 백신이고, 여기에 B형 1종을 추가한 것이 4가 백신이 된다. 참고로, B형은 2개의 sub-type이 존재하는데, 이 중 한 종류의 항체만 가져도 나머지 한 종에 대한 방어를 어느 정도 수행할 수 있으므로 3가 백신만으로도 충분할 수 있다. 또한, 예방 접종 후 항체 형성은 2주, 효과는 6개월 정도 지속된다고 한다.

바이러스의 유전자형은 어떻게 판별되는 것일까?

유행하는 바이러스의 유전자형은 qRT-PCR을 통해 빠르게 확인한다. 이때, NP, M 또는 HA 유전자를 증폭시켜 유전자 염기 서열을 비교 분석 하게 된다. 각 sub-type은 재조합 변이에 따라 서로 유사 정도가 다른데, 그림 2와 같이 크게 두 그룹으로 구분되어 진다. 이러한 유전자 변이 정도에 따르면 H1, H2, H5, H6의 경우 모두 H1에서 변형된 형태로 볼 수 있다. 이러한 정보는 이후 임상학적 표현형이나, 숙주(사람, 조류, 돼지 등)의 기원을 예측할 수 있고, 나아가 예방, 예찰의 자료로 활용된다.

독감 즉 신종플루 치료제 타미플루의 기작은 어떻게 될까?

인플루엔자 바이러스는 숙주세포의 표면에 sialic acid를 포함한 receptor에 부착한 후 8개의 segments로 구성된 바이러스 유전체를 숙주세포의 세포질로 밀어 넣는다. 이때, 세포막 일부가 유입된 유전체 서열의 막을 형성하는 엔도좀을 형성하게 된다. 형성된 엔도좀 내부는 낮은 pH를 유지하게 되는데, 이로 인해 바이러스의 lipid layer, 즉, 껍질이 분해되고 바이러스 핵산이 세포질에 노출되게 된다. 노출된 핵산중 heterotrimeric influenza polymerase (FluPol)를 코딩하는 유전체만이 숙주세포의 핵 안으로 이동하게 된다. 이후 숙주세포의 polymerase CTD (c-terminal domain)를 인지하여 바이러스의 유전자를 역전사시키고 복제시킨다. 절대적으로 숙주 세포의 시스템을 활용하여 바이러스 유전자를 대량 복제시키는 시스템으로 이를 cap-snatching 이라 하며, 이로 인해 숙주 세포의 유전자가 발현되지 않는 것을 host shut-off라 한다.

숙주세포의 시스템을 이용해 다량 생산한 바이러스 단백질들은 다른 세포로의 이동을 위해 virus particle을 형성하고 숙주세포로 부터 떨어져 나와 다른 세포로 확산된다. 이때, 바이러스는 HA와 NA를 표면에 이미 배치하고, 숙주 세포의 표면에 존재하는 sialic acid와 HA가 최종 결합되는 구조를 형성한다. 이후 NA(neuraminidase)는 근처의 HA와 sialic acid 결합을 끊어 세포로부터 분리 되게 한다. 타미플루는 이러한 바이러스 생활사 중 NA의 활성을 억제하여 다른 세포로의 확산을 방지하는 방법으로 바이러스에 대응하고 있어야 한다. 바이러스의 증식은 일반적으로 감염 후 48시간 이내에 모두 이뤄진다. 따라서 타미플루의 복용은 감염 후 48시간 이내에 이뤄져야 NA 활성을 낮춰 세포 내 확산을 막을 수 있다.

작성 : RDC 신윤희 센터장

Posted by 人Co

Tag: Bioinformatics, insilicogen, 인실리코젠
Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/306

인실리코젠 2018 송년회 2019 시무식

Posted at 2019/01/07 16:23
Filed under 회사소식

이 또한 추억이 되겠죠?
2018년을 보내는 인실리코젠 송년회와
2019년을 맞는 시무식 장면입니다.
여러분 모두 2018년 한 해 동안 수고하셨고, 소망 이루시는 2019년 되길 바래요~
인실리코젠의 문화를 만들어가는 브랜드위원회분들...
2년 동안 솔선수범하여 활동하시느라 수고하신 4기 분들께 감사하며, 새롭게 활동하실 5기 분들의 활약도 기대할께요~

작성자 : 브랜드위원회, 편집에 도움주신 분 : 김영종

Posted by 人Co

Tag: insilicogen, 인실리코젠
Response: No Trackback , No Comment
RSS :: https://post-blog.insilicogen.com/blog/rss/response/301

Search Results for 'insilicogen'

54 POSTS

병원에 가지 않아도 나의 건강을 진단하고 치료한다?! - 라이프로그와 헬스케어

8 Point Grid, 더 적은 결정 = 더 적은 시간

人CoINTERNSHIP 2020 하계 프로그램 후기 (제11기)

효율적인 시스템 및 서비스 디자인을 위한 UX 디자인 방법론, Wizard of Oz Prototyping

이미지를 이용한 딥러닝의 개요

인실리코젠 창립 15주년

나만 몰랐던 BLAST 꿀팁

Special Culture Day 2019 !

올겨울 내내 힘들었던 독감, 인플루엔자 바이러스….

인실리코젠 2018 송년회 2019 시무식

Categories

Recent Posts

Archives

Tag Cloud

Site Stats