빅데이터의 대두 

“빅데이터는 당신이 무엇을 선택할지 알고 있다”


2012년 미국 대선 당시에 오바마는 데이터 분석 전문가, 수학자, 통계학자, 예측 분석 전문가 등으로 대선 캠프를 구성하고 빅데이터 팀을 만들었습니다. 그리고 그 팀원들과 함께 SNS를 통해 데이터를 수집하여 국민의 관심사를 파악하는 등 치밀한 과학적 분석과 통계를 토대로 대선 당시에 파란을 일으켰습니다.

사용자 삽입 이미지
사진출처: https://www.washingtonpost.com/opinions/obama-the-big-data-president/2013/06/14/1d71fe2e-d391-11e2-b05f-3ea3f0e7bb5a_story.html?noredirect=on&utm_term=.ee4dd29e00cf

오바마는 미국 선거권자 집단 중 부동층을 파악하기 위해 노력하였고 그런 부동층 사람들에게 개인별로 맞춤형 선거 캠페인을 전개하였습니다. 부동층 개개인의 성향과 취향을 파악하여 자신에게 표를 던질 수 있도록 유도하는 데에 빅데이터 기술을 사용한 것입니다. 심지어는 부부에게도 남편의 취향에 맞는 공약과 아내의 취향에 맞는 공약이 따로 갔다고 합니다.

또한, SNS를 통해 파악되는 정보를 활용하여 초고성능 컴퓨터로 향후 대선 판세가 어떻게 흘러갈지에 대한 다양한 시나리오들을 매일 밤 6만6천 번이나 시뮬레이션해보았다고 합니다. 다양한 정책들을 여러 방식으로 전달했을 때 민심의 향배가 어떻게 바뀌는지 세밀하게 예측하고 움직였다는 것입니다. 실제로 데이터 사이언티스트인 드류 린저(Drew Linzer)는 빅데이터를 활용하여 2012년 6월 자신의 웹사이트에 버락 오바마와 미트 롬니의 집표 결과를 예상하는 포스트를 기재하기도 하였습니다. 실제 집표 결과에서도 드류 린저가 예상한 데로 오바마는 롬니를 제치게 됩니다.

오바마가 대선에서 일으킨 파란과 동시에 세계는 빅데이터 열풍이 불어왔습니다. 빅데이터는 이제 기업들 사이에서 불가분의 관계가 되었고 ‘딥 러닝’의 개발 이후에 더욱 급격한 성장을 보이고 있습니다. 바야흐로 대 빅데이터 시대가 열린 것입니다.

빅데이터의 활용사례 


사진출처: https://commons.wikimedia.orgwikiFileGoogle_2015_logo.svg

세계적인 검색포털사이트인 구글은 검색되는 많은 정보들을 토대로 빅데이터를 활용하는 것으로 유명합니다. 또한, 구글은 검색뿐만 아니라 구글 번역 서비스에서도 빅데이터를 활용하고 있습니다. 수억 건의 문장과 번역문을 데이터베이스화하여 번역 시 유사한 문장과 어구를 기존에 축적된 데이터를 바탕으로 추론해 나가는 통계적 기법의 기술을 사용해 번역 서비스를 제공하고 있습니다.

사진출처: https://commons.wikimedia.org/wiki/File:Amazon.com-Logo.svg

온라인 쇼핑몰의 선구자인 아마존은 빅데이터 분석을 이용해 고객을 이해하고 구매를 추천하고 있습니다. 근래에는 빅데이터를 통해 고객이 구매하기 전에 배송을 준비하는 예측 배송(anticipatory shipping) 서비스를 시도하고 있습니다. 이는 고객 자신보다 고객을 더 잘 이해하는 것으로 알려진 아마존의 빅데이터 분석 역량에 바탕을 두고 있습니다.

사진출처: https://commons.wikimedia.org/wiki/File:YouTube_Logo_2017.svg

하루 40억 회 이상의 동영상이 검색되는 유튜브도 이용자가 선호하는 동영상의 채널을 구성할 수 있도록 개별 홈페이지를 제공하고 있습니다. 개인별로 동영상 이용 데이터가 축적되면서 이를 다양한 정보와 연계해 개인 맞춤형 서비스를 제공합니다.

사진출처: https://www.baemin.com/

배달의 민족은 최근 빅데이터를 활용한 광고 플랫폼인 우리 가게 마케팅 센터를 선보였습니다. 배달의 민족을 통해 들어오는 하루 평균 1,100만 건 이상의 주문 데이터를 분석하여 업종 지역 등에 맞춰 광고 상품을 기획해줍니다.

마치며...

사실 오바마 캠프에서만 빅데이터를 사용한 것은 아닙니다. 2012년 미국 대선 당시에 롬니 또한 빅데이터를 사용하여 대선을 준비하였지만, 빅데이터에 접근 방식이 오바마 캠프와 확연한 차이를 보였습니다. 롬니는 데이터를 통해 대선 흐름을 파악한 것이 아니라 진실과는 상관없이 ‘롬니가 앞서가고 있다’는 공화당이 원하는 답을 듣는 데 사용했습니다. 한 마디로 공화당은 그들이 앞서가고 있음을 증명하기 위해 분석을 사용한 반면, 오바마 캠프는 승리를 확정 짓기 위해 사용하였습니다.

이처럼 빅데이터가 혁신적인 기술임에도 불구하고 어떠한 목적으로 사용하는가에 따라 다른 양상을 보인다는 것을 항상 깊게 생각하고 제대로 된 목적을 마음속에 새겨둔다면 혁신적인 기술로서 더욱 나은 삶을 향해 나아갈 수 있을 것입니다.

우리 (주)인실리코젠은 개인 맞춤 식품 추천을 위한 빅데이터 기반의 식품 데이터베이스를 구축하고 있고, 방사선에 대한 생물의 반응 자료를 수집하고 복잡계 데이터베이스를 구축하는 사업을 추진하고 있습니다. 또한 치매와 노화의 생물학적 빅데이터 시스템을 연구자에게 제공하고 있습니다. 우리 삶에 좋은 변화를 이끌 수 있는 데이터 기술 확보를 통해 생물정보 전문기업의 가치를 높이는 일을 지속적으로 수행해 나갈 것입니다.

참고문헌

1. 고한석, 『 빅데이터 승리의 과학』, 이지스퍼블리싱(2013)
2. 위키피디아(빅데이터)
3. KISTEP InI 14호_빅데이터 분석의 국내외 활용 현황과 시사점


작성자 : BS실 김정석 개발자


Posted by 人Co

2018/06/04 14:20 2018/06/04 14:20
Response
No Trackback , No Comment
RSS :
https://www.insilicogen.com/blog/rss/response/282

우장춘의 삼각형

봄에 피는 유채꽃

싱그러운 봄꽃 구경은 많이 하셨나요? 추운 겨울을 지나고 따듯한 봄에는 정말 많은 꽃이 핍니다.
가장 먼저 피는 진달래부터 벚꽃, 동백꽃, 철쭉 등 정말 다채로운 꽃들이 개화하는 시기여서 많은 사람을 설레게 합니다. 특히 제주도를 비롯한 남부 지방에 광활하게 개화한 유채꽃밭은 관광명소로도 유명합니다.


이미지 출처 : 출사코리아 남지유채꽃 축제 김병영作  http://chulsa.kr/23046174

유채는 관상용뿐만 아니라 카놀라유, 쌈 채소인 가랏나물, 부신백질이양증(ALD) 치료제인 로렌조 오일에 원료 등으로 사용됩니다. 또한, 유채는 생물학계에 큰 파문을 일으킨 식물 중 하나입니다. 유채의 경우 배추와 양배추의 자연 교잡으로 생겨난 식물이며 '종의 합성' 이론을 뒷받침해주는 식물입니다.

이러한 사실을 증명해 낸 것은 '씨 없는 수박'으로 유명한 한국의 육종학자 우장춘 박사님입니다.

우장춘의 삼각형

종의 합성 이론은 '배추속 식물에 관한 게놈 분석'이라는 박사 논문을 통하여 최초로 학계에 발표했습니다. 배추(B. campestris, 염색체 수 n=10)와 양배추(B. oleracea 염색체 수 n=9) 씨앗을 교배해 새로운 식물을 만들어 냈습니다. 새로운 식물의 염색체 수는 19개이고 이는 배추의 염색체 개수 10개와 양배추의 염색체 개수 9개에서 유래된 것입니다. 결국, 이 새로운 식물은 기존의 자연 상에 존재하던 유채(B. napus 염색체 수 n=19)와 같은 식물임을 입증해낸 것입니다.

이뿐만 아니라 배추와 흑겨자(B. nigra 염색체 수 n=8)를 교배하면 갓(B. Juncea 염색체 수 n=18)이 만들어지고 흑겨자와 양배추를 교배하면 에티오피아 겨자(B. carinata)가 만들어지는 것을 밝혀냈는데 이를 우장춘의 삼각형(U's triangle)이라 부릅니다. 그는 이를 통해 속이 같고 종이 다른 식물이 유전적으로 서로 연결돼 있다는 사실을 처음으로 증명한 것입니다.


이미지 출처 : by Adenosine(English Wikipedia) CC BY-SA 2.5

원 안은 염색체로 녹색은 배추(n=10), 파란색은 양배추(n=9), 빨간색은 흑겨자(n=8)의 염색체이며 n은 염색체 수입니다. 이들 사이에서 에디오피아 겨자(n=17), 갓(n=18), 유채(n=19)를 만들 수 있습니다.

추후 이 연구는 세종대학교 김현욱 교수(前 : 국립농업과학원 생물소재공학과 연구사) 유채 유전자 분석을 통해 '오메가6 지방산' 생산 유전자가 배추와 양배추에서 유래됐음을 확인한 사례도 있습니다.

연구 결과 유채에는 오메가6 지방산 생산 유전자인 'FAD2 불포화지방산 생산 유전자'가 4개 존재하며, 그중 2개는 배추에서 나머지 2개는 양배추에서 각각 유래됐음이 밝혀낸 것입니다.




이미지 출처 : 충북일보 2013.10.28 유채 '오메가6 지방산' 배추·양배추에서 유래 기사 발췌

유채에서 발견된 4개의 FAD2 유전자의 세포 내의 발현 위치=유채 BnFAD2-1, BnFAD2-2, BnFAD2-4는 소포체에 존재했고, BnFAD2-3은 돌연변이에 기인해 정상적인 발현 위치가 아닌 핵과 엽록체에 존재합니다.



종의 기원을 보충하다

당시까지만 해도 같은 종끼리만 교배가 가능하다는 것이 학계의 정설이었습니다. 하지만 우장춘 박사님은 같은 속에 속한 다른 두 종끼리 교배하면 같은 속에 속한 또 다른 종이 탄생할 수 있다는 사실을 입증했습니다.

다윈의 진화론은 서로 다른 종이 각자 환경에 적응해 개별적으로 진화한다는 내용입니다. 우장춘 박사님의 '종의 합성' 이론은 서로 다른 종이 교배를 통해 새로운 종으로 진화할 수 있다는 가능성을 제시했습니다.

종의 합성은 두 식물이 가진 염색체의 2배체, 즉 2n의 각각의 n이 서로 모여 다른 식물을 이룬다는 것을 보여주는 사례입니다. 즉 배추, 흑겨자, 양배추 등 세 개의 종 사이에 자연적인 교배가 일어나 유채와 같은 새로운 종이 만들어졌을 수 있다는 것을 입증하는 것입니다. 이를 통해 진화론의 '종은 자연도태의 결과로 성립된다'는 내용을 보충하는 것으로 평가받고 있습니다.


마치며

'종의 합성' 이론은 단순한 과학적 이론을 넘어 실생활에서도 많이 사용되고 있습니다. 특히 스웨덴의 경우 양배추와 다른 야채류를 교배해 여러 품종을 개발하였기에 우장춘 박사님을 세계 10대 육종학자로 인정하고 있습니다.

아직까지 해외 과학 교과서에 사실상 유일무이한 이론의 창시자로 실리는 우장춘 박사님이, 국내에선 단지 씨 없는 수박의 개발자로 알려진 것은 그만큼 우리가 그의 업적을 잘 모르고 있는 것이 아닐까요?

아름다운 유채꽃밭을 구경하시면서 유채꽃에 담겨 있는 과학적인 사실도 한번 되돌아봐 주셨으면 하는 취지에서 이 글을 올립니다.

작성자 : BD팀 김성민 컨설턴트

Posted by 人Co

2018/05/20 18:03 2018/05/20 18:03
Response
No Trackback , No Comment
RSS :
https://www.insilicogen.com/blog/rss/response/281

人CoPLAY 2018

2018년 4월 27일 봄바람 솔솔 부는 따뜻한 봄날 (주)인실리코젠은 '人CoPLAY 2018'을 개최했습니다.




하루를 꼬박 가득 채웠던 작년 단합대회와는 달리,
이번 단합대회는 극심한 미세먼지를 피해 '人CoPLAY 2018 볼링'으로 대체되었습니다.



볼링은 밥심이죠! 오전 근무를 마친 뒤 회사 지하 식당에서 점심 식사 후 볼링장으로 이동했습니다.



'人CoPLAY 2018 볼링’ 룰은요?

'人CoPLAY 2018 볼링’은 팀전, 개인전으로 나뉩니다.
팀전은 팀 합산 기록이 가장 높은 팀이, 개인전은 남녀 개인이 가장 높은 점수를 기록한 사람이 이기는 룰입니다.
하지만 이렇게 당연한 룰만 있다면 너무 심심하겠죠? (찡긋)

이번 단합대회 볼링의 숨은 재미 ‘엑스맨을 찾아라!’ (빠밤)
팀 구분을 위한 손목 아대가 있는데요, 볼링 시작 전에 손목아대 안에 엑스맨 표식을 표시하여 나누어 드렸습니다.
(두근)(두근) 혹시 내가 엑스맨~?!!



'저는 볼알못(볼링을 알지 못하는 사람들)과 엑알못(엑스맨을 알지 못하는 사람들)인데요!'
하시는 분들을 위한 '人CoPLAY 2018 포토제닉’ 도 실시하였습니다.
'人CoPLAY 2018’ 사진을 응모받아, 심사 후 1,2,3등 분들께 상품권을 지급해드렸습니다.



볼링경기를 마친 뒤 함께 맛있는 소고기를 먹으러 갔습니다.
사장님의 개회사와 함께 '人Co PLAY 2018 볼링’, ‘엑스맨을 찾아라’ 시상식을 진행하였습니다.



대망의 1위 팀은?!!
(두구)(두구)(두구)(두구)
축하드립니다. 노랑팀!
팀전에서는 노랑팀이 최종 우승을 하였네요.
참여하신 모든 분들 모두 모두 축하드립니다! (짝짝짝)



그간 바쁜 업무로 인해, 못다 한 이야기를 나누며, 단합대회가 마무리되었습니다.
오늘 단합대회는 한마음, 한뜻으로 같은 목표를 향해 나아갔던 뜻깊은 행사였습니다.
행사 준비위원으로서 '人Co PLAY’를 준비했는데요. 참여하시는 모든 분들 인코인답게, 즐겁게 행사에 임해주셔서 부상자 없이 안전하게 마무리할 수 있었던 것 같습니다.
내년에도 즐겁고, 안전하게 즐길 수 있는 '人CoPLAY 2019’를 기대하며 이만 마무리하겠습니다.
행사에 참여하신 인코인 분들 모두 수고하셨습니다.

마치며...

하윤희
1년간의 경험을 통해 올해는 좀 더 효율적인 준비와 진행이 되었던 것 같아요. 아쉬운 점이 남지만, 이 또한 다음 행사를 위한 좋은 경험이었다고 생각합니다.
이번 人CoPLAY는 그 어느 때보다 모두가 함께 즐긴 행사였고, 한걸음 물러나 바라보는 것이 아닌 서로 알려주며 함께 하는 모습이 너무나도 아름다웠습니다.
각자의 역할을 훌륭히 소화한 브랜드위원들과 먼데이트리오 분들께 이 자리를 빌려 덕분에 즐거운 시간이 되었음에 감사드립니다.
또한, 그 시간을 함께 즐겨주신 모든 人Co인들에게 감사의 인사를 드립니다.
용승천
점심식사 : 다 같이 모여서 화기애애한 분위기와 함께 식사한 것이 좋았습니다.
자유시간 : 농구, 카페, 산책 등 다양한 활동을 하여 즐겁게 보내 좋았습니다.
볼링 : 볼링장 이동 시 통제를 하여 정확하게 제시간에 모였으면 더욱 좋았을 텐데 지각 인원이 많아 아쉬웠습니다.
회식 : 회식 장소에서는 다양한 음식을 마음껏 즐길 수 있어 좋았습니다. 또한, 자유롭게 어울려 이야기할 수 있는 분위기가 좋았습니다.
박원
이번 人CoPLAY를 통해 모든 人Co인들이 한자리에 모였다는 것이 큰 의미가 있는 것 같습니다.
오랜만에 서로 인사하고 함께 볼링을 치며 시간을 보내어 즐거웠습니다.
또한, 지난 단합대회에 비해 남,여 모두 쉽게 참여할 수 있는 종목이어서 적극적으로 하려는 모습이 많이 보인 점이 특히 좋았습니다. 이 시간을 준비해주신 브랜드위원회 분들과 먼데이 트리오분들께 다시 한 번 감사드립니다.
경동수
이번 人CoPLAY는 오후 시간을 이용해 자율시간과 볼링시합을 진행하였습니다. 이번 행사는 브랜드위원회와 먼데이트리오 각 인원마다 역할을 부여하여 준비하였습니다. 업무 중 회의시간을 줄일 수 있었습니다. 또 처음으로 임직원 설문조사를 통해 행사 내용과 일정을 잡았습니다. 다수의 의견을 반영할 수 있어 만족감도 증가되었다고 생각합니다. 모두가 책임감 있게 임해주셔서 무사히 행사를 마무리할 수 있었습니다.
진효빈
어느덧 두 번째 준비하는 '人CoPLAY 2018' 이네요. 두 번째 준비하는 人CoPLAY인 만큼 함께 준비하는 브랜드위원회 분들과 합이 맞아서 조금이나마 편하게 준비할 수 있었던 것 같습니다. 개인 업무하랴 인코플레이 준비하랴 바빴던 한 달이 지나가네요. 고생한 만큼 인실리코젠 임직원분들이 즐겁게 하루를 보내신 것 같아 다행입니다. 준비하시는 분들 모두 고생하셨습니다.

작성자 : 브랜드위원회 진효빈

Posted by 人Co

2018/05/10 10:51 2018/05/10 10:51
Response
No Trackback , No Comment
RSS :
https://www.insilicogen.com/blog/rss/response/280

임상유전체란?

유전체 염기서열 및 오믹스(Omics) 분석을 통해 얻은 정보를 이용하여 환자의 질병 진단과 맞춤 치료에 사용하고자 하는 분야이며, 차세대 염기서열 분석(NGS, Next Generation Sequencing) 기술의 비약적인 발전으로 최근 크게 성장하고 있다.

많은 의료 및 연구 기관들에서 임상유전체 정보를 분석하며 질병의 원인을 이해하고 진단과 치료에 활용하고자 하는 연구들이 활발히 이뤄지고 있다.

작년 3월, 우리나라는 차세대 염기서열 분석 기반의 유전자 패널 검사가 실시되면서 NGS를 통한 임상 유전체 데이터 생산이 급격하게 늘고 있고, 정밀의학 실현을 위하여 임상유전체 분야의 관심과 발달은 전 세계에서 미래 투자 산업으로 뜨겁게 떠오르고 있다.
.

<그림 1. 임상유전체 연구를 위한 NGS의 활용>

.
임상유전체 분석을 쉽게 하는 방법

최근 NGS 데이터 분석이 대중화되긴 했지만 한정된 연구비 수준에서 NGS 데이터를 생산, 저장하고 분석하는 시스템을 구축하기는 쉽지 않다. 특히 대용량 데이터를 신속, 정확하게 분석하여 의미 있는 결과를 얻어내는 소프트웨어 기술들의 발전은 그 속도가 상대적으로 더딘 편이다.

또한, 일반적으로 대용량 데이터를 다루는 데 있어서 공개된 소프트웨어들은 커맨드라인 형식이 대부분이다 보니 생물정보를 접해보지 않은 연구자들에겐 더욱이 어려운 상황이다.

이러한 환경에서 대용량 임상유전체 분석을 쉽게 진행할 수 있는 솔루션을 소개해보고자 한다.
.

- NGS raw 데이터부터 변이 확인까지

일반적으로 NGS 시퀀싱 서비스를 수행하면 1차 분석결과까지 받게 되는 경우가 많다. 하지만 변이 분석은 파라미터를 어떻게 설정하느냐에 따라 결과가 다르고 원하는 영역의 변이 정보를 얻지 못할 경우가 있다.

Biomedical Genomics Workbench는 Human Genome의 NGS 데이터 분석에 특화된 GUI 기반의 소프트웨어이다. Somatic Cancer와 Hereditary disease의 변이 분석에 최적화되어 있으며, 다량의 샘플에 대한 복잡한 분석도 기본적으로 내장된 워크플로우 혹은 커스터마이즈한 워크플로우 제작을 통해 분석 효율성을 극대화할 수 있다.

더불어 다양한 NGS 플랫폼의 데이터 포맷을 지원하기 때문에 쉽게 raw 데이터부터 분석이 가능하고, 1000Genome, ClinVar, HapMap 등 다양한 public database들을 포함한 패키지를 손쉽게 다운로드 받아 사용할 수 있다.

그리고 변이분석 뿐만 아니라 RNA-seq 분석을 통해 발현량 및 발현패턴 분석까지도 수행할 수 있다.

<그림 2. 사용자 편의적인 인터페이스의 변이 분석>
<그림 3. 워크플로우의 제작>


- 의미있는 변이의 필터링

앞서 변이 정보들을 얻고나면 이 중에서 질병과 연관된 또는 질병을 일으키는 의미 있는 변이들을 찾아내야 한다. 하지만 수십만 개 변이 중에 원인이 되는 변이를 찾는 일은 단순하지 않다.

Ingenuity Variant Analysis(IVA)는 이러한 어려운 문제점을 해결해주는 변이 분석 플랫폼이다. 타겟 변이 리스트들을 생물학적 필터 기준을 통한 검증의 우선순위를 설정할 수 있고, 관심 phenotype에 관련한 변이 정보와 집단에 대한 통계분석 바탕으로 변이 정보를 필터링할 수 있다.

또한, 생물정보학적인 기술이 없어도 쉽게 다룰 수 있는 사용자 친화적인 인터페이스로 변이가 존재하는 유전자의 upstream/downstream의 1~2단계 내에서 변이 식별도 가능하다.

<그림 4. 변이정보의 필터링>


- 질병 유발 변이정보 확인

Human Gene Mutation Database(HGMD)는 문헌에 보고된 Human에서 유전질병을 유발하는 돌연변이 및 질병관련 정보들을 포함하고 있는 데이터베이스이다. 오랜 기간 전문가들의 큐레이션을 통해 안정화되었고, 현재 보편적으로 임상유전체 연구에서 활용되고 있는 데이터베이스이다.

온라인 버전의 경우는 쉬운 검색을 통하여 변이의 종류, 위치, 관련 질병 및 표현형, 표기되어 있는 논문 정보 등을 확인할 수 있고, 대용량의 변이 정보를 검색해야 하는 경우는 다운로드 버전을 통해 분석 파이프라인에 추가하여 활용할 수 있도록 제공되고 있다.

<그림 5. 데이터베이스 검색 시 제공되는 리포트>

.

이처럼 소개된 3가지의 솔루션은 현재 QIAGEN Bioinformatics의 제품군이다. QIAGEN은 Sample to Insight 전략으로 세계적으로 저명한 생물정보 기업들을 합병하면서 샘플 추출부터 생물정보 분석까지의 일련의 과정에서 연구자들이 문제를 직접 해결할 수 있는 환경을 만들고 있다.

하지만 단순히 솔루션만 보유한다고 정밀의학에 무조건 가까워지지는 않을 것이다. 구체적으로 어떤 임상 샘플을, 어떠한 기술을 이용하여, 질병과 연관된 해석을 통해 최종 결론을 내기까지 연구자들이 기술적인 부분을 많이 어려워하고 있다. 이러한 시장현황에 발맞춰 생물정보 기반의 임상유전체 분석 및 정밀의료 파이프라인 구축에 쉽게 활용 가능한 솔루션들과 컨설팅으로 (주)인실리코젠이 함께 할 것이다.

작성자 : Consulting팀 김경윤 선임

Posted by 人Co

2018/04/22 15:45 2018/04/22 15:45
Response
No Trackback , No Comment
RSS :
https://www.insilicogen.com/blog/rss/response/279

인공지능의 양면성

인공지능이 우리 세상에 들어온다면 어떤 일이 일어날까?

로봇, 인공지능이 일상이 된 미래를 생각하면 “터미네이터(1984)”, “매트릭스(1999)”, “A.I(2001)”, "아이, 로봇(2004)”, “이글 아이(2008)”와 같은 영화들이 먼저 떠오른다. 이러한 영화에서 인공지능은 어떨 땐 인류를 위협하는 무기로, 또 어떨 땐 인공지능에 인간성을 부여하여 자신의 정체성에 고찰로 영화의 스토리를 그려나간다.


턱밑의 버튼을 누르면 가정용 로봇을 켤 수 있다.
예쁘게 포장되어 집으로 배송까지 완벽하게!
(사진출처 : http://www.channel4.com/programmes/humans)

영국에서 2015년도에 방영한 드라마에서 휴먼즈(Humans - 2015) 역시 로봇이 정체성과 자아를 찾아 나가는 과정을 그려내는 드라마이다. 그런데 드라마 시즌1의 1, 2편을 보면 우리의 일상에 스며든 로봇의 모습을 보여준다. 로봇은 이미 생활의 깊숙이 들어오면서 아버지의 노동을 대체하고, 보모, 간병인으로서 어머니의 역할을 대체하며, 인간만이 할 수 있다고 생각한 정신 상담사의 역할까지 로봇이 대체하는 모습을 보여준다. 영화에서 로봇의 이러한 모습은 가족으로서의 소외감을 가져오며, 순종적이며 자신의 말을 잘 들어주는 로봇으로부터 남편, 아내에게서도 느낄 수 없던 감정적 위안을 가져온다. 또한, 자녀들은 뭘 하더라도 로봇을 이길 수 없다는 박탈감에 인간으로서의 정체성을 위협받기도 한다. 이러한 로봇들은 일상생활에 인공지능이 스며들었을 때의 우리의 모습을 보는듯하여 터미네이터나 이글 아이 같은 영화처럼 극단적인 상황보다 더욱 현실적이고 무섭게 다가온다.

"7년이 걸려서 공부하면 뭐해 어차피 인조인간이 더 잘할 텐데!"
저 대사를 듣는 순간 정말 아무런 할 말이 떠오르지 않았다. 



인공지능. 머지않은 미래

인공지능은 "강한 인공지능" 과 "약한 인공지능"으로 나눈다. 약한 인공지능은 특정 지식에 대한 학습을 하고 이를 기반으로 결정을 내리는 인공지능이다. 약한 인공지능은 인공지능을 개발하는 사람이 몇 가지 기본적인 룰과 데이터를 입력하고 기계에 학습을 시켜 유의미한 결과를 판단하도록 한다. 그러므로 약한 인공지능은 목적에 따라 특정 데이터를 학습 및 판단하도록 개발되었으며 인공지능을 개발한 개발자의 목적에 따라 그 용도가 제한된다.

강한 인공지능은 소개한 영화와 드라마의 로봇들처럼 단순한 전문적 지식을 넘어 독립적인 자아를 가지고 있는 인공지능을 의미한다. 사물을 인지할 수 있는 지각 능력을 갖췄고, 이를 이해하고 생각과 결정을 내린다. 필요에 따라 스스로 데이터를 인지하고 학습하며, 보는 시각에 따라서 감정까지 있는 인공지능을 강한 인공지능이라고 정의한다. 강한 인공지능은 아직 현재 기술로 개발이 불가능하지만 여러 전문가들은 15~40년 뒤에 강한 인공지능 개발이 실질적으로 가능할 것으로 예측하고 있다.

강한 인공지능은 아직 개발되지 않았지만 약한 인공지능은 이미 수많은 개발이 이루어지고 활용되고 있다. 구글이 발표한 알파고는 난공불락의 섬이던 바둑을 점령하였고 자율 주행 자동차는 부분적으로나마 구현되어 테스트 중이며 몇몇 회사는 인공지능이 면접을 일부 대체하기 시작하였다.
약한 인공지능은 생각보다 실생활에도 많이 적용되어 있다. 자동차 자율운전의 1단계인 선택적 기능 제어는 이미 크루즈 기능으로 최근 차량에 탑재되었고 시리, 알렉스와 같은 음성인식 시스템은 언어의 수많은 억양을 학습하여 이를 단어로 인식할 뿐만 아니라 구글 번역 기능은 인공지능을 통해 훨씬 더 매끄럽고 자연스럽게 문장을 번역해준다. 또한, 페이스북은 우리가 올린 사진을 분석하여 촬영된 사람들에 대해 태그를 자동으로 달아주며, 유튜브, 구글 광고, 아마존에서는 우리가 자주 보고 흥미 있어 하는 주제를 토대로 맞춤형 동영상, 광고, 상품을 추천해준다.

인공지능은 이미 실생활에서 우리에게 좀 더 높은 질의 삶을 가져다주고 있으며 전문가들은 앞으로 인공지능으로 인해 발전할 미래 산업 가치는 무궁무진하다고 이야기한다. 하지만 인공지능이 우리의 장밋빛 미래만을 보장할까? 앞서 언급한 영화나 드라마에서처럼 인공지능이 양날이 검이 될 수 있다고 반박하는 전문가들도 많다.
이런 인공지능의 미래가치와 위험성에 대한 논쟁은 작년 7월 일론 머스크와 마크 저커버그가 트위터에서 벌인 논쟁 이후 본격화되었다.



인공지능은 문명 최대의 위협

테슬라의 CEO 일론 머스크는 과거부터 수차례 인공지능의 위험성을 경고하며 도입 이전에 선 규제부터 이루어져야 한다고 주장하였다.
테슬라는 FLI(자동작동 무기) 공동 질의서를 통해 인공지능이 탑재가 이루어진 자동 무기가 장착되면 큰 규모의 전쟁이 일어날 것이며, 전쟁 진행 과정도 사람이 인지하기 어려울 정도로 빨리 진행될 것이라 경고하였으며 이러한 인공지능 무기가 테러리스트들에게 넘어갔을 때 어떤 일이 일어날 수 있을지 주의해야 한다며 무기에 인공지능을 탑재하는 것은 판도라의 상자를 여는 행위가 될 수 있다고 경고하였다. 또한, 자율자동차에 대해서도 만약 자율자동차가 해킹될 경우 어떤 일이 일어나게 될지를 경고하며 인공지능의 도입 이전에 위험성을 인지하고 선 규제를 먼저 만들어야 한다고 주장하였다.

Wold Wide Web(WWW)의 창시자 중 한 명인 텀 버너스 리는 "기업용 인공지능이 회사의 수익을 위한 의사 결정을 하는 데 있어 기업의 공정성이 과연 유지될 수 있을까? 우리는 어떻게 받아들여야 하는가?" 라며 인공지능 도입의 위험성을 경고하였으며 (고)스티븐 호킹 교수, 빌 게이츠, 스티브 워즈니악 등 세계적 인사들 역시 인공지능이 강한 인공지능의 단계를 넘어선 "초인공지능" 단계에 접어들 경우 우리는 오히려 인공지능에 의해 지배받을 것이라고 경고하였다.

즉, 이들은 모두 사회가 인공지능에 지나치게 의존하게 될 경우, 인공지능이 여러 가지의 요인으로 우리가 예상할 수 없는 범위의 동작을 수행한다면 이미 되돌리기에는 늦을 것이라고 한목소리로 경고하고 있다.



인공지능의 미래 가치

위와 같은 여러 경고에도 불구하고 인공지능이 앞으로 우리에게 가져다줄 가치는 무궁무진하다. 글로벌 시장 조사 기관인 트랙티카 에서는 인공지능이 산업 전반에 걸쳐 영향을 미칠 것으로 예상하였으며 그 시장 규모는 2025년 기준 약 800억에 달할 것으로 예측하고 있다.


트랙티카 : 향후 (2016-2025) 인공지능 시장 전망
(출처 :
http://www.bioin.or.kr/board.do?num=259141&cmd=view&bid=policy)

많은 전문가가 산업 전반에 인공지능을 도입함으로써 상당량의 노동력과 인건비 절감을 가져 올 것으로 예측한다. 이는 이미 아르바이트 수를 줄이고 무인 주문기가 속속 도입되고 있는 식당만 보더라도 확인할 수 있다.

또한, 인공지능을 이용하여 인건비 이외에도 수많은 자원을 효율적으로 아낄 수 있다. 예를 들어 버스, 철도, 배, 항공 등의 대중교통에서 현재 이용객들을 분석하여 시간별 대중교통 이용량을 예측하고 효율적으로 배분한다거나, 현재의 노선을 효율적으로 재배치한다면 많은 자원의 소모를 줄일 수 있다.

개개인의 입장에서도 인공지능을 이용하여 간편하게 통역하고 자율 운전으로 편하게 이동할 수 있게 되며 각종 산업 분야에서 개인별 맞춤 서비스를 통해 좀 더 나은 서비스를 보장받을 수 있다. 인공지능의 도입을 통해 수많은 장점을 얻을 수 있는데 이를 포기할 이유가 전혀 없다는 것이다.



인공지능의 숙제

앞에서 언급하였듯이 인공지능의 발전은 우리에게 많은 위협이 될 수 있다. 약한 인공지능이더라도 인공지능을 적용하는 분야에 따라 책임자가 없는 살상 무기가 될 수 있으며, 소통과 공감, 윤리적 감정이 배제된 의사결정이 이루어질 수 있다. 그리고 강한 인공지능을 넘어선 초인공지능의 단계에 접어들면 인공지능의 감정과 판단에 의해 우리의 삶이 위협받을 수 있다.
하지만 그럼에도 불구하고 현재 이미 많은 분야에서 약한 인공지능이 적용되었으며, 이로 인해 경제적 가치뿐만 아니라 개인의 삶 역시 급속도로 상승하고 있다. 인공지능이 우리 삶에 가져다줄 혜택을 버릴 수는 없는 것이다.

최근에는 이러한 인공지능의 혜택과 위험의 양면성에서 적절한 발전과 규제의 협의점을 찾기 위한 움직임들이 보이고 있다. 대표적으로 전 세계적 인공지능 산업 및 학계 전문가 17명이 인공지능 100년 연구를 목적으로한 AI100 연구단을 만들어 인공지능의 미래를 연구한다. 이들은 인공지능의 위험성으로 인해 인공지능의 잠재적 능력이 훼손되지 않도록 인공지능의 장점에 대해 토론하고 분석하며 연구한다.

A100 연구단의 모태가 된 2009년 아실로마학술회의 참석자들

이외에도 인공지능의 규제에 관한 수많은 연구와 논의가 이루어지고 있으며, 이는 단순한 전문가 그룹을 넘어서 각 국가의 정책의 단계까지 논의되고 있다.

이미 인공지능이란 주사위가 던져졌다. 어느 정도 인공지능이 궤도에 오르기 전에는 위에서 언급한 각종 문제점을 정확하게 예측할 수는 없으나 지금 글을 쓰고 동안에도 인공지능은 발전하고 있으며, 이를 발전시키는 연구자들과 위험성을 경고하는 전문가간의 실랑이는 계속될 것이다. 인공지능의 활용과 규제 사이에서 적절한 합의점을 찾는 문제는 앞으로 계속 풀어나가야 할 숙제이다.

작성자 : 데이터사이언스센터 권대건 주임개발자

Posted by 人Co

2018/04/06 17:48 2018/04/06 17:48
Response
No Trackback , No Comment
RSS :
https://www.insilicogen.com/blog/rss/response/278



« Previous : 1 : 2 : 3 : 4 : 5 : 6 : 7 : 8 : 9 : ... 58 : Next »