삶을 혁신하고 내일을 예측하는
빅데이터, 클라우드, 슈퍼컴퓨팅의 시대가 온다!
◎ 도서 소개
12월 대통령 선거에서 누가 이길지 알 수 있다면 어떨까? 어린이 대상 성범죄가 다음에는 어디서 일어날지 알 수 있다면? 갓 태어난 내 아이의 적성이 무엇인지, 아니면 로마 제국이 왜 멸망했는지 알아낼 수 있다면 무엇이 변할까? 이런 궁금증을 해결할 수 있는 대안으로 최근 떠오르는 개념이 ‘빅데이터 기술’이다. 하지만 빅데이터가 무엇인지, 어떤 역할을 하는지 아는 사람은 아직까지 많지 않다. 『빅데이터 혁명』(권대석 지음, 21세기북스 펴냄)은 이런 신개념을 전문가적인 관점에서 분석하면서도 다양한 사례를 끌어와 일반 대중도 쉽게 이해할 수 있는 ‘빅데이터 개론서’라고 할 수 있다.
넘쳐나는 정보, 어떻게 미래를 준비할 것인가?
전통적으로 정치, 경제, 사회, 교육, 역사, 철학 등은 통칭 ‘문과’의 영역으로, ‘이과 공돌이’, ‘쟁이’들의 영역이 아니었으나, 빅데이터, 클라우드, 슈퍼컴퓨팅 등 첨단 기술은 현실에 대한 통찰, 미래에 대한 예측, 주관적 주장에 대한 검증의 측면에서 문과적 주관성을 과학적 객관성으로 대체할 가능성을 보여주고 있다. 이 책에서는 빅데이터와 클라우드, 슈퍼컴퓨팅 등 최신 기술이 왕따나 입시 등의 교육문제, 고용과 성장 등 경제 문제, 복지나 의료 문제 같은 개인적 일상과 거시적 정치 사회 경제 문화를 어떻게 바꿀 수 있는지 보고, 우리나라의 문제점이 무엇인지, 이를 어떻게 바꿔야 하는지, 개인과 조직, 국가 차원에서 다가올 미래를 어떻게 준비해야 하는지 길을 제시하고자 했다.
우리 스스로가 생각하는 일을 컴퓨터에게 맡길 날이 다가오고 있다
미국에서는 영화 마이너리티 리포트에서처럼 일어날 범죄를 미리 예측하는 일이 늘고 있다. 부모도 몰랐던 여고생의 임신을 마트에서 먼저 알아내기도 하고, 누가 대통령이 될지 미리 맞추기도 했다. 이런 일을 가능케 하는 기술이 바로 빅데이터 기술이다. 구체적으로는 오바마 대통령이 빅데이터 기술을 이용해 어떻게 대통령이 되었는지 미국의 경제나 복지 같은 국가적 문제는 해결했는지, 혹은 미국의 대형 마트나 유럽의 Zara 같은 패션 기업이 어떻게 불황을 뚫고 극적인 성장을 할 수 있었는지 등의 사례가 책에 등장한다. 빅데이터 기술은 이런 정치·행정이나 기업의 문제 뿐 아니라, 왕따나 입시 같은 교육 문제, 부부의 예측 수명, 우리 아이의 적성 문제에 이르기까지 지극히 개인적 삶에서도 사용될 수 있다.
인류의 수천년 역사를 통해 정치나 경제, 행정 같은 통치 행위로부터 정치학, 경제학, 사회학, 인류학, 역사학 같은 문과 학문에 이르기까지 정치 사회 문화 분야에서 과학 기술의 영향력은 크지 않았다. 그러나, 빅데이터 기술은 통상적으로 ‘문과적’이라고 생각되던 모든 활동과 분야에 영향을 미칠 것으로 보이며, 이 책에서는 그 구체적 방향을 사례와 더불어 소개한다.
모든 사람의 삶을 꿰뚫는 빅데이터의 모든 것!
요즘 흔히 언급되는 클라우드, 슈퍼컴퓨팅, 빅데이터, 오픈 소스 등은 뭐가 뭔지도 알기 어렵고 이들이 서로 무슨 관련이 있는지 아는 것은 더욱 어렵다. 시중에 범람하고 있는 특정 분야의 전문서들과 달리, 이 책은 실제 상황에서 얻은 경험과 전문성에 기초한 통찰을 통해, 새롭게 떠오르고 있는 이들 첨단 기술들을 하나로 꿰어 일반인의 눈높이로 쉽게 설명한다.
저자는 이 책에서 정치, 경제, 의료, 교육, 복지 등 다양한 분야의 어려운 사례를 쉽게 소개한다. 또한 열 명이 넘는 각계각층의 박사 학위 전문가들의 자료 제공과 감수로 책의 신뢰성을 더욱 높였다. 대표적 IT 기업인 NHN 김상헌 대표, 한국 정보과학회장, 정보법학회장 등 전문가의 추천이 이 책이 갖고 있는 잠재적인 가능성과 충실한 내용을 뒷받침한다. 저자는 이 책이 IT 전문가를 위한 것이 아니라고 말한다. 기술 발달과 미래 변화에 관심이 많은 일반 대중과 경영자, 정치가, 문과계 학자 및 관료 등 정책 관계자 등 앞으로 살아갈 사람이라면 누구나 이 책을 통해 미래를 예측하고 다가올 변화를 실제적으로 감지할 수 있을 것이다.
◎ 추천사
기술이 사회를 변화시키는 속도가 점점 빨라지고 있지만 정작 그런 기술이 어떻게 작동하는지, 어떻게 통제되고 활용되어야 하는지에 대해서 아는 사람은 드물다. 권대석 대표는 공학도의 언어가 아닌, 일반인의 눈높이에서 풍부한 예시를 통해 빅데이터와 같은 첨단 IT기술이 어떻게 국가와 경제와 사회를 도약시킬 수 있는지를 설명해준다. 고맙고 반가운 일이다.
_김상헌(NHN 대표이사)
빅데이터나 클라우드, 슈퍼컴퓨팅을 쉽게 설명하기는 매우 어렵고, 그 어려운 기술들을 한 가지로 묶어 생각하기란 더 어렵다. 또한 그러한 기술을 통한 정치·사회·경제 문제의 해결을 생각하는 사람은 거의 없다. 이 책에는 과감하게 그런 시도를 하는 저자의 해박한 지식이 담겨 있다.
_이윤준(前 한국정보과학회장, KAIST 교수)
이 책의 내용을 담은 권대석 박사의 강연을 들었다. 최근 애플-삼성간 소송에서 보듯이 클라우드나 빅데이터 등 첨단 IT기술은 과거에는 없던, 새로운 법제도적 이슈들을 만들고 있다. 우리 일상생활이 빅데이터와 클라우드에 의해 어떻게 변화될 수 있는지 이해하는 데 이 책이 큰 도움이 될 것이다.
_강민구(한국정보법학회장, 서울고법 부장판사)
이 책을 중고교 시절에 읽었다면, 컴퓨터 전공을 선택하는 데 더욱 더 큰 자부심을 가졌을 것이다. 문과를 갈지, 이과를 갈지, 의대를 갈지, 공대를 갈지 고민하는 중고생이라면 이 책을 읽어 볼 것을 권한다. 이과생이라면 비전을 볼 것이고, 문과생이라면 새로운 식견을 갖게 될 것이다.
_임호림(서울대학교 컴퓨터공학과)
◎ 본문 중에서
2011년 7월 어느 금요일 오후, 미국 산타크루스 도심의 주차장에서 자동차 절도범 두 사람이 잡혔다. 자동차나 자전거 도둑은 여간해서는 잡히지 않는다. 운 좋게 차주인이 자기 차에 집적대고 있는 도둑을 발견하는 경우가 아닌 이상 말이다. 하지만 이날은 달랐다. 때마침 경찰이 거기에 있었다. 마치 톰 크루즈 주연의 할리우드 영화 마이너리티 리포트〉처럼 경찰은 ‘그 장소에서 차량 절도가 발생할 예정이다’라는 컴퓨터 프로그램의 예측을 보고 출동했고, 현장에서 기다리고 있다가 범인을 잡았다. 잡고 보니 그 절도범들은 놀랍게도 여성들이었다. 기다리고 있었으니 잡았지, 평범해 보이는 여성 두 명이 차량 전문절도범이라고는 누구도 의심하지 못했을 것이다. -p.8
이런 정보들을 쉽게 볼 수 있고 공유, 분석할 수 있게 되면 놀라운 일이 가능해진다. 예를 들어 내 염기 서열을 인터넷에 올려 1000게놈 프로젝트에서 알아낸 것과 비교하면 나의 질병과 관련해 여러 가지 예측을 얻을 수 있다. 나아가 모든 사람이 자신의 개성과 장단점, 특성, 진료 기록을 유전자 정보와 함께 인터넷에 올려 타인들의 것과 비교될 수 있도록 하면, 어떤 유전자가 어떤 개별 성질을 발현시키는지 보다 정확한 데이터베이스가 만들어지고 질병 치료에 활용될 수 있다. 심지어는 질병 이외에도 자신이 어떤 특성을 가지고 있는지, 갓 태어난 아이는 어떤 적성과 가능성을 가지고 있는지도 알아낼 수 있을 것이다.
개인별 유전 정보 자체가 엄청난 양의 빅데이터다. 수만에서 수억 명에 이르는 사람들끼리의 유전 정보와 개인 특성을 연결, 비교하는 일이므로 개인적으로 해내기에는 쉽지 않을 수도 있다. 따라서 개인별 염기 서열 분석이 100만 원 이하로 떨어질 2013년부터는 개인 간 유전자 비교에서 파생될 수 있는 유전체 관련 빅데이터 저장 및 개인 간 비교 분석 사업이 봇물처럼 터져 나올 가능성이 있다. -p.87~88
엄마와 신생아를 대상으로 하는 시장은 매우 특수한 시장이다. 대부분의 사람들은 습관대로 물건을 산다. 전자제품은 용산에서, 가구는 일산의 가구 시장에서, 양복은 구로의 의류 할인 매장에서 사는 식이다. 이런 습관은 여간해서는 깨기가 어려워 아무리 홍보를많이 해도 쉽게 바뀌지 않는다. 하지만 일생에 몇 번은 습관 자체가 통째로 바뀌는 일이 있다. 바로 결혼, 출산, 진학, 이사 같은 사건이다. 가족이 늘어난다거나 생활환경을 통째로 바꿔야 할 때는 안 사던 것을 사고 기존의 물건도 바꿔야 한다. 타깃은 여기에 주목했던 것 같다. 물론 아기용품 전문 매장이 따로 있고 출산용품 전문점도 따로 있다. 하지만 한꺼번에 모두 구입할 수 있고 더 싸게 살 수 있다면 굳이 먼 걸음을 할 이유가 없다.
다만 문제는 어떤 임신부도 자신의 임신 사실을 마트에 보고할 리는 없기 때문에 고객의 임신을 추정, 예측해야만 한다. 타깃의 통계학자 앤드루 폴(Andrew Paul)은 2002년 마케팅 부서로부터 바로 그런 주문을 받았다. 고객의 임신 사실이 알려지면 다른 업체에서 엄청난 양의 각종 판촉물이 발송될 것이고 그때면 이미 늦기 때문에 최대한 빨리 임신 사실을 알아내야 했다. 고객이 원하건 원치 않건 말이다. 폴은 대량의 고객 데이터를 분석한 결과 임신부가 임신 사실을 알게 되면 우선 철분제, 아연제, 향기 없는 로션을 산다는 사실을, 그리고 향기 없는 비누, 위생 장갑, 면 타월을 사기 시작하면 곧 출산이라는 사실을 알게 되었다. 타깃은 여성 고객에 대한 임신 예측 모델을 만들고 상당한 정확도로 임신 초기 고객을 구분해 냈다. 그리고 이들을 대상으로 임신부와 산모라면 꼭 필요한 물품들에 대한 할인 쿠폰 등 다양한 마케팅 프로그램을 전개했다. -p.156~157
결국 선진 기업들을 추격하기 위해서는 슈퍼컴퓨터를 사용한 제품이나 기술 개발을 포함해 필요한 것들을 기업에서 적극 연구하고 개발해내거나 대학에서 연구해 공급해야 한다. 그리고 개발된 기술이나 상품은 기업의 국제 경쟁력을 강화하는 데 적극 사용되어야 한다. 반드시 대기업일 필요도 없다. 중소기업에 공급해도 된다. 그 중소기업이 대기업으로 커도 좋고, 대기업에 인수되어 대기업의 경쟁력을 강화해도 좋다. 경쟁력 있는 신제품이나 신기술 개발과 연구에 적극 투자하면 된다. 그리고 슈퍼컴퓨터를 활용하는 계산과학과 계산공학은 그런 기술이나 제품을 만드는 데 중요한 역할을 할 수 있다.
요약하면 산업별 슈퍼컴퓨팅 응용, 빅데이터 응용 개발 활성화로 기업들의 산업 경쟁력을 높이고 고용과 부가가치 창출 확대가 가능하다는 이야기이다. -p.246