“빅데이터는 새 시대를 열어 줄 신기술이므로
적극적으로 데이터를 활용할 제도를 구축해야 한다.”
vs
“빅데이터로 인한 개인 정보 유출 등의 빅브러더 문제를 막으려면
데이터 활용을 적절히 규제해야 한다.”
2014년 4월 16일, 우리에게는 일어나지 말았어야 할 일이 일어났습니다. 그리고 많은 이야기가 있었습니다. 그 중에는 세월호 참사와 같은 재난의 원인을 관리하고 그 예후를 탐지할 수 있는 시스템을 조속히 구축해야 한다는 주장도 있었지요. 이러한 주장 가운데에는 최첨단 신기술인 빅데이터만 잘 활용했더라도 세월호의 비극을 막을 수 있었을지 모른다는 안타까움의 목소리가 있습니다. 빅데이터만 활용할 수 있었더라도 최적의 구조 방법을 결정하고 적용하는 일이 훨씬 빨랐을 거라는 주장이죠.
빅데이터는 엄청난 양의 디지털 데이터를 처리하고 가공할 수 있는 기술을 확보하면서 생겨난 개념입니다. 수많은 데이터를 정리한 자료들은 재난에 대비한다거나, 불치병을 고칠 실마리를 찾아낸다거나, 스포츠나 패션 사업에 활용하는 등 인류의 삶을 좀 더 풍요롭게 해줄 수 있지요. 그러나 이 신기술이 우리에게 이롭기만 할 것 같은데, 우려의 목소리도 좀처럼 잦아들지 않고 있습니다. 빅데이터 기술을 활성화하려면 어마어마한 양의 데이터가 필요한데, 이 과정에서 개인 정보에 대한 보안 문제나 사생활 침해, 인권 침해 문제가 필연적으로 발생할 수밖에 없기 때문이지요. CCTV에 찍힌 내 모습이나 개인의 통화내역 등의 개인 정보를 누군가 한데 모아 분석한다고 생각해 보세요. 사실 실제로 이런 일이 일어나고 있지 않다고 장담할 수 있는 사람이 아무도 없습니다. 정말 무섭지 않나요? 자, 그렇다면 우리는 최첨단 신기술인 빅데이터를 부수고 제한해야 할까요?
《세상에 대하여 우리가 더 잘 알아야 할 교양 ? 빅데이터, 빅브러더가 아닐까?》는 다소 생소할 수 있는 빅데이터의 개념을 명쾌하게 설명해 줍니다. 특히 데이터의 생성 과정과 처리 방법 등을 설명하고 있어 새로운 기술에 대한 궁금증을 해결해 주지요. 또한 의료, 공공 분야, 교통, 스포츠, 패션 산업, 대통령 선거 등 현재 빅데이터가 활용되고 있는 다양한 분야의 사례를 자세히 설명함으로써 빅데이터 기술에 대한 이해를 돕는 것이 큰 덕목입니다.
하지만 이 책에서 가장 주목해야 할 부분은 빅데이터 기술에 대한 균형 잡힌 접근법입니다. 앞에서 말한 것처럼 이 책은 빅데이터 기술의 발달이 일상적인 사생활 침해와 인권 침해를 가져올 수 있음에 대해서 경고합니다. 이제 인터넷 사이트에 개인정보를 입력하지 않았다고 해서 개인 정보가 보호받는 시대가 아닙니다. 빅데이터를 이용한 기업이나 정부는 우리의 일거수일투족을 사실상 알고 있다고 하면 과언일까요? 이 책의 내용을 따라가다 보면 신기술의 긍정적 효과는 물론이고, 그로 인해 파생되는 부정적 문제들에 대해서도 깊이 생각해 보게 한다는 장점이 있습니다. 이 책이 부디 더 많은 이들에게 빅데이터 기술에 대한 바른 이해의 계기가 되기를 바랄 뿐이고 신기술의 사회적 영향력에 대한 생각의 지평이 넓어질 수 있기를 바랍니다.
▶ 추천의 글
이 책은 아직은 생소한 분야인 빅데이터의 개념을 명확히 알려주고, 빅데이터의 무궁무진한 활용 가능성을 소개해 청소년 독자의 이해를 돕는 점이 큰 장점입니다. 여러분도 이 책을 읽고 미래의 기술인 빅데이터를 어떻게 활용하면 좋을지, 그 한계를 어떻게 극복하는 것이 좋을지 함께 생각해 보았으면 합니다.
성균관대학교 인터랙션사이언스학과 교수 신동희
▶ 책 속에서
그렇다면 빅데이터란 무엇일까요? 빅데이터는 ‘크다’의 빅(Big)과 ‘정보’의 데이터(Data)에서 나온 합성어입니다. 쉽게 말해 아주 큰 데이터, 즉 수많은 데이터의 거대한 모음이라고 할 수 있지요. 정보 통신 기술의 발달로 현대에는 과거보다 더 많고 다양한 데이터가 생겨나고 있습니다. 기존 데이터 처리 기술로는 감당할 수 없을 만큼 양이 많고 복잡한 데이터가 생겨났지요. 이처럼 과거와 달리 엄청나게 복잡하고 무수히 많은 데이터를 모아놓은 거대한 집합체를 가리켜 ‘빅데이터’라고 합니다.
- 16쪽, 빅데이터란 무엇일까요?
데이터 분석에는 다양한 기법들이 이용됩니다. 분석 용도에 따라 통계, 데이터 마이닝, 텍스트 마이닝, SNS 분석 등의 기술을 이용하는데요. 데이터의 성격과 해결하려는 문제에 따라 다양한 방법의 분석 방법이 적용됩니다. 따라서 정확한 데이터 분석을 위해서는 해결하려는 문제를 명확히 정의해야만 합니다.
- 46쪽, 빅데이터, 어떻게 만들어질까?
그러다 보니 패스트 패션 업체들의 빅데이터 사랑은 대단합니다. 패스트 패션 업체들은 전 세계에 퍼져 있는 판매점들의 데이터를 모으고 SNS를 이용해 트렌드를 읽어 내는 방법으로 전 세계 공급망을 관리하지요. 이 모든 과정은 거의 실시간으로 이루어집니다. 그 덕분에 패스트 패션 업체들은 남보다 빠르게 유행하는 패션 스타일을 파악하고 대응할 수 있습니다.
- 62쪽, 무궁무진한 빅데이터의 세계
신기술은 양면성을 지니고 있습니다. 빅데이터 기술 역시 이를 피해 갈 수는 없지요. 새로운 기술이 현실에 어떤 영향을 미칠지 모르거니와 그 누구도 적용된 결과를 정확히 예견할 수 없기 때문입니다. 그래서 빅데이터 기술에는 낙관론과 비관론이 동시에 존재합니다.
- 82쪽, 빅데이터, 새로운 해답일까요?
예측 시스템이 아무리 발전한대도 100퍼센트 정확한 예측을 실현할 수는 없습니다. 만약빅데이터 시스템을 이용해 90퍼센트 정확도로 테 러범을 골라낼 수 있다고 해봅시다. 이 기술로 90명의 테러리스트를 잡 을 수 있을지는 모르지요. 하지만 10명의 무고한 사람들이 범죄자 꼬리 표를 달고 상상할 수도 없는 고통 속에서 살아가게 됩니다.
- 105쪽, 빅데이터와 인권
빅데이터를 통한 예측은 단지 분석 결과일 뿐입니다. 예측이란 것은 100퍼센트 정확하다고 말할 수 없어요. 수집된 데이터에 오류가 있을 수도 있고 누군가 의도적으로 결과를 조작할 수도 있어요. 따라서 모든 것을 빅데이터 분석에만 의존했다가는 큰 낭패를 겪을 수도 있습니다. 이러한 빅데이터의 허점을 메울 수 있는 것도 결국 우리들 사람입니다.
-117쪽, 빅데이터와 미래