데이터는 알고있다
데이터는 알고있다
이 기사를 공유합니다
  • 페이스북
  • 제주의뉴스
  • 제주여행
  • 네이버포스트
  • 카카오채널

박경린, 제주대 자연과학대학장 전산통계학과 교수/논설위원

‘열 길 물속은 알아도 한 길 사람 속은 모른다.’ 사람 속을 알기가 그만큼 어렵다는 경구다. 정치든 사업이든 연애든 성공하려면 사람의 마음을 얻어야 한다. 마음을 얻으려면 먼저 그 마음을 알아야 하는데 이게 쉽지 않다. 그래서 심리학이 등장했고, 인문학과 사회과학도 인간의 욕구들을 이해하기 위한 연구들을 진행해 왔다.

하지만 여전히 사람 속을 알기가 쉽지 않다. 이제 IT가 이 대열에 합류한다. 데이터 과학이 그것이다.

십대 딸과 함께 살고 있는 아빠가 집으로 배달되는 임산부용 제품 홍보물들을 보면서 고개를 갸우뚱한다. 아빠는 나중에야 알게 된다. 그 때 이미 그의 어린 딸이 임신 중이었다는 사실을. 같이 살고 있는 아빠도 모르는 딸의 임신사실을 데이터는 알고 있었던 것이다.

마트의 판매 데이터를 분석해보니, 기저귀와 맥주가 유사제품으로 분류가 되었다. 일반 상식에 벗어나는 분류다. 기저귀는 유아용품이고 맥주는 성인용품이다. 일단 패턴분석 결과에 따라서 기저귀 판매장 옆에 맥주 가판대를 설치했다. 그 후 맥주의 매출이 오르기 시작한다. 갓난아기를 가진 젊은 엄마의 심부름으로 기저귀를 사러 온 젊은 아빠가 맥주도 같이 구매하는 것이었다.

이처럼 데이터를 통해서 인사이트(insight), 즉 통찰의 실마리를 잡을 수 있다. 데이터의 양이 많아질수록 이 통찰은 정확해 진다. 빅데이터가 필요한 이유다.

빅데이터의 특징은 4V로 정의된다.

첫 번째 V는 양이다(Volume). 최소 수십 테라바이트는 넘어야 빅데이터로 간주한다. 수십 테라바이트는 수십조 바이트를 의미한다. 한 바이트가 영문자 한 글자를 저장하는 단위이니, 수십조 바이트는 영문자 수십조 규모의 데이터를 의미한다.

두 번째 V는 속도다(Velocity). 데이터가 생겨나는 속도가 빠르다는 얘기다. 1분 동안 구글에서는 200만 건의 검색이 진행되고, 트위터에서는 27만 건의 트윗이 생성된다. 아주 빠른 속도로 데이터들이 생겨나고 있는 것이다.

세 번째 V는 다양한 형태다(Variety). 데이터의 형태가 수치데이터와 문자 데이터 위주에서 음성데이터, 이미지 데이터, 동영상 데이터 등으로 그 형태가 다양해지고 있다.

네 번째 V는 새로운 가치를 의미한다(Value). 저장된 데이터를 분석해서 새로운 가치를 창출하는 기술까지 포함하고 있다.

최근에 중앙정부에서 지원하는 빅데이터 전문센터들이 구축되고 있다. 작년부터 현재까지 총 36개 빅데이터 전문센터가 선정되었고, 제주도의 경우 ICT융합담당관실이 빅데이터 전문센터로 선정되었다. 앞으로 제주도의 데이터들을 분석해서 도민들에게 만족도가 높은 서비스를 제공할 수 있을 것이다. 예를 들면, 대중교통 이용자들의 사용패턴을 분석해서 버스 노선과 배차간격 등을 조정하면 사용자 만족도를 높일 수 있을 것이다. 대중교통 사용자의 만족도가 높아지면 이용자 수가 늘어날 것이고, 결국 주차난 등 제주의 교통문제를 해결하는 데 도움이 될 것이다.

아는 게 힘이었던 세상에서 정보가 힘이고 데이터가 재산인 세상이 오고 있다. 앞으로 제주도의 빅데이터 전문센터가 필요한 데이터들을 체계적으로 수집하고, 분석한 결과를 제주도의 의사결정에 적절하게 반영해서, 궁극적으로는 일반 도민들이 빅데이터의 효과를 체감할 수 있는 스마트한 도시의 초석이 되기를 기대한다.

이 기사를 공유합니다

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.