사용자 삽입 이미지

- [딜라이트닷넷 창간3주년 특별기획/빅데이터]

IT는 정보기술(Information Technology)의 약자입니다. 정보를 다루는 기술이라는 의미입니다. 여기서 말하는 정보는 데이터에서 얻어집니다. 데이터를 수집∙가공해 의미있는 정보를 얻고, 이 정보를 분석해 지식을 얻어내는 것이 IT의 목적이라고 볼 수 있습니다. 정보와 지식으로 승화되지 않는 데이터는 저장소만 차지하는 낭비요소일 뿐입니다.

이는 빅데이터도 마찬가지입니다. 빅데이터에서 정보를 찾고, 그 안에서 지식을 얻는 것이 목적입니다.

가 트너는 빅데이터를 “고급 통찰력 및 의사 결정을 위해 비용 효과가 높은 혁신적인 정보 처리 과정을 필요로 하면서, 대량(Volume)이며 급격하게 늘어나고(Velocity), 다양한(Variety) 정보 자산”이라고 정의하고 있습니다.

가트너가 정의한 빅데이터의 조건은 “고급 통찰력 및 의사결정을 위해 사용되는 것”입니다. 단지 데이터의 양이 거대하고, 발생하는 속도가 빠르며, 종류가 다양하다는 것만으로는 빅데이터는 아니라는 이야기입니다.

예 를 들어 대부분의 기업들은 고객 콜센터의 전화통화 내용을 녹음하고 있습니다. 이는 10년 전이나 지금이나 마찬가지입니다. 하지만 과거에는 녹음의 목적이 문제가 발생하거나 분쟁이 일어났을 때 통화내용을 다시 확인하기 위한 용도에 불과했습니다. 이는 빅데이터 활용이 아닙니다. 콜센터 음성데이터가 쌓이면 테라데이터를 넘어 페타바이트에 이르는 거대한 분량이지만 우리는 이를 빅데이터라고 부르지 않았습니다.

반면 최근에는 음성인식 및 텍스트 마이닝, 하둡&맵리듀스 등의 기술을 이용해 이 음성데이터를 분석하려는 움직임이 일고 있습니다. 콜센터는 고객들의 불만과 요구사항이 가장 직접적으로 전달되는 창구입니다. 이 음성데이터를 분석해 고객들의 성별, 지역별, 연령별 문제점 및 요구사항을 찾아낸다면 고객만족도 및 충성도를 한층 높일 수 있을 것입니다. 이를 통해 용량만 차지하던 골치아픈 데이터였던 콜센터 음성데이터가 빅데이터로 거듭나게 되는 것입니다.

이처럼 같은 대량의 데이터라고 하더라도 분석을 통해 정보와 지식을 찾아내느냐에 따라 빅데이터와 단순한 데이터의 차이를 가져옵니다.

가 트너는 2015년까지 포춘 500대 기업 대부분이 빅데이터 활용에 나서지만, 이중 85%만이 성공을 거둘 것이라고 전망했습니다. 빅데이터 활용은 말처럼 쉽지 않다는 점을 보여줍니다. 빅데이터 활용을 위해서는 하둡이나 NoSQL과 같은 데이터 관리에 대한 기술적 접근 이외에도 제대로 된 분석 전략을 세우는 것이 필수적입니다.

2012/10/09 14:31 2012/10/09 14:31

트랙백 주소 :: 이 글에는 트랙백을 보낼 수 없습니다