사용자 삽입 이미지
지난 2010년, EMC는 업계의 주목을 받는 인수합병을 성공시켰다. 데이터웨어하우스(DW) 업체 그린플럼이 주인공이다. 이 두 인수를 통해 EMC는 빅데이터 시대를 선도하고 있다.

EMC는 2011년 말 이를 기반으로 정형데이터와 비정형데이터를 통합 지원하는 통합 분석 플랫폼, ‘EMC 그린플럼 UAP(United Analytics Platform)’을 출시했다.

EMC 그린플럼 UAP는 ▲EMC 그린플럼 데이터베이스 ▲EMC 그린플럼 코러스 ▲EMC 피보탈 HD 등 세 가지 그린플럼 제품으로 구성돼 있다.

그린플럼 DB는 정형 데이터 분석을 위한 관계형DB다. 회사 측에 따르면, 데이터를 분리하는 대용량 병렬처리 MPP(Massively Parallel Processing) 구조를 이용, 방대한 양의 정형 데이터를 보다 저렴한 비용으로 빠르게 처리하고 분석할 수 있다.

그린플럼 코러스는 데이터 분석 인력이 서로 협업할 수 있는 소셜 협업 툴이다. 회사 측은 이 제품에 대해 “시공간의 자유를 보장하는 소셜 및 협업 툴셋을 제공함으로써 언제 어디서나 빅데이터를 반복적으로 활용 분석하고 이를 통해 얻어낸 통찰력을 현업에 신속히 적용할 수 있게 지원한다”고 설명했다.

이 중 가장 주목되는 것은 오픈소스 빅데이터 분석 플랫폼인 하둡 기술을 내재화 한 피보탈 HD다. 그린플럼 DB가 대용량 정형 데이터 분석을 위한 플랫폼이라면, 피보탈HD는 비정형 데이터를 분석을 위한 핵심 플랫폼이다.

회사 측에 따르면, 이는 아파치 하둡 프레임워크에 빅데이터 분석 플랫폼인 EMC 그린플럼 MPP 데이터베이스 기술을 통합시켜 개발한 것이다. EMC는 “피보탈 HD를 통해 다양한 종류의 데이터 분석 도구와 언어를 SQL 인터페이스 기반에서 구현해 하둡의 확장성, 고가용성, 비용 효율성을 보다 높일 수 있다”고 강조했다.

최근 하둡 기술은 비정형 데이터 분석 분야에서 유연성, 확장성, 저비용 등의 장점으로 각광을 받고 있지만, 복잡한 인터페이스와 하둡 개발 인력 부족으로 적용에 어려움을 겪고 있다.

반면 ‘피보탈 HD’은 SQL 표준 쿼리 인터페이스 기반으로 하둡 파일시스템에 저장된 데이터 세트를 간편하게 질의하고 분석할 수 있다고 회사 측은 설명했다. SQL 표준 쿼리 인터페이스를 지원한다는 것은 맵-리듀스와 같은 기술을 숙지한 고급 개발자 없이 하둡 기술을 활용할 수 있다는 것을 의미한다.

회사 측은 특히 “피보탈 HD의 핵심 기술로 10년에 걸친 연구개발 성과인 EMC 그린플럼의 ‘호크 테크놀로지(HAWQ Technology)’가 최초로 도입됨에 따라, 다양한 쿼리 및 데이터 분석에 대한 응답 속도를 하둡 기반으로 최소 100배에서 최대 600까지 획기적으로 높였다”고 강조했다.

‘피보탈 HD’는 EMC 빅데이터 분석 플랫폼인 ‘EMC 그린플럼 DCA UAP’ 기반으로 그린플럼 데이터베이스와 함께 운영될 수 있으며, 또한 스케일아웃 스토리지인 ‘EMC 아이실론’의 하둡 파일시스템 프로토콜을 활용해 아이실론과 통합 구성이 가능하다.

EMC는 이같은 플랫폼 이외에도 데이터 과학자 양성에도 적극적이다. 지난 2011년 5월 라스베가스에서 세계 최초로 ‘데이터 과학자 서밋(Data Scientist Summit)’을 개최했으며, 지난 해 5월 제2회 서밋을 개최했다.

한국EMC도 빅데이터 분석을 위한 데이터과학자 양성을 위해 빅데이터 개념부터 분석방법, 분석도구, 기업 유형별 실습 등 다양한 커리큘럼을 포함한 ‘데이터 과학 및 빅데이터 분석 과정’을 2012년에 개설했다.

첫해에만 정규교육과정 및 기업방문교육과정(On-site)을 통해 총 132명의 교육생을 배출했으며, 2013년에는 총 6차례의 정규교육과정과 약 20차례의 방문교육을 진행해 약 430명 이상의 교육생들이 빅데이터 교육 과정에 참가할 것으로 예상되고 있다.
2013/10/08 09:25 2013/10/08 09:25
사용자 삽입 이미지
스플렁크는 빅데이터 시대에 제대로 탄력받는 중소 IT업체다. 지난 해 상장하자마자 주가가 두 배 오르며 파장을 일으켰다. 1999년 이후 IT업계에서 이같은 성공적인 IPO는 없었다는 평가가 나올 정도다. 현재는 그것보다도 두 배 가까운 주가를 유지하고 있다.


스플렁크 비즈니스의 핵심은 컴퓨터 시스템의 사용 내역이 기록된 로그 파일을 검색하는 ‘검색 엔진’이다.

스플렁크는 웹사이트, 애플리케이션, 서버, 네트워크 및 모바일 장치와 같이 기업의 중심이 되는 각종 머신에서 생성된 이러한 빅데이터를 수집하고 이를 인덱싱해 활용할 수 있는 소프트웨어 플랫폼을 제공한다.

스플렁크의 소프트웨어는 컴퓨터 안의 모든 로그파일을 검색한다. 스플렁크는 이를 ‘
머신 데이터’라고 부른다. 웹사이트 사용시 발생하는 모든 내역을 기록하고 저장하므로 기업들은 개개인의 정보를 수집할 필요가 없이 웹사이트에서 일어나는 모든 ‘클릭’을 분석해 필요한 정보를 얻을 수 있다.

로그 파일을 분석하면 홈페이지에 어떤 문제가 있는지 쉽게 찾아낼 수 있기 때문에 문제가 발생하면 해결방안을 찾을 수 있다.

스플렁크는 “빅데이터를 실시간 운영 인텔리전스로 바꿔준다”고 설명했다. 빅데이터를 실시간으로 저장, 모니터링하고 검색하는 서비스를 제공하며, 300개 이상의 스플렁크 앱이 패키지 된 시각화, 대쉬보드, 워크플로우를 제공한다.

스플렁크는 보안에도 유용하게 사용된다. 실시간으로 로그를 분석해 비정상적인 움직임을 탐지할 수 있기 때문이다. 회사 측은 “위협 가능성이 있는 행동 패턴이 생겨나는 지를 판단하고 빅데이터 기술을 이용해 위협 행동의 패턴을 분석하고 가시화한다”면서 “이제 보안 인텔리전스 분석가는 스플렁크를 사용해 회사의 명성 유지와 비용을 고려한 위험기반 완화 전략을 실행할 수 있다”고 말했다.

스플렁크의 소프트웨어를 성공적으로 사용한 사례로는 익스피디아를 들 수 있다. 항공권 및 호텔 예약 전문 웹사이트인 익스피디아는 스플렁크를 이용해 웹사이트에서 고객들이 확인해 본 모든 내역들과 고객를 수집할 수 있게 됐다.

스플렁크가 웹사이트상에서 일어나는 모든 내용을 분석해 필요한 정보를 익스피디아에 제공해주기 때문에 익스피디아가 따로 고객 개개인의 정보를 수집해야 하는 번거로움도 사라졌다.

또 사이트에서 오작동이 일어날 경우, 스플렁크는 로그 파일 분석 기능을 통해 문제를 빠르게 파악하고 익스피디아에 알리며 문제에 대한 해결방안까지 조언한다. 회사 측은 “스플렁크 덕분에 익스피디아는 연간 1400만 달러의 비용 절감을 경험했다”고 설명했다.
2013/09/26 16:18 2013/09/26 16:18
사용자 삽입 이미지
KT넥스알은 가장 대표적인 국내 빅데이터 플랫폼 기업이다.  KAIST 전자전산학과 박사출신인 한재선 대표가 설립해 지난 2010년 KT에 인수됐다.


클라우드 컴퓨팅 기술 전반을 개발하던 넥스알은 KT에 인수된 이후 빅데이터에 집중하고 있다. 특히 KT와 계열사들을 대상으로 대규모 구축 사례를 확보하며, 국내에서 가장 활발한 빅데이터  업체로 자리매김했다.

KT 넥스알은 NDAP(NexR Data Analytic Platform)이라는 빅데이터 플랫폼을 보유하고 있다. 회사 측에 따르면 이는 빅데이터의 수집ㆍ처리ㆍ저장ㆍ분석 등이 모두 가능한 일체형(All-in-One) 플랫폼 소프트웨어다.

오픈소스 하둡과 관련 생태계 제품들을 하나의 플랫폼에 통합했으며, 기업이 사용하기에 아직 오픈소스 소프트웨어가 부족한 부분은 KT넥스알이 직접 개발했다.

하둡은 기술적 난이도와 오픈소스의 관리 어려움으로 기업에서는 하둡의 장점을 인식하면서도 도입 결정을 내리기 쉽지 않다. 그러나 NDAP은 하둡 에코시스템 상위계층으로 기존 IT 담당자들에게 익숙한 SQL과 워크플로우 환경을 제공해 빅데이터에 쉽게 접근할 수 있도록 한다.

회사 측에 따르면, NDAP은 데이터 증가에 따라 유연하게 확장할 수 있고 추출ㆍ변환ㆍ적재(ETL) 배치 처리는 물론 실시간 데이터 질의까지 지원한다.

정형/반정형/비정형 데이터 모두 처리가 가능하며 기존 관계형데이터베이스관리시스템(RDBMS) 및 분석 SW와도 연계되고, ANSI SQL 기반의 통합 아키텍처를 기반으로 기존 레거시 시스템과 연계가 쉽다고 회사 측은 설명했다.

또 분산 파일 시스템을 병렬로 처리해 고성능 빅데이터 플랫폼을 운영할 수 있다고 회사 측은 강조했다.
 
회사 측은 NDAP 에 대해 “복잡하고 다양한 하둡 에코시스템을 기업 환경에서 보다 원활하게 운영하기 위해 개발된 엔터프라이즈 빅데이터 통합 SW”라고 설명했다.

KT 넥스알은 국내 기업으로서는 유일하게 100여명에 달하는 자체 개발 및 프로페셔널 전문 인력을 보유하고 있다는 점이 특징이다.

예를 들어 KT 넥스알은 국내 유일의 ‘아파치 하이브 커미터(Apache Hive Committer)’가 근무하고 있다. 아파치 하둡 에코시스템의 핵심 기술 중 하나인 하이브 프로젝트 기여도 면에서는 전세계적으로 호튼웍스, 페이스북 다음으로 KT 넥스알이 영향력을 미치고 있다. 특히 국내 기업으로는 유일하게 글로벌 업체와 대등한 입장에서 하둡 에코시스템을 주도하고 있는 것이다.

또 단순 제품을 판매하는 수준을 넘어 고객이 빅데이터로부터 실질적 결과를 도출할 수 있도록 서비스를 제공한다.

회사 측은 “현장 전문가 팀은 다수의 빅데이터 프로젝트 수행 경험과 데이터 분석 능력을 겸비해 고객과 프로젝트를 공동 수행하며 빅데이터 분석에 대한 기술을 전수하고 고객 내부 빅데이터 전문인력 양성에 일조하고 있다”면서 “단순히 솔루션이나 어플라이언스를 제공하는 다른 벤더들과 차별화된 요소”라고 강조했다

회사 측은 “NDAP을 도입해 데이터 중심의 의사결정 체계를 마련한 고객들은 즉각적인 비용 절감 및 매출 증대 효과를 거두고 있다”면서 “기존의 감성과 경험에 바탕을 둔 의사결정에서 데이터 중심의 비즈니스 의사 결정으로 기업이 목표로 하는 비용 절감과 프로세스 개선을 도모할 수 있다”고 덧붙였다.
2013/09/26 16:14 2013/09/26 16:14
사용자 삽입 이미지
IBM이 빅데이터 시장을 공략하기 위해 ▲포괄적 플랫폼 ▲ 통합 플랫폼 ▲ 안정적인 플랫폼 ▲오픈소스 기반의 확장 플랫폼을 제공한다는 것을 목표로 하고 있다.


포괄적 플랫폼이란 다양성, 속도, 볼륨과 같은 빅 데이터의 세 가지 차원을 모두 해결할 수 있는 플랫폼을 제공하겠다는 것이며, 통합 플랫폼은 빅데이터플랫폼을 기존의 정보 공급망과 통합해 빅데이터 기술 도입을 간소화 하겠다는 것이다.

안정적인 기업용 플랫폼은 개인이 아닌 기업이 안심하고 사용할 수 있는 성능과 안정성, 보안성 등을 확보한 플랫폼을 제공할 수 있으며, 오픈소스 소프트웨어 등과의 통합을 통해 확장성을 확보할 수 있다는 것이 IBM이 내세우는 자사의 장점이다.

 이를 위해 IBM은 자사의 제품 중 ▲인포스피어 빅인사이트 ▲인포스피어 스트림 ▲분석용 퓨어데이터시스템 등을 핵심 빅데이터 플랫폼으로 내세우고 있다.

IBM 인포스피어 빅인사이트는 방대한 양의 정형 및 비정형 데이터를 관리하고 분석하기 위한 솔루션이다. 오픈 소스 아파치 하둡(Apache Hadoop) 소프트웨어 프레임워크 상에 구축된다. 회사 측은 “인포스피어 빅인사이트는 분석 역량과 더불어, 관리, 워크플로우, 프로비저닝, 보안 기능을 추가해 기업의 요구사항을 감당하도록 이 기술을 강화했다”면서 “고객은 한층 개발자 및 사용자 친화적인 복잡한 대규모 분석을 위한 솔루션을 확보할 수 있다”고 설명했다.

IBM 인포스피어 스트림은 실시간으로 흐르는 센서네트워크 등의 데이터를 분석할 수 있는 솔루션이다. 스트리밍 데이터를 실시간으로 분석하는 역할을 한다. 회사 측은 “밀리초 이하의 빠른 응답 시간으로 대량의 스트리밍 데이터를 지속적으로 분석할 수 있다”면서 “ 광범위한 종류의 정형 및 비정형 데이터를 지원할 수 있는 확정성과 민첩성이 우수한 인프라스트럭처를 제공한다”고 강조했다.

IBM 분석용 퓨어데이터시스템은 기존의 데이터웨어하우징(DW) 솔루션 네티자를 빅데이터에 맞게 확장한 것이다. 회사 측에 따르면, 이를 통해 기업들은 하둡을 몇 분만에 도입할 수 있으며, 대규모의 데이터를 빠르고 비용효율적으로 처리할 수 있다.

IBM은 이같은 제품군과 함께 비즈니스 분석 및 최적화 컨설팅을 제공한다. 2009년 4월 새로운 사업부문으로서 BAO (비즈니스 분석 및 최적화) 컨설팅 서비스를 시작했으며, 2010년 공개한 로드맵에 따라 2015년까지 단계적인 성장을 목표로 사업을 진행해 나가고 있다.

2012년 IDC 글로벌 마켓스케이프(IDC Global MarketScape)의 조사에 따르면, 비즈니스 분석 부문에서 IBM이 업계 1위를 차지 했고, 지난 5년 동안 빅데이터 분야에 140억 달러 이상을 투자해 비즈니스 분석 관련 업체 25개를 인수했다.

회사 측은 “IBM이 보유한 산업별 구축 경험과 기술 리더십이 빅데이터 기반의 혁신을 일구어내는데 도움이 될 것”이라고 말했다.
2013/09/26 16:08 2013/09/26 16:08
사용자 삽입 이미지
전 세계가 빅데이터로 들썩이고 있다. 비정형 데이터, 스트리밍 데이터, 로그 데이터 등 그동안 무수히 생산됐지만 감히 관리하고 분석할 엄두도 내지 못했던 데이터에서 새로운 통찰력을 얻을 수 있다는 기대가 빅데이터가 주는 희망이다.


빅데이터 분석을 위해서는 기본적으로 데이터를 담아 관리할 플랫폼이 필요하다. 정형 데이터만 다룰 때는 관계형데이터베이스관리시스템(RDBMS)가 충분한 역할을 해냈다. 오라클이 세계 최고의 IT기업으로 자리잡을 수 있었던 것은 RDBMS 시장을 장악했기 때문이다.

그러나 기존의 RDBMS는 이제 한계를 맞고 있다. 정형 데이터를 위한 플랫폼으로서는 훌륭한 역할을 했지만, 빅데이터를 상대하기에 RDBMS는 역부족이다.

이 때 등장한 것이 하둡이다. 하둡은 PC 수준의 저렴한 하드웨어를 통해 빅데이터를 관리할 수 있는 대안을 제시했다. 빅데이터 시대가 열린 것은 하둡이 등장했기  때문이라고 봐도 만무하다.

그러나 하둡은 어렵다. 기존의 IT 기술자들은 하둡이라는 낯선 환경에 적응하는데 어려움을 겪고 있다.

또 하둡은 아직 비즈니스 분석으로 활용하기에 아직 부족한 면이 있다. 오픈소스 기반이기 때문에 기업들이 필요로 하는 기능과 서비스를 맞춤형으로 제공하지 못한다.

이 때문에 IT 벤더들의 역할이 필요하다. 이들은 현재 고객 기업들의 요구가 무엇인지 경험적으로 알고 있다. 하둡을 활용하되 하둡이 제공하지 못하는 것을 이들이 채워나가고 있다.
이를 위해 IT업체들은 하둡을 바탕으로 새로운 빅데이터 플랫폼을 만들고 있다.

이에 이번 딜라이트 창간 기획의 일환으로 빅데이터 시대에 발맞춰 나가고 있는 대표적인 빅데이터 플랫폼을 소개한다. 전통의 글로벌 IT 업체 3개(IBM, 오라클, 테라데이타), 국내 업체(KT넥스알, 그루터, 모비즌) 3개와 특수한 방식으로 빅데이터 시장을 개척하고 있는 스플렁크가 대상이다.
2013/09/26 16:05 2013/09/26 16:05

사용자 삽입 이미지
최근 하둡을 이용하는 기업들을 상대로 잇달아 소송을 제기하는 특허괴물이 있습니다. 미국 델라웨어에 거점을  ‘패러럴 아이언이라는 회사인데, 페이스북, 리크드인, 아마존, 오라클  다양한 회사들이이 회사로부터 소송을 당했습니다.


패러럴 아이언은 자신들이 하둡분산파일시스템(HDFS, 이하 하둡) 관련된 특허를 보유하고 있다고주장하고 있습니다. 이들이 주장하는 특허는 ‘스토리지 시스템을 위한 방법과 시스템(Methods and Systems for a Storage System)’이라는 제목으로, 지난 2007 3 미국에서 정식 특허로 등록됐습니다.


일반적으로 하둡은 오픈소스소프트웨어이기 때문에 기업들은 마음껏 쓸 수 있을 것으로 생각하고 있습니다. 그러나 패러럴 아이언은 아파치 오픈소스 버전에 자신의 특허가 포함돼 있다고 주장하는 것입니다.


실제로 아파치 하둡 안에 이 회사의 특허가 포함돼 있다면, 이를 이용하는 기업들도 이를 무시할 수만은 없습니다. 자칫하면 특허괴물의 마수에 걸려들어 소송에 휘말릴지도 모릅니다.


어쩌면 이는 글로벌 IT 시장에서 빅데이터가 확산되는   위협요인이  지도 모르겠습니다.


그러나 흥미로운 점은 우리나라에서는 이런 위험을 무릅쓰지 않고도 하둡을 마음대로 써도 된다는 것입니다.  패러럴 아이언의 특허가 국내에는 등록돼 있지 않기 때문입니다. 패러럴 아이언의 주장대로미국에서 법정에서 특허를 인정받는다고 해도 국내에는 영향을 미치지 못합니다.


관련 특허는 ‘ 테크노로지 엔터프라이즈, 엘엘씨라는 회사를 통해 국내에서도 2005년과 2010년 두 번이나 출원한  있습니다.  테크노로지 엔터프라이즈라는 회사의 특허를 특허 괴물인 패러럴 아이언이 인수한 것으로 예측됩니다. 그러나 특허를 획득하지는 못했습니다. 모두 거절 당했기 때문입니다.

 

특허청에 따르면, 이 특허가 국내에서 두 번이나 거절된 것은 형식에 미비점이 있었기 때문입니다. 2005년 첫 출원 때는 하나의 특허 출원에 두 개의 기술이 포함돼 있었기 때문에 거절됐습니다. 그래서 링 테크노로지는 이후 2010년에 두 개로 나눠 특허를 출원했습니다.하지만 서류 미비(의견서)로 또다시 거절되고 말았습니다.


결과적으로 링 테크노로지 측의 실수로 한국의 빅데이터 시장은 특허괴물로부터의 ‘자유지대’가 됐습니다. 국내 업체들로서는 행운이 아닐 수 없습니다.

2013/05/10 14:09 2013/05/10 14:09

사용자 삽입 이미지
유유제약의 베노플러스겔은 멍, 붓기, 타박상, 벌레물린데 바르는 연고 타입의 약입니다. 네이버 검색창에 '멍 빨리 없애는 법'이라는 검색어를 입력하면 관련 의약품 중에는 유일하게 연관검색어에 등장하는 약입니다. 그 시장에서 가장 대중 인지도가 높은 약이라고 볼 수 있습니다.

그러나 1~2년 전에는 이렇지 않았습니다. 그 당시에는 '멍 빨리 없애는 법'이라는 검색 키워드의 연관검색어에는 엉뚱하게 소고기나 달걀이 등장했습니다.

유유제약은 어떤 방법으로 베노플러스겔을 네이버 연관검색어에 올릴 수 있었을까요? 바로 '빅 데이터 분석'입니다.

유원상 유유제약 상무에 따르면, 이 회사는 1~2년 전까지 베노플러스겔을 어린이 제품으로 포지셔닝 하고 있었습니다. 아무래도 자주 넘어지고 부딪히는 어린이들이 멍들고 붓는 일이 많다고 생각했기 때문입니다.

그런데 빅데이터 분석을 통해 진짜 고객은 어린이가 아니라는 사실을 발견했습니다. 유유제약이 텍스트마이닝 업체 다음소프트에 의뢰해 온라인 상의 각종 글들을 종합 분석한 결과 멍이나 붓기를 빨리 빼고자 하는 집단은 어린이가 아니라 여성이라는 사실을 발견했습니다. 얼굴의 멍 때문에 외출을 못하거나, 미니스커트를 입기 위해 멍을 빨리 없애고 싶은 요구가 여성들에게 있었던 것입니다. 그 동안 유유제약이 주력했던 어린이의 수요 보다 여성들이 7배 정도 많은 수요가 있는 것으로 분석됐습니다.

이 같은 결론을 얻은 유유제약은 제품의 컨셉트를 바꾸기 시작했습니다. 베노플러스겔을 단순한 의약품이 아닌 미용을 위한 의약품으로 포지셔닝 하기로 한 것입니다.  마케팅 및 광고 메시지도 '계란은 팔아파요, 소고기는 비싸요' '무릎에 메이크업? 멍 가리지 말고 빼자'는 등 여성들의 취향에 맞도록 유머러스하면서 여성들의 고민을 담아내는 쪽으로 바꿨습니다. 제품 디자인도 연고가 아닌 화장품처럼 보이도록 바꿨고, 여성잡지 등에도 광고를 했습니다.

사용자 삽입 이미지
마케팅 방향을 바꾼 것은 매출에 큰 도움이 됐습니다. 지난 해 베노플러스겔 매출은 전년대비 64% 성장했고, 전전년대비 104% 올랐습니다. '멍 빨리 없애는 법'이라는 검색 키워드에 관련 제품 중 유일하게 연관검색어로 등재됐습니다.

빅데이터 분석을 통해 제품을 필요로 하는 소비자들이 어디에 있는지 파악하고 마케팅 전략을 바꾼 것이 큰 도움이 됐다는 것이 유원상 상무의 말입니다.

2~3년 전부터 IT업계를 필두로 화두가 된 빅데이터 분석이 이제는 기업 경영의 중요한 경쟁우위전략으로 떠올랐고, 이를 잘 활용하는 기업은 앞서 나갈 수 있다는 사실을 유유제약이 보여주고 있습니다.

<심재석 기자>sjs@ddaily.co.kr

2013/01/18 16:12 2013/01/18 16:12

사용자 삽입 이미지
글로벌 공룡 IT 기업 오라클의 화려한 변신이 화제입니다. 오라클은 지난 주 미국 샌프란시스코에서 연례 고객 컨퍼런스인 ‘오라클 오픈월드 2012’를 개최했습니다. 외신을 통해 전해진 행사 소식을 살펴보면 온통 클라우드 컴퓨팅에 대한 이야기뿐입니다.



행사 시작 직전 래리 앨리슨 오라클 회장이 CNBC와의 인터뷰에서 “앞으로 대형 인수보다는 클라우드 컴퓨팅을 통한 내부 성장에 주력하겠다”고 밝힌데 이어 클라우드 컴퓨팅 관련 신제품 및 서비스가 쏟아졌습니다.


이는 일종의 자기배반입니다.  래리 앨리슨 회장은 그 동안클라우드 컴퓨팅에 대해 “하나도 새로울 것이 없는 마케팅 용어인 헛소리”라거나 “클라우드 컴퓨팅은 이미 다 있는 것을 다시 한 군데 몰아넣고 재정의한 것에 불과하다”는 말을 자주했습니다.


그러나 오라클과 래리 앨리슨 회장은 확실히 변했습니다. 클라우드 컴퓨팅은 이제 오라클의 전략의 핵심이 됐습니다.


대표적으로 오라클은 이번 행사에서 인프라 서비스(IaaS, Infrastructure as a Service)를 새롭게 출시했습니다. 아마존 EC2나 KT 유클라우드와 같은 사업을 오라클이 한다는 것입니다. 오라클은 이미 소프트웨어 서비스(SaaS, Software as as Service)와 플랫폼 서비스(PaaS, Platform as a Service)를 진행중입니다. 클라우드 컴퓨팅의 세 가지 형태인 SaaS, PaaS, IaaS를 모두 제공하는 것입니다. 이런 회사는 구글밖에 없습니다.


또 오라클은‘오라클 프라이빗 클라우드’라는 것도 추가했습니다. 고객은 자사의 데이터 센터에 오라클 인프라를 설치하고, 프라이빗 클라우드 기반으로 활용하라는 것입니다. 고객에게 대여하는 장비는 오라클이 소유하고, 운영 관리, 업그레이드도 오라클이 합니다. 오라클 클라우드를 방화벽 내에서 이용하라는 접근법입니다.


오라클의 핵심 제품인 ‘DB’도 클라우드 환경에 맞게 재설계 됐습니다. 이번 행사에서 소개된 오라클 DB 12c는 ‘컨텐이너’라는 새로운 개념을 도입했습니다. 기업들은 컨테이너 DB를 구축하고, 거기에 플러그 DB를 플러그인하는 형태로 이용할 수 있습니다. 한 컨테이너 속의 플러그인 된 DB들은 컨테이너의 자원을 공유하지만, 논리적으로 분리돼 있습니다.


래리 앨리슨 회장은 이에 대해 “세계 최초의 멀티 테넌트를 지원하는 데이터베이스”라고 말했습니다. 한 때 래리 앨리슨 회장은 “멀티 태넌시는 끔찍한 기술”이라고 비난한 바 있을 정도도 이에 대해 비판적이었습니다. 여러 기업이 DB를 공유하는 것은 재앙이라는 주장입니다.


그랬던 래리 앨리슨 회장이 이제는 스스로 멀티-태넌시를 가능케하는 기술을 제공하겠다고 나섯습니다. 스스로 끔찍한 기술이라던 멀티-태넌시를 더 잘 구현하기 위해 오라클 DB 아키텍처를 바꾼 것입니다.


오라클과 래리 앨리슨의 이같은 변신은 놀랍습니다. 그러나 클라우드 컴퓨팅을 외면한채 IT산업에서 살아남기 어려운 것도 사실입니다.


그래서 오라클의 변신은 무죄!
2012/10/10 10:50 2012/10/10 10:50
사용자 삽입 이미지

- [딜라이트닷넷 창간3주년 특별기획/ 빅데이터③]

가트너는 2015년까지 포춘 500대 기업 대부분이 빅데이터 분석에 도전하겠지만 이중 85%는 실패할 것이라고 예측한 바 있습니다. 주목해야 할 점은 85%의 실패보다는 15%의 성공입니다. 빅데이터 분석에 성공하는 기업의 비결은 무엇일까요?

전문가들은 성공적인 빅데이터 분석을 위해서는 기술, 사람, 비즈니스 인사이트가 필수적이라고 지적합니다.

◆ 빅데이터 성공요소 ‘기술’ = 빅데이터가 주목을 받는 이유는 과거 기술로는 처리할 수 없었던 데이터들을 처리하고, 분석할 수 있는 새로운 기술들이 등장했기 때문입니다.

하 둡/맵리듀스가 가장 대표적인 빅데이터 기술이라고 볼 수 있습니다. 하둡은 대용량 데이터 처리를 위해 대규모 분산처리를 지원하는 프레임워크입니다. 맵리듀스는 대량의 데이터를 다수의 서버에 나눠 집계•가공하는 맵(Map) 과정과 처리 결과를 하나의 표에 정리해 출력하는 리듀스(Reduce)라는 과정을 반복하면서 비구조적 데이터를 처리해 나갑니다.

하둡/맵리듀스는 관계형 데이터베이스로는 엄두도 내지 못했던 데이터들을 분석의 대상으로 삼을 수 있게 한다는 점이 가장 큰 장점입니다.

최 근에는 CEP(복합 이벤트 처리)나 스트리밍 분석도 빅데이터 분석의 방법론으로 떠오르고 있습니다. 과거 비즈니스인텔리전스 기술은 일정 기간 저장된 데이터를 모델링 하고, 분석해 결과를 얻었습니다. 하지만 현대 기업들은 그렇게 한가하지 않습니다. 이 때문에 실시간 분석의 가치가 높아졌습니다. CEP는 실시간으로 발생하는 많은 이벤트 중에서 의미가 있는 것을 추출해 분석하는 기술입니다. 센서네트워크 등으로 통해 실시간으로 쏟아지는 무수한 데이터 등에서 필요한 데이터를 선별해 분석할 수 있습니다.

인 메모리 분석 기술도 빅데이터 시대를 맞아 인기를 끌고 있습니다. 이 역시 빠른 분석을 위한 것입니다. SAP는 HANA라는 인메모리 기반의 DB를 선보이기도 했고, SAS, 테라데이타 등도 인메모리 기술을 적극적으로 활용하고 있습니다.

◆ 빅데이터 성공요소 ‘사람’ = 빅데이터 시대에 가장 각광을 맞는 직업은 ‘데이터 사이언티스트’입니다. 백사장에서 바늘을 찾듯 엄청나게 쏟아지는 데이터 속에서 유의미한 무엇을 발견해 낼 수 있는 사람이 필요해진 것입니다.

하지만 이는 아무나 할 수 있는 일이 아닙니다. 기존에는 데이터를 다루는 직종으로 데이터 모델러, 데이터 아키텍트 등이 있었습니다. 이들은 전통적인 IT맨들이었습니다.

반면 데이터 사이언티스트들은 구조화되지 않은 데이터 속에서 지금까지 드러나지 않았던 숨겨진 패턴을 찾아내는 역할을 합니다.

가 트너는 데이터 사이언티스트가 컴퓨터 공학과 수학적 기반의 의미를 부여하고, 디지털 시스템에 지식을 결합하는 전문가로, 데이터의 저장ㆍ이동ㆍ통합, 분산처리를 활용해 정보를 요청하는 고객에게 최선의 기대 서비스를 제공한다고 설명합니다.  

이제는 IT뿐 아니라 통계학, 수학, 경제학 지식을 겸비한 전문가가 필요한 것입니다. 이런 데이터 사이언티스트를 확보하는 것은 매우 어려운 일입니다. 빅데이터 분석에 성공하는 기업들이 적은 가장 큰 이유도 데이터 사이언티스트를 확보하는 것이 어렵다는 점입니다.

◆ 빅데이터 성공요소 ‘비즈니스 인사이트’ = 빅데이터 기술과 데이터 사이언티스트가 있다고 빅데이터 분석이 성공할 수 있는 것은 아닙니다.

데 이터 사이언티스트들이 빅데이터 기술을 활용해 이끌어 낸 결과에 따라 어느 정도 비즈니스 방향은 예측할 수 있지만, 이 결과를 기업의 환경과 상황에 맞게 어떻게 활용할 것인지를 결정하지 못하면 기술과 사람은 쓸모 없게 됩니다. 이 때문에 빅데이터 분석에 비즈니스 통찰력은 필수적입니다.

SAS코리아 이재권 상무는 빅데이터 분석에 대해 “기술은 후순위, 비즈니스가 우선순위”라고 말합니다.

빅데이터 분석은 비즈니스를 예측하고, 최적화 하기 위한 활동입니다. 이를 위해서는 빅데이터 기술, 데이터사이언티스트, 비즈니스 통찰력 삼박자가 맞아야 합니다.

2012/10/09 14:33 2012/10/09 14:33

사용자 삽입 이미지
- [딜라이트닷넷 창간 3주년 특별기획/ 빅데이터]

최근 빅데이터 분석이 경영 전문가들에게 많은 관심을 받고 있습니다. 빅데이터가 치열한 경쟁 속에서 있는 기업 경영의 나침반이 될 것이라는 기대 때문입니다.


물론 기업이 IT 기술을 전략 수립에 활용하려는 시도는 어제오늘 일이 아닙니다. 기존에도 경영자정보시스템(EIS), 비즈니스인텔리전스 등의 이름으로 유사한 접근이 있었습니다.

그러나 이런 접근들이 적지 않은 성과를 내기도 한 반면, 데이터의 왜곡으로 인한 한계점을 노출하기도 했습니다.

그렇다면 빅데이터는 기존의 BI와 무엇이 다른 걸까요? 전문가들은 빅데이터 분석과 기존BI의 다른 점으로 ▲데이터 처리량 ▲데이터 유형 ▲데이터 (분석)속도▲데이터 분석 범위 등을 꼽습니다.

◆ 수백테라바이트를 넘어 페타바이트까지 = 우선 빅데이터 분석은 이름에서 알 수 있듯 대규모 데이터를 분석하는 역할을 합니다. 지금까지 기업들은 사내 정보를 데이터웨어하우스(DW)라는 창고에 쌓아두고 이를 분석해 통찰력을 얻고자 했습니다. 국내의 경우 대용량 DW라고 해도 100테라바이트를 조금 넘는 수준이었습니다.

그러나 빅데이터 분석은 DW에 쌓인 데이터만을 대상을 하지 않습니다. 이미 스마트폰과 소셜네트워킹, 센서네트워크 등을 통해 어마어마한 용량의 데이터가 수집되고 있습니다. 스마트폰은 전국민이 활용하는 시대를 눈앞에 두고 있고, 소셜네트워크는 모바일과 만나 갈수록 활용도가 높아지고 있습니다. 센서 가격도 떨어지면서 각종 전자제품에 센서들이 내장되고 있습니다. 예를 들어 로봇청소기에만 18개의 센서가 탑재돼 있다고 합니다.

IDC는 2011 년에 인류가 생성한 데이터가 1.8 제타바이트에 달한다고 합니다. 기업들이 분석할 데이터가 이제는 테라바이트 수준을 넘어 페타바이트까지 이르고 있습니다.

◆ 비정형, 비구조적 데이터는 기본  = IDC의 조사에 따르면 2009년부터 2014년까지 연평균 정형 데이터의 증가율은 24%에 불과한 반면 비정형 데이터의 증가율은 55%라고 합니다. 앞에서 언급한 센서네트워크 데이터, 소셜 데이터 등은 비정형 데이터를 기하급수적으로 늘리고 있습니다.

페이스북에서는 매월 300억개의 콘텐츠가 공유되고 있고, 트위터에서는 약 2억 건의 트윗이 발생하고 있다고 합니다. 이러한 소셜 미디어에서 생성되는 데이터는 주로 텍스트, 동영상, 오디오, 이미지 등의 비정형 데이터입니다.

최근에 소셜 분석이 국내외에서 인기를 끄는 것도 이 같은 이유 때문입니다. 트위터 등 소셜 미디어에서 쏟아지는 정보를 분석해 고객만족도 및 VoC(고객의 목소리)를 체크하겠다는 것입니다.

◆ 실시간 데이터 생성 시대…분석도 실시간으로 = 앞에서 언급한 것처럼 데이터의 양이 기하급수적으로 늘고 있다는 점은 데이터 분석 속도도 높여야 한다는 숙제도 안겨주고 있습니다.

과거의 분석 속도는 쌓이는 데이터를 감당하기도 힘들기 때문입니다. 빅데이터 시대는 실시간 데이터 분석이 필수적인 요소로 떠오르고 있습니다.

최 근 SAP HANA와 같은 인메모리 기반의 분석 플랫폼이 등장하고, 데이터를 저장하지 않고 흐르는 상태에서 분석하는 스트리밍 데이터 분석이나 복합 이벤트 처리 (Complex Event Processing : CEP) 등이 각광을 받는 것도 실시간 분석에 대한 요구의 반영입니다.

◆ 어제 데이터 분석을 넘어 내일 예측까지 = 기존에는 오늘 획득한 데이터를 업무가 끝난 밤 시간에 DW에 배치(Batch)하고, 그 정보를 분석했습니다. 이는 지금 분석하고 있는 정보가 지금 이순간이 아닌 어제의 정보를 분석하고 있다는 것을 의미합니다.

그 러나 빅데이터 분석 시대에는 지금까지 벌어진 일을 분석하는 것을 넘어 내일을 예측하는 것이 필요합니다. 예를 들어 지금까지 내비게이션은 목적지에 도달하는 길을 알려주는 역할에 충실했습니다. 조금 더 진보한 내비게이션은 교통량이 많은 길을 우회해 상대적으로 막히지 않는 길을 안내했습니다. 하지만 앞으로 막힐 곳까지 알려주는 내비게이션은 없었습니다.

빅데이터 시대에는 과거의 데이터와 현재의 데이터를 조합해 미래의 상황까지 예측해야 합니다.

2012/10/09 14:32 2012/10/09 14:32