사용자 삽입 이미지
지난 2010년, EMC는 업계의 주목을 받는 인수합병을 성공시켰다. 데이터웨어하우스(DW) 업체 그린플럼이 주인공이다. 이 두 인수를 통해 EMC는 빅데이터 시대를 선도하고 있다.

EMC는 2011년 말 이를 기반으로 정형데이터와 비정형데이터를 통합 지원하는 통합 분석 플랫폼, ‘EMC 그린플럼 UAP(United Analytics Platform)’을 출시했다.

EMC 그린플럼 UAP는 ▲EMC 그린플럼 데이터베이스 ▲EMC 그린플럼 코러스 ▲EMC 피보탈 HD 등 세 가지 그린플럼 제품으로 구성돼 있다.

그린플럼 DB는 정형 데이터 분석을 위한 관계형DB다. 회사 측에 따르면, 데이터를 분리하는 대용량 병렬처리 MPP(Massively Parallel Processing) 구조를 이용, 방대한 양의 정형 데이터를 보다 저렴한 비용으로 빠르게 처리하고 분석할 수 있다.

그린플럼 코러스는 데이터 분석 인력이 서로 협업할 수 있는 소셜 협업 툴이다. 회사 측은 이 제품에 대해 “시공간의 자유를 보장하는 소셜 및 협업 툴셋을 제공함으로써 언제 어디서나 빅데이터를 반복적으로 활용 분석하고 이를 통해 얻어낸 통찰력을 현업에 신속히 적용할 수 있게 지원한다”고 설명했다.

이 중 가장 주목되는 것은 오픈소스 빅데이터 분석 플랫폼인 하둡 기술을 내재화 한 피보탈 HD다. 그린플럼 DB가 대용량 정형 데이터 분석을 위한 플랫폼이라면, 피보탈HD는 비정형 데이터를 분석을 위한 핵심 플랫폼이다.

회사 측에 따르면, 이는 아파치 하둡 프레임워크에 빅데이터 분석 플랫폼인 EMC 그린플럼 MPP 데이터베이스 기술을 통합시켜 개발한 것이다. EMC는 “피보탈 HD를 통해 다양한 종류의 데이터 분석 도구와 언어를 SQL 인터페이스 기반에서 구현해 하둡의 확장성, 고가용성, 비용 효율성을 보다 높일 수 있다”고 강조했다.

최근 하둡 기술은 비정형 데이터 분석 분야에서 유연성, 확장성, 저비용 등의 장점으로 각광을 받고 있지만, 복잡한 인터페이스와 하둡 개발 인력 부족으로 적용에 어려움을 겪고 있다.

반면 ‘피보탈 HD’은 SQL 표준 쿼리 인터페이스 기반으로 하둡 파일시스템에 저장된 데이터 세트를 간편하게 질의하고 분석할 수 있다고 회사 측은 설명했다. SQL 표준 쿼리 인터페이스를 지원한다는 것은 맵-리듀스와 같은 기술을 숙지한 고급 개발자 없이 하둡 기술을 활용할 수 있다는 것을 의미한다.

회사 측은 특히 “피보탈 HD의 핵심 기술로 10년에 걸친 연구개발 성과인 EMC 그린플럼의 ‘호크 테크놀로지(HAWQ Technology)’가 최초로 도입됨에 따라, 다양한 쿼리 및 데이터 분석에 대한 응답 속도를 하둡 기반으로 최소 100배에서 최대 600까지 획기적으로 높였다”고 강조했다.

‘피보탈 HD’는 EMC 빅데이터 분석 플랫폼인 ‘EMC 그린플럼 DCA UAP’ 기반으로 그린플럼 데이터베이스와 함께 운영될 수 있으며, 또한 스케일아웃 스토리지인 ‘EMC 아이실론’의 하둡 파일시스템 프로토콜을 활용해 아이실론과 통합 구성이 가능하다.

EMC는 이같은 플랫폼 이외에도 데이터 과학자 양성에도 적극적이다. 지난 2011년 5월 라스베가스에서 세계 최초로 ‘데이터 과학자 서밋(Data Scientist Summit)’을 개최했으며, 지난 해 5월 제2회 서밋을 개최했다.

한국EMC도 빅데이터 분석을 위한 데이터과학자 양성을 위해 빅데이터 개념부터 분석방법, 분석도구, 기업 유형별 실습 등 다양한 커리큘럼을 포함한 ‘데이터 과학 및 빅데이터 분석 과정’을 2012년에 개설했다.

첫해에만 정규교육과정 및 기업방문교육과정(On-site)을 통해 총 132명의 교육생을 배출했으며, 2013년에는 총 6차례의 정규교육과정과 약 20차례의 방문교육을 진행해 약 430명 이상의 교육생들이 빅데이터 교육 과정에 참가할 것으로 예상되고 있다.
2013/10/08 09:25 2013/10/08 09:25
사용자 삽입 이미지
스플렁크는 빅데이터 시대에 제대로 탄력받는 중소 IT업체다. 지난 해 상장하자마자 주가가 두 배 오르며 파장을 일으켰다. 1999년 이후 IT업계에서 이같은 성공적인 IPO는 없었다는 평가가 나올 정도다. 현재는 그것보다도 두 배 가까운 주가를 유지하고 있다.


스플렁크 비즈니스의 핵심은 컴퓨터 시스템의 사용 내역이 기록된 로그 파일을 검색하는 ‘검색 엔진’이다.

스플렁크는 웹사이트, 애플리케이션, 서버, 네트워크 및 모바일 장치와 같이 기업의 중심이 되는 각종 머신에서 생성된 이러한 빅데이터를 수집하고 이를 인덱싱해 활용할 수 있는 소프트웨어 플랫폼을 제공한다.

스플렁크의 소프트웨어는 컴퓨터 안의 모든 로그파일을 검색한다. 스플렁크는 이를 ‘
머신 데이터’라고 부른다. 웹사이트 사용시 발생하는 모든 내역을 기록하고 저장하므로 기업들은 개개인의 정보를 수집할 필요가 없이 웹사이트에서 일어나는 모든 ‘클릭’을 분석해 필요한 정보를 얻을 수 있다.

로그 파일을 분석하면 홈페이지에 어떤 문제가 있는지 쉽게 찾아낼 수 있기 때문에 문제가 발생하면 해결방안을 찾을 수 있다.

스플렁크는 “빅데이터를 실시간 운영 인텔리전스로 바꿔준다”고 설명했다. 빅데이터를 실시간으로 저장, 모니터링하고 검색하는 서비스를 제공하며, 300개 이상의 스플렁크 앱이 패키지 된 시각화, 대쉬보드, 워크플로우를 제공한다.

스플렁크는 보안에도 유용하게 사용된다. 실시간으로 로그를 분석해 비정상적인 움직임을 탐지할 수 있기 때문이다. 회사 측은 “위협 가능성이 있는 행동 패턴이 생겨나는 지를 판단하고 빅데이터 기술을 이용해 위협 행동의 패턴을 분석하고 가시화한다”면서 “이제 보안 인텔리전스 분석가는 스플렁크를 사용해 회사의 명성 유지와 비용을 고려한 위험기반 완화 전략을 실행할 수 있다”고 말했다.

스플렁크의 소프트웨어를 성공적으로 사용한 사례로는 익스피디아를 들 수 있다. 항공권 및 호텔 예약 전문 웹사이트인 익스피디아는 스플렁크를 이용해 웹사이트에서 고객들이 확인해 본 모든 내역들과 고객를 수집할 수 있게 됐다.

스플렁크가 웹사이트상에서 일어나는 모든 내용을 분석해 필요한 정보를 익스피디아에 제공해주기 때문에 익스피디아가 따로 고객 개개인의 정보를 수집해야 하는 번거로움도 사라졌다.

또 사이트에서 오작동이 일어날 경우, 스플렁크는 로그 파일 분석 기능을 통해 문제를 빠르게 파악하고 익스피디아에 알리며 문제에 대한 해결방안까지 조언한다. 회사 측은 “스플렁크 덕분에 익스피디아는 연간 1400만 달러의 비용 절감을 경험했다”고 설명했다.
2013/09/26 16:18 2013/09/26 16:18
국내 중소 IT업체인 모비젠은 어플라이언스 형태의 빅데이터 솔루션인 ‘아이리스’를 공급하고 있다. 모비젠은 원래 이동통신사의 망관리 및 운영자용 SW솔루션을 공급하는 회사인데, 최근 빅데이터 분야에 강한 의지를 내비치고 있다.

사용자 삽입 이미지
모비젠은 ‘아이리스’라는 빅데이터 어플라이언스를 공급하고 있다. 회사 측은 이에 대해 “고성능, 실시간 처리를 지원하는 빅데이터 데이터베이스 솔루션”이라며 “지난 10년간 국내 텔레콤 영역의 빅데이터 프로젝트를 수행하면서 쌓인 노하우를 바탕으로 연구·개발한 결과물”이라고 말했다.


회사 측에 따르면, 아이리스의 가장 큰 장점은 표준 SQL을 지원해 전문 기술자 없이도 손쉽게 빅데이터에 대한 처리가 가능한 점이다. “오픈소스 하둡(Hadoop) 기반의 빅데이터 솔루션이 ‘맵리듀스’ 방식을 통해 데이터를 처리하기 때문에 관련 전문가가 필요한 것과는 다르다”는 것.

회사 측은 “아이리스는 기존의 DB관리자들이 손쉽게 빅데이터를 활용할 수 있는 것”이라며 “”많은 업체들이 표준 SQL을 적용한 빅데이터 솔루션을 연구 및 개발하고 있는 상황이지만 상용화에 이른 곳은 모비젠의 아이리스가 거의 유일하다”고 강조했다.

아이리스는 대량으로 쏟아지는 시계열 로그 데이터를 실시간으로 처리할 수 수있다. 국내 이동통신사의 ‘LTE 망 품질관리’, ‘과금 데이터 관리’ 등에 활용되고 있으며, 며 최대 하루 약 600억건의 데이터를 처리해내고 있다.

회사 측은 특히 “자체적인 시스템 지원 및 서비스 체계를 구축해 오픈소스를 활용한 빅데이터 솔루션과는 달리 빠르게 장애를 복구할 수 있다”고 강조했다.

회사 측은 아이리스가 비용 면에서도 큰 장점이 있다고 소개했다. 널리 쓰이고 있는 외산 업체와 비교해서 약 20%의 비용으로 구축이 가능하고, 특히 기존에 사용하던 플랫폼의 데이터 증가로 인해 용량증설을 해야할 때 비용을 대폭 줄일 수 있다고 설명했다.

대부분의 업체들이 DW 증설을 위해서 전체 플랫폼을 새롭게 추가해야 하는 것과는 다르게 아이리스는 대용량의 데이터를 수집 및 저장하는 부분에 설치하면 해결이 가능하기 때문이다.

회사 측은 “최근 들어 오픈 소스 기반의 빅데이터 솔루션들이 실시간 데이터 처리에 약점을 드러내고 전문가가 필요하다는 이유에서 문제점이 제기되고 있다”면서 “국내 업체로는 최초로 표준 SQL을 적용한 빅데이터 솔루션 '아이리스'를 통해 시장을 선도해나갈 계획”이라고 말했다.
2013/09/26 16:17 2013/09/26 16:17
사용자 삽입 이미지
그루터는 KT넥스알과 함께 국내 업체 중 가장 빅데이터 플랫폼 분야에서 두각을 나타내는 회사다. 회사 규모는 KT넥스알에 비해 작지만, 다양한 빅데이터 플랫폼 구축 사례 경험한 전문가가 포진해 있는 것으로 알려져 있다.


그루터는 쿠바(Qoobah)와 클라우몬(Cloumon)이라는 플랫폼을 보유하고 있다.

회사 측은 쿠바에 대해 “하둡 에코시스템 기반의 최적화된 빅데이터 플랫폼”이라고 소개한다. 오픈소스를 기반으로 하고 있으며,오픈소스의 부족한 점은 자체 개발해 보완했다고 한다. 이를 통해 통합 데이터 체계를 제공하고,확장성, 안정성, 성능, 편의성, 비용 등의 문제를 해결할 수 있다고 회사 측은 강조했다.

쿠바를 도입한 대표적 사례는 국내 한 대기업의 보안 로그 분석 시스템이다. 방화벽이나IDS/IPS, 웹서버를 비롯한 각종 유입로그를 쿠바 기반의 빅데이터 플랫폼에서 대용량 배치분석,실시간 패턴매칭 분석 등을 실시한다.
 
‘클라우몬(Cloumon)’은 하둡 관리 솔루션이다. 클라우몬은 하둡뿐 아니라 하둡에코시스템 전체에 대한 관리 기능을 제공하는 것이 특징이다. 하둡 노드에 대한 모니터링부터 맵리듀스 잡모니터링, 하이브 테이블 스키마 관리, 주키퍼 데몬 모니터링, 플럼 노드 모니터링, H베이스 데이터/스키마 관리, 우지(Oozie) 기반의 워크플로우 생성 및 실행 등의 기능을 제공한다.

그루터는 최근에는 ‘ 시퀄 온 하둡(sql on hadoop)’이라는 기술에 매달리고 있다. 이는 최근 전세계적으로 주목받는 빅데이터 플랫폼의 핵심 기술 중 하나로, 실시간 데이터 처리에 약점을 가졌던 하둡의 한계를 극복하고, 빠르게 의미있는 데이터를 뽑아내는 것이다.

이번에 그루터가 개발하는 빅데이터 분석 처리 엔진은 ‘타조(tajo.incubator.apache.org)’다. 타조는 지난 3월 세계 최대 오픈소스 재단인 아파치 소프트웨어 재단의 인큐베이터 프로젝트로 채택됐다.그루터는 지난  2012년부터 준비기간을 거쳐 올 6월부터 본격적인 개발 작업에 착수했다. 아파치 재단의 PMC(프로젝트 관리위원회) 멤버이며 타조 최초 발의자인 최현식 박사가 졸업과 동시에 그루터에 합류했다.

권영길 그루터 대표는 “sql on hadoop 기술은 빅데이터 플랫폼의 차세대 핵심 기술로 기존하둡의 응용면에서도 엔터프라이즈급 성능을 제공함으로써 많은 부분 기존 시장의 대체와 함께 신규시장을 빠르게 확대하는데 일조할 것”이라고 강했다.
2013/09/26 16:15 2013/09/26 16:15
사용자 삽입 이미지
KT넥스알은 가장 대표적인 국내 빅데이터 플랫폼 기업이다.  KAIST 전자전산학과 박사출신인 한재선 대표가 설립해 지난 2010년 KT에 인수됐다.


클라우드 컴퓨팅 기술 전반을 개발하던 넥스알은 KT에 인수된 이후 빅데이터에 집중하고 있다. 특히 KT와 계열사들을 대상으로 대규모 구축 사례를 확보하며, 국내에서 가장 활발한 빅데이터  업체로 자리매김했다.

KT 넥스알은 NDAP(NexR Data Analytic Platform)이라는 빅데이터 플랫폼을 보유하고 있다. 회사 측에 따르면 이는 빅데이터의 수집ㆍ처리ㆍ저장ㆍ분석 등이 모두 가능한 일체형(All-in-One) 플랫폼 소프트웨어다.

오픈소스 하둡과 관련 생태계 제품들을 하나의 플랫폼에 통합했으며, 기업이 사용하기에 아직 오픈소스 소프트웨어가 부족한 부분은 KT넥스알이 직접 개발했다.

하둡은 기술적 난이도와 오픈소스의 관리 어려움으로 기업에서는 하둡의 장점을 인식하면서도 도입 결정을 내리기 쉽지 않다. 그러나 NDAP은 하둡 에코시스템 상위계층으로 기존 IT 담당자들에게 익숙한 SQL과 워크플로우 환경을 제공해 빅데이터에 쉽게 접근할 수 있도록 한다.

회사 측에 따르면, NDAP은 데이터 증가에 따라 유연하게 확장할 수 있고 추출ㆍ변환ㆍ적재(ETL) 배치 처리는 물론 실시간 데이터 질의까지 지원한다.

정형/반정형/비정형 데이터 모두 처리가 가능하며 기존 관계형데이터베이스관리시스템(RDBMS) 및 분석 SW와도 연계되고, ANSI SQL 기반의 통합 아키텍처를 기반으로 기존 레거시 시스템과 연계가 쉽다고 회사 측은 설명했다.

또 분산 파일 시스템을 병렬로 처리해 고성능 빅데이터 플랫폼을 운영할 수 있다고 회사 측은 강조했다.
 
회사 측은 NDAP 에 대해 “복잡하고 다양한 하둡 에코시스템을 기업 환경에서 보다 원활하게 운영하기 위해 개발된 엔터프라이즈 빅데이터 통합 SW”라고 설명했다.

KT 넥스알은 국내 기업으로서는 유일하게 100여명에 달하는 자체 개발 및 프로페셔널 전문 인력을 보유하고 있다는 점이 특징이다.

예를 들어 KT 넥스알은 국내 유일의 ‘아파치 하이브 커미터(Apache Hive Committer)’가 근무하고 있다. 아파치 하둡 에코시스템의 핵심 기술 중 하나인 하이브 프로젝트 기여도 면에서는 전세계적으로 호튼웍스, 페이스북 다음으로 KT 넥스알이 영향력을 미치고 있다. 특히 국내 기업으로는 유일하게 글로벌 업체와 대등한 입장에서 하둡 에코시스템을 주도하고 있는 것이다.

또 단순 제품을 판매하는 수준을 넘어 고객이 빅데이터로부터 실질적 결과를 도출할 수 있도록 서비스를 제공한다.

회사 측은 “현장 전문가 팀은 다수의 빅데이터 프로젝트 수행 경험과 데이터 분석 능력을 겸비해 고객과 프로젝트를 공동 수행하며 빅데이터 분석에 대한 기술을 전수하고 고객 내부 빅데이터 전문인력 양성에 일조하고 있다”면서 “단순히 솔루션이나 어플라이언스를 제공하는 다른 벤더들과 차별화된 요소”라고 강조했다

회사 측은 “NDAP을 도입해 데이터 중심의 의사결정 체계를 마련한 고객들은 즉각적인 비용 절감 및 매출 증대 효과를 거두고 있다”면서 “기존의 감성과 경험에 바탕을 둔 의사결정에서 데이터 중심의 비즈니스 의사 결정으로 기업이 목표로 하는 비용 절감과 프로세스 개선을 도모할 수 있다”고 덧붙였다.
2013/09/26 16:14 2013/09/26 16:14

데이터웨어하우징(DW)  플랫폼 분야의 최강자인 테라데이타는 새로운 트렌드로 뜨겁게 부상하고 있는 빅데이터 분석을 위해 2011년 애스터 데이터 시스템(Aster Data Systems)를 인수했다. 기존의 테라데이타 기술은 주로 정형 데이터를 대상으로 하고 있었기 때문에 빅데이터의 핵심인 비정형, 반정형 데이터 분석을 위해 새로운 무기가 필요했기 때문이다.

사용자 삽입 이미지
테라데이타 애스터는 웹, 센서 네트워크, 소셜 네트워크, 유전체학 등에서 반정형 데이터를 관리할 수 있는 SQL-맵리듀스 등의 도구를 제공한다.


특히 애스트 SQL-H는 비즈니스 분석가들이 고급 분석을 수행하기 위해 하둡의 데이터에 직접 액세스할 수 있게 해준다. SQL-H를 사용하면 온라인분석처리(OLAP)과 같은 공통 BI 및 보고 도구를 사용할 수 있다.

이를 통해 하둡 데이터에 액세스하거나, 필요에 따라 애스터 DB에 저장된 데이터와 결합(Join)하고, SQL-맵리듀스의 분석, 클릭 스트림 분석, 마케팅 속성, 그래프 분석 등의 비즈니스 전용 분석 기능 및 애플리케이션을 활용할 수 있다고 회사 측은 설명했다.

이처럼 테라데이타는 기존의 DW시스템과 애스터, 하둡 등을 통합해 빅데이터에 대응하는 것이 전략의 핵심이다. 이를 통합해 ‘테라데이타 통합 데이터 아키텍처’를 구성했다.

회사 측에 따르면, 이는 테라데이타 DW, 애스터 디스커버리 플랫폼, 오픈 소스 하둡 기술을 하나의 투명한 패브릭 시스템으로 통합함으로써, SQL 비즈니스 언어와 맵리듀스를 서로 연결시켜주는 가교 역할을 한다.

테라데이타 통합 데이터 아키텍처를 통해 하나로 통합된 고성능 분석 환경을 제공한다는 것이 회사 측의 목표다.

이를 위한 제품으로는 2012년 출시한 테라데이타 빅 애널리틱스 어플라이언스가 대표적이다. 아파치 하둡과 테라데이타 애스터를 단일 어플라이언스에 하나로 통합한 것이다.

회사 측은 이 제품에 대해 “빅데이터 분석 과정에서 고질적으로 느렸던 적용 속도의 한계를 극복하고 고객들이 자사의 모든 데이터를 통해 가치를 극대화할 수 있게 해준다”고 강조했다.

하둡용 테라데이타 어플라이언스도 있다. 이는 하둡이 미리 설치된 어플라이언스다. 회사측은 “기존 DIY(Do It Yourself) 방식의 하둡보다 성능, 사용 편의성, 보안 및 안정성이 대폭 향상됐다”면서 “즉시 사용할 수 있는 상태로 제공되는 통합된 시스템으로, 멀티스트럭처 데이터를 대상으로 한 빅데이터 저장 목적에 정확히 부합된다고 할 수 있다”고 설명했다.

하둡용 테라데이타 어플라이언스는 캐비닛당 최대 152TB의 공간을 제공하며 전체 시스템은 10PB까지 확장 가능하다. 테라데이타, 테라데이타 애스터, 하둡 시스템 간 신속한 데이터 교환을 위해 40Gb 인피니밴드 네트워크 상에서 패브릭 기반의 컴퓨팅으로 연결돼 있다. 호튼웍스 데이터 플랫폼 (HDP)이 사용된다는 것도 특징이다.

회사 측은 “기업들은 테라데이타 통합 데이터 아키텍처를 활용해 어떠한 환경에서도 모든 데이터를 구축, 지원, 관리할 수 있고 원활한 액세스가 가능하다”면서 “테라데이타가 이러한 기술들을 통합한 것은 각 구성요소들을 단순히 합한 것보다 월등한 가치를 제공한다”고 강조했다.
2013/09/26 16:12 2013/09/26 16:12
사용자 삽입 이미지
관계형 데이터베이스관리시스템(RDBMS)에서 최강자의 지위에 올라있는 오라클은 빅데이터 플랫폼 분야에서도 그 영향력을 유지하기 위해 다양한 제품을 내세우고 있다.


지난 몇 년간 오라클 전략의 핵심은 ‘엔지니어드 시스템(Engineered Systems)’으로 이해할 수 있다. 이는 썬마이크로시스템 인수를 통해 획득한 하드웨어 기술과 기존의 소프트웨어 기술을 통합해 어플라이언스로 제공하는 것이다.

빅데이터 플랫폼 분야에서도 오라클은 엔지니어드 시스템을 앞세우고 있다.

기존의 관계형DB 기술을 근간으로 하드웨어와 소프트웨어를 최적화한 ‘엑사데이타 데이터베이스 머신’을 비롯해, 대량의 비정형 데이터 처리를 위해 하둡, R, NoSQL을 오라클의 하드웨어상에서 엔지니어링한 빅 데이터 어플라이언스(Oracle Big Data Appliance)가 핵심이다.

오라클 빅 데이터 어플라이언스는 클라우데라 배포판 하둡(CDH), 오라클 NoSQL DB, 하둡을 위한 오라클 데이터 통합 애플리케이션 어댑터(Oracle Data Integrator Application Adapter for Hadoop), 하둡을 위한 오라클 로더(Oracle Loader for Hadoop), 오픈소스 배포판 ‘R’ 등을 포함하고 있는 엔지어드 시스템이다.

오라클 NoSQL DB는 막대한 양의 데이터를 관리하기 위해 설계된 분산 키-밸류 DB다. 회사 측은 “적은 관리 노력으로도 예측 가능한 성능과 지연을 제공하며, 수 백개의 노드 확장에도 고가용성을 유지하도록 지원한다”고 설명했다.

 또 오라클 빅 데이터 커넥터(Oracle Big Data Connectors)를 통해 하둡 및 오라클 NoSQL DB에 저장된 데이터를 기존의 오라클 DB의 데이터 자원과 결합하고 활용할 수 있다.

이 외에 실시간 분석을 위해 개발된 BI 엔지니어드 시스템, 오라클 엑사리틱스 인메모리 머신(Oracle Exalytics In-Memory Machine)과 정형 및 비정형 데이터의 모델링이 필요 없는 기업용 검색 플랫폼인 오라클 엔데카 인포메이션 디스커버리(Oracle Endeca Information Discovery) 도 발표했다.

오라클은 “빅데이터 시대를 맞아 정형 데이터에는 극대화된 성능과 안정성을 제공하는 동시에 대량의 비정형 데이터에 맞는 분석과 관리 역량을 견고한 토탈 아키텍처에 담아냈다”고 자평했다.
2013/09/26 16:09 2013/09/26 16:09
사용자 삽입 이미지
IBM이 빅데이터 시장을 공략하기 위해 ▲포괄적 플랫폼 ▲ 통합 플랫폼 ▲ 안정적인 플랫폼 ▲오픈소스 기반의 확장 플랫폼을 제공한다는 것을 목표로 하고 있다.


포괄적 플랫폼이란 다양성, 속도, 볼륨과 같은 빅 데이터의 세 가지 차원을 모두 해결할 수 있는 플랫폼을 제공하겠다는 것이며, 통합 플랫폼은 빅데이터플랫폼을 기존의 정보 공급망과 통합해 빅데이터 기술 도입을 간소화 하겠다는 것이다.

안정적인 기업용 플랫폼은 개인이 아닌 기업이 안심하고 사용할 수 있는 성능과 안정성, 보안성 등을 확보한 플랫폼을 제공할 수 있으며, 오픈소스 소프트웨어 등과의 통합을 통해 확장성을 확보할 수 있다는 것이 IBM이 내세우는 자사의 장점이다.

 이를 위해 IBM은 자사의 제품 중 ▲인포스피어 빅인사이트 ▲인포스피어 스트림 ▲분석용 퓨어데이터시스템 등을 핵심 빅데이터 플랫폼으로 내세우고 있다.

IBM 인포스피어 빅인사이트는 방대한 양의 정형 및 비정형 데이터를 관리하고 분석하기 위한 솔루션이다. 오픈 소스 아파치 하둡(Apache Hadoop) 소프트웨어 프레임워크 상에 구축된다. 회사 측은 “인포스피어 빅인사이트는 분석 역량과 더불어, 관리, 워크플로우, 프로비저닝, 보안 기능을 추가해 기업의 요구사항을 감당하도록 이 기술을 강화했다”면서 “고객은 한층 개발자 및 사용자 친화적인 복잡한 대규모 분석을 위한 솔루션을 확보할 수 있다”고 설명했다.

IBM 인포스피어 스트림은 실시간으로 흐르는 센서네트워크 등의 데이터를 분석할 수 있는 솔루션이다. 스트리밍 데이터를 실시간으로 분석하는 역할을 한다. 회사 측은 “밀리초 이하의 빠른 응답 시간으로 대량의 스트리밍 데이터를 지속적으로 분석할 수 있다”면서 “ 광범위한 종류의 정형 및 비정형 데이터를 지원할 수 있는 확정성과 민첩성이 우수한 인프라스트럭처를 제공한다”고 강조했다.

IBM 분석용 퓨어데이터시스템은 기존의 데이터웨어하우징(DW) 솔루션 네티자를 빅데이터에 맞게 확장한 것이다. 회사 측에 따르면, 이를 통해 기업들은 하둡을 몇 분만에 도입할 수 있으며, 대규모의 데이터를 빠르고 비용효율적으로 처리할 수 있다.

IBM은 이같은 제품군과 함께 비즈니스 분석 및 최적화 컨설팅을 제공한다. 2009년 4월 새로운 사업부문으로서 BAO (비즈니스 분석 및 최적화) 컨설팅 서비스를 시작했으며, 2010년 공개한 로드맵에 따라 2015년까지 단계적인 성장을 목표로 사업을 진행해 나가고 있다.

2012년 IDC 글로벌 마켓스케이프(IDC Global MarketScape)의 조사에 따르면, 비즈니스 분석 부문에서 IBM이 업계 1위를 차지 했고, 지난 5년 동안 빅데이터 분야에 140억 달러 이상을 투자해 비즈니스 분석 관련 업체 25개를 인수했다.

회사 측은 “IBM이 보유한 산업별 구축 경험과 기술 리더십이 빅데이터 기반의 혁신을 일구어내는데 도움이 될 것”이라고 말했다.
2013/09/26 16:08 2013/09/26 16:08
사용자 삽입 이미지
전 세계가 빅데이터로 들썩이고 있다. 비정형 데이터, 스트리밍 데이터, 로그 데이터 등 그동안 무수히 생산됐지만 감히 관리하고 분석할 엄두도 내지 못했던 데이터에서 새로운 통찰력을 얻을 수 있다는 기대가 빅데이터가 주는 희망이다.


빅데이터 분석을 위해서는 기본적으로 데이터를 담아 관리할 플랫폼이 필요하다. 정형 데이터만 다룰 때는 관계형데이터베이스관리시스템(RDBMS)가 충분한 역할을 해냈다. 오라클이 세계 최고의 IT기업으로 자리잡을 수 있었던 것은 RDBMS 시장을 장악했기 때문이다.

그러나 기존의 RDBMS는 이제 한계를 맞고 있다. 정형 데이터를 위한 플랫폼으로서는 훌륭한 역할을 했지만, 빅데이터를 상대하기에 RDBMS는 역부족이다.

이 때 등장한 것이 하둡이다. 하둡은 PC 수준의 저렴한 하드웨어를 통해 빅데이터를 관리할 수 있는 대안을 제시했다. 빅데이터 시대가 열린 것은 하둡이 등장했기  때문이라고 봐도 만무하다.

그러나 하둡은 어렵다. 기존의 IT 기술자들은 하둡이라는 낯선 환경에 적응하는데 어려움을 겪고 있다.

또 하둡은 아직 비즈니스 분석으로 활용하기에 아직 부족한 면이 있다. 오픈소스 기반이기 때문에 기업들이 필요로 하는 기능과 서비스를 맞춤형으로 제공하지 못한다.

이 때문에 IT 벤더들의 역할이 필요하다. 이들은 현재 고객 기업들의 요구가 무엇인지 경험적으로 알고 있다. 하둡을 활용하되 하둡이 제공하지 못하는 것을 이들이 채워나가고 있다.
이를 위해 IT업체들은 하둡을 바탕으로 새로운 빅데이터 플랫폼을 만들고 있다.

이에 이번 딜라이트 창간 기획의 일환으로 빅데이터 시대에 발맞춰 나가고 있는 대표적인 빅데이터 플랫폼을 소개한다. 전통의 글로벌 IT 업체 3개(IBM, 오라클, 테라데이타), 국내 업체(KT넥스알, 그루터, 모비즌) 3개와 특수한 방식으로 빅데이터 시장을 개척하고 있는 스플렁크가 대상이다.
2013/09/26 16:05 2013/09/26 16:05