사용자 삽입 이미지
최근 오라클과 세일즈포스닷컴이 전략적 제휴를 맺었다는 소식이 해외 IT업계의 호사가들 사이에서 이야깃거리가 되고 있습니다.
 
견원지간이라고 표현될 정도로 그동안 사이가 매우 좋지 않은 것으로 유명했던 두 회사가  갑자기 웃으며 손을 잡으니 관심이 가지 않을 수 없습니다.
 
시간을 거슬러 지난 2011년 미국 샌프란시스코에서 열린 ‘오라클 오픈월드 2011’에서 마크 베니오프 세일즈포스닷컴 회장은 얼굴을 붉혀야 했습니다.
 
주최 측인 오라클이 자신의 강연일정을 일방적으로 취소해 버렸기 때문입니다. 앞서 오라클 래리 엘리슨 회장과 베니오프 회장이 공개적으로 상대를 비난하며 설전을 벌이는 등 두 회사의 감정의 골은 깊었습니다.
 
당시 베니오프 회장은 “쇼는 계속돼야 한다”면서 오라클이 마련한 행사장이 아닌 주변의 다른 레스토랑에서 행사를 강행했습니다.
 
일반적으로 비즈니스 세계에서는 경쟁사에 대한 이야기는 하지 않는 것이 관례인데, 두 회사는노골적인 비난전을 펼쳤습니다.
 
엘리슨 회장은 세일즈포스닷컴의 클라우드 서비스에 대해 “(보안 면에서) 미친 짓”이라며 비난했고, 이에 대해 세일즈포스닷컴은 오라클의 클라우드에 대해 “가짜”라고 맞서왔습니다.
 
그런데 이 두 회사가 손을 잡았습니다. 그것도 아주 꽉! 잡았습니다.
 
지난 6월 25일, 양사는 9년에 걸쳐 두 회사의 클라우드를 통합하겠다고 발표했습니다. 오라클이 최근 선보인 퍼블릭 클라우드인 ‘오라클 클라우드’와 세일즈포스닷컴을 통합한다는 것입니다.
 
세일즈포스닷컴은 오라클 리눅스 운영체제, 오라클 DB, 오라클 미들웨어 위에서 자사 서비스를표준화할 예정입니다. 오라클은 자신의 ‘퓨전 HCM(인적자본관리)’과 ‘파이낸셜 클라우드’를 세일즈포스닷컴에 통합하게 됩니다.
 
놀라운 일입니다. 비즈니스 세계에서 이례적인 앙숙이었던 두 회사의 행보라고 보기엔 믿기 어려울 정도입니다.
 
사실 오라클과 세일즈포스닷컴은 이미 적지 않은 관계를 맺어왔습니다. 마크 베니오프 회장이오라클 출신이라는 점에서 그렇습니다. 그러다보니 세일즈포스닷컴의 기술 플랫폼은 이미 오라클을 중심으로 구성돼 있습니다.
 
베니오프 회장은 “14 년 전에 처음 세일즈포스닷컴을 디자인 할 때, 우리는 트랜잭션 기능과 신뢰성, 보안, 가용성을 보장하는 DB를 구축할 필요가 있었다”면서 “우리가 어려운 문제에 직면했을 때 오라클이 큰 도움이 됐다”고 말했습니다.
 
래리 엘리슨 회장은 자신의 직원이었던 마크 베니오프가 창업에 나설 때 일부 출자를 했고, 이사회에 들어가기도 했습니다. 오히려 이같은 관계의 두 회장이 그토록 노골적인 어조로 비난전을펼쳤다는 것이 이상한 일입니다.
 
엘리슨 회장은 “응용 프로그램 계층의 사전 통합, 지속적인 개선, 보안 및 성능,  인프라의 효율화는 고객-공급업체 관계가 아닌 파트너로서 함께 할 때 가능하다”면서 파트너십을 강조했습니다.
 
베니오프 회장은 “새로운 시대가 열리고 있다”면서 “세일즈포스닷컴과 오라클이 손잡은 것은 새로운 세계에서 어떻게 살아가야 하는지 보여준다”고 말했습니다.
 
흔히 비즈니스 세계에는 영원한 적도, 영원한 동지도 없다고 합니다. 이 말이 흔한 수사가 아님을 다시 한 번 보여주는 사례라고 볼 수 있습니다.
2013/07/02 10:36 2013/07/02 10:36

사용자 삽입 이미지
최근 하둡을 이용하는 기업들을 상대로 잇달아 소송을 제기하는 특허괴물이 있습니다. 미국 델라웨어에 거점을  ‘패러럴 아이언이라는 회사인데, 페이스북, 리크드인, 아마존, 오라클  다양한 회사들이이 회사로부터 소송을 당했습니다.


패러럴 아이언은 자신들이 하둡분산파일시스템(HDFS, 이하 하둡) 관련된 특허를 보유하고 있다고주장하고 있습니다. 이들이 주장하는 특허는 ‘스토리지 시스템을 위한 방법과 시스템(Methods and Systems for a Storage System)’이라는 제목으로, 지난 2007 3 미국에서 정식 특허로 등록됐습니다.


일반적으로 하둡은 오픈소스소프트웨어이기 때문에 기업들은 마음껏 쓸 수 있을 것으로 생각하고 있습니다. 그러나 패러럴 아이언은 아파치 오픈소스 버전에 자신의 특허가 포함돼 있다고 주장하는 것입니다.


실제로 아파치 하둡 안에 이 회사의 특허가 포함돼 있다면, 이를 이용하는 기업들도 이를 무시할 수만은 없습니다. 자칫하면 특허괴물의 마수에 걸려들어 소송에 휘말릴지도 모릅니다.


어쩌면 이는 글로벌 IT 시장에서 빅데이터가 확산되는   위협요인이  지도 모르겠습니다.


그러나 흥미로운 점은 우리나라에서는 이런 위험을 무릅쓰지 않고도 하둡을 마음대로 써도 된다는 것입니다.  패러럴 아이언의 특허가 국내에는 등록돼 있지 않기 때문입니다. 패러럴 아이언의 주장대로미국에서 법정에서 특허를 인정받는다고 해도 국내에는 영향을 미치지 못합니다.


관련 특허는 ‘ 테크노로지 엔터프라이즈, 엘엘씨라는 회사를 통해 국내에서도 2005년과 2010년 두 번이나 출원한  있습니다.  테크노로지 엔터프라이즈라는 회사의 특허를 특허 괴물인 패러럴 아이언이 인수한 것으로 예측됩니다. 그러나 특허를 획득하지는 못했습니다. 모두 거절 당했기 때문입니다.

 

특허청에 따르면, 이 특허가 국내에서 두 번이나 거절된 것은 형식에 미비점이 있었기 때문입니다. 2005년 첫 출원 때는 하나의 특허 출원에 두 개의 기술이 포함돼 있었기 때문에 거절됐습니다. 그래서 링 테크노로지는 이후 2010년에 두 개로 나눠 특허를 출원했습니다.하지만 서류 미비(의견서)로 또다시 거절되고 말았습니다.


결과적으로 링 테크노로지 측의 실수로 한국의 빅데이터 시장은 특허괴물로부터의 ‘자유지대’가 됐습니다. 국내 업체들로서는 행운이 아닐 수 없습니다.

2013/05/10 14:09 2013/05/10 14:09
사용자 삽입 이미지

최근 클라우드 플랫폼이 각광을 받고 있습니다. 클라우드 플랫폼이란 기업들이 클라우드 환경을 구축할 때 좀더 쉽게 개발할 수 있도록 필요한 구성요소를 제공하는 소프트웨어입니다. 클라우드 플랫폼은 프로비저닝 자동화 및 자동스케일링을 비롯한 가상 서버 관리, 스토리지 관리, 네트워크 관리, 보안관리 등의 기능을 제공합니다.

기업들이 내부적으로 사용할 프라이빗 클라우드를 구축할 때나, 아마존웹서비스(AWS)나 구글컴퓨팅엔진(GCE) 등과 같은 서비스를 만들고 싶은 회사들은 클라우드 플랫폼 활용합니다. 클라우드 플랫폼을 기반으로 클라우드 서비스를 개발하면, 처음부터 끝까지 개발하는 것보다 훨씬 효율적입니다.

현재 인기를 끌고 있는 클라우드 플랫폼은 대부분 오픈소스를 기반으로 하고 있습니다. 오픈스택, 클라우드스택, 유칼립투스 등이 그 주인공입니다.

오픈스택은 가장 유명한 클라우드 플랫폼입니다. 미국의 클라우드 서비스 업체 랙스페이스와 NASA가 공동으로 시작한 오픈스택 프로젝트에는 레드햇, 델, HP, IBM, 시스코, 인텔 등 유명 글로벌 기업들이 참여하고 있습니다. 최근에는 상용 소프트웨어 업체인 VM웨어도 오픈스택에 참여한다고 밝힌 바 있습니다. 이처럼 다양한 벤더들이 참여한다는 것은 특정 벤더에 의존하지 않아도 된다는 것을 의미합니다. 오픈스택을 지지하는 개발자나 기업들은 오픈스택의 이런 점에 환호합니다.

오픈스택은 HP와 AT&T 등이 채용해 클라우드 서비스를 구축했습니다. 국내에서는 삼성SDS가 오픈스택을 기반으로 S클라우드를 개발하고 있습니다. 레드햇과 시스코는 자체적인 오픈스택 배포판을 만들기도 했습니다.

그러나 오픈스택에 비판적인 시각도 있습니다. 가트너는 최근 오픈스택을 비평하는 보고서를 통해 “오픈스택은 자기 잇속만 챙기려는 IT기업들로 인해 복잡해진 초보적인 클라우드 관리 플랫폼 기술”이라고 비판했습니다.

한때 오픈스택의 멤버였다가 탈퇴한 시트릭스는 오픈스택에 대해 “기술적으로 미숙해 IaaS(Infrastructure as a Service)를 구현하려는 기업들의 요구에 부응할 수 없다”고 비난했습니다.

실제로 오픈스택에 대한 관심은 뜨겁지만, 막상 오픈스택을 활용해 성공적으로 클라우드 서비스를 만들어 제공하는 회사는 아직 생각보다 많지 않습니다.

반면 유칼립투스는 국내에서는 많이 알려져 있지 않지만 세계적으로 인기를 끌고 있는 클라우드 플랫폼입니다. 유칼립투스는 캘리포니아 대학 산타 바바라의 연구 프로젝트로 탄생했습니다. 현재는 미국의 유칼립투스 시스템스라는 회사에 의해 관리되고 있습니다.

유칼립투스가 내세우는 가장 큰 장점은 아마존과의 호환성입니다. 유칼립투스는 당초부터 아마존웹서비스와 비슷한 환경을 대학 내에 만드는 것을 목적으로 진행된 프로젝트입니다. 과금 및 모니터링을 제외하고는 아마존과 호환되는 API(Application Programming Interface)를 제공합니다. 아마존의 EC2에 올린 가상서버 이미지를 유칼립투스로 가져올 수 있으며, 반대의 경우도 가능합니다.

이런 호환성으로 인해 기업들이 자체적인 프라이빗 클라우드 컴퓨팅 환경을 구현해 놓고, 아마존과 연동해 확장성과 유연성을 확보하는 전략을 취하기 쉽게 합니다.

그러나 아마존과 호환되는 클라우드가 유칼립투스만은 아닙니다. 클라우드스택 역시 아마존과의 호환성을 강점으로 내세우고 있습니다.

클라우드스택은 썬마이크로시스템즈 출신의 개발자들이 설립한 VMOps에 의해 개발된 클라우드 플랫폼입니다. 2010년 5월 클라우스스택 커뮤니티 버전을 오픈소스로 공개했습니다. 이후 VMOps는 회사명을 클라우드닷컴으로 변경했고, 클라우드닷컴은 2011년 7월 미국의 시트릭스시스템스에 의해 인수됩니다.

시트릭스는 상용버전과 커뮤니티버전을 통합해 하나의 오픈소스로 만들었고, 이를 올해 4월 아파치재단에 기증합니다. 클라우드스택을 아파치재단에 기증하기 전까지 시트릭스는 오픈스택의 중요한 후원자였지만, 클라우드스택에 올인하면서 오픈스택과의 인연을 끊습니다.

클라우드스택은 안정적이며 활용하기 쉬운 웹 인터페이스를 제공한다는 평을 받고 있습니다. 때문에 상용 서비스에 활용되는 사례가 많습니다.

가장 유명한 사례는 게임업체인 징가입니다. 징가는 원래 아마존웹서비스에서 모든 서비스를 제공했는데, 자체 데이터센터에 클라우드 환경을 구현하면서 클라우드스택을 활용합니다. 아마존과 클라우드스택이 호환되기 때문에 가능한 것입니다. KT의 유클라우드도 전세계적으로 알려진 클라우드스택의 사례입니다. 삼성전자도 모바일메신저 챗온의 일부(중국 데이터센터)를 클라우드스택으로 제공하고 있습니다.

이외에도 여러 클라우드 플랫폼이 있지만, 아직은 이 세 플랫폼이 가장 두각을 나타나는 듯 보입니다. 하지만 이 시장은 완전히 초기시장입니다. 최근 서버 가상화 시장의 최장자 VM웨어도 다이나믹옵스를 인수한 후 이 시장에 뛰어들었고, 레드햇도 클라우드폼즈라는 플랫폼을 준비하고 있습니다.

이제 막 출발선을 넘어선 클라우드 플랫폼 시장에서 앞으로 누가 주도권을 쥐게 될 지 주목됩니다. 클라우드 플랫폼 전쟁의 승자가 클라우드 시장의 승자가 될 가능성이 높습니다.
2012/11/07 15:37 2012/11/07 15:37
사용자 삽입 이미지
지난 17일부터 3일간 스페인 바르셀로나에서는 시트릭스시스템스(이하 시트릭스)의 고객 컨퍼런스 ‘시트릭스 시너지 2012 바르셀로나’ 행사가 열렸습니다. 시트릭스는 1년에 두 번 미국과 유럽에서 시너지 행사를 개최하고, 새로운 제품과 전략을 소개합니다.

이번 행사에서 가장 관심을 끄는 소식은 시트릭스와 시스코가 전방위적인 협력을 펼치는 제휴를 맺었다는 점입니다. 오랫동안 두 회사는 그렇게 가깝지 않은 관계였기 때문에 눈길을 끄는 뉴스입니다. 지금까지 시스코는 시트릭스의 경쟁사인 VM웨어와 가깝게 지냈습니다. 클라우드 컴퓨팅 시장 공략을 위해 VM웨어-CISCO(시스코)-EMC가 함께 VCE 연합을 결성할 정도였습니다.

그러나 이제는 달라졌습니다. 시트릭스와 시스코는 지난 해 데스크톱 가상화 분야에서 제휴를 맺기 시작하더니 이제는 전면적인 협력관계에 들어섰다고 볼 수 있습니다.

이번 제휴로 달라지는 첫번째 사실은 시스코가 앞으로 시트릭스의 웹가속 솔루션 ‘넷스케일러’를 판매한다는 것입니다. 시스코는 부하 분산 솔루션으로 이미 넷스케일러의 경쟁제품인 ‘시스코 ACE(Application Control Engine)’보유하고 있었습니다. 그러나 앞으로는 자사 제품 대신 시트릭스 제품을 시스코가 판매하게 됩니다. 최근 시스코가 ACE 부하 분산 시장에서 발을 뺀다는 소문이 있었는데, 현실이 된 것입니다. 시스코는 다만 지금까지 판매된 ACE 솔루션에 대한 지원은 계속 한다고 밝혔습니다.

특히 시스코는 넷스케일러 판매를 넘어 넷스케일러 소프트웨어를 시스코의 스위치 제품의 모듈로 통합할 계획인 것으로 전해지고 있습니다.

넷스케일러를 둘러싼 제휴뿐 아니라 가상화 및 클라우드 컴퓨팅 영역에서도 두 회사는 밀접한 관계를 맺었습니다. 양사는 기업들이 클라우드 컴퓨팅 환경을 쉽게 구축할 수 있도록 통합 솔루션을 제공키로 했습니다. 이는 시트릭스의 클라우드플랫폼(클라우드스택) 기반으로 시스코의 UCS 서버, 넥서스 시리즈 스위치, 오픈 네트워크 환경(ONE) 컴포넌트를 모두 포함한 솔루션이 될 것이라고 양사는 설명했습니다.

이 외에 모바일 오피스 구현을 위해서도 각자의 솔루션을 통합키로 했습니다.

이 같은 전방위적 제휴를 보면서 가장 궁금해지는 것은 VCE 연합의 운명입니다. 시스코는 지금까지 EMC와 그 자회사인 VM웨어와 친한 친구로 지내왔는데, 오랜 친구의 최대 경쟁자인 시트릭스와 친분을 넘어 혈맹관계를 맺겠다는 것이기 때문입니다.

일각에서는 이런 움직임의 배경으로 VM웨어의 니시라 인수가 아닐까 하는 추측을 내 놓고 있습니다. 니시라는 네트워크 가상화 및 소프트웨어정의네트워크(SDN) 업체로, VM웨어는 최근 니시라 인수를 통해 데이터센터 가상화 전략을 세웠습니다.

시스코는 지금까지 ONE(Open Network Enviornment) 전략을 통해 네트워크 가상화 분야를 공략해 왔는데, VM웨어가 니시라를 인수함에 따라 이 분야에서 경쟁자가 된 것입니다.

이 같은 추측에 대해 시스코는 부인하고 있습니다. 시스코의 최고 기술책임자 및 전략책임자인 패드마스리 워리어는 “시트릭스와의 제휴가 VM웨어와의 관계 악화를 의미하는 것은 아니다”면서 “시스코는 고객이 필요로 하는 모든 플랫폼을 지원하기 위한 노력을 하는 것”이라고 말했다.

물론 아직 시스코와 시트릭스의 제휴가 VM웨어와의 관계 악화를 의미하는 것인지 단정할 수는 없습니다.

하지만 IT시장에서 하나의 인수합병이 오랜 친구를 적으로 만드는 사례를 찾는 것은 어렵지 않습니다. 오라클이 썬마이크로시스템을 인수한 이후 HP와 철천의 원수가 된 것처럼 말입니다.
2012/10/19 14:26 2012/10/19 14:26

사용자 삽입 이미지
글로벌 공룡 IT 기업 오라클의 화려한 변신이 화제입니다. 오라클은 지난 주 미국 샌프란시스코에서 연례 고객 컨퍼런스인 ‘오라클 오픈월드 2012’를 개최했습니다. 외신을 통해 전해진 행사 소식을 살펴보면 온통 클라우드 컴퓨팅에 대한 이야기뿐입니다.



행사 시작 직전 래리 앨리슨 오라클 회장이 CNBC와의 인터뷰에서 “앞으로 대형 인수보다는 클라우드 컴퓨팅을 통한 내부 성장에 주력하겠다”고 밝힌데 이어 클라우드 컴퓨팅 관련 신제품 및 서비스가 쏟아졌습니다.


이는 일종의 자기배반입니다.  래리 앨리슨 회장은 그 동안클라우드 컴퓨팅에 대해 “하나도 새로울 것이 없는 마케팅 용어인 헛소리”라거나 “클라우드 컴퓨팅은 이미 다 있는 것을 다시 한 군데 몰아넣고 재정의한 것에 불과하다”는 말을 자주했습니다.


그러나 오라클과 래리 앨리슨 회장은 확실히 변했습니다. 클라우드 컴퓨팅은 이제 오라클의 전략의 핵심이 됐습니다.


대표적으로 오라클은 이번 행사에서 인프라 서비스(IaaS, Infrastructure as a Service)를 새롭게 출시했습니다. 아마존 EC2나 KT 유클라우드와 같은 사업을 오라클이 한다는 것입니다. 오라클은 이미 소프트웨어 서비스(SaaS, Software as as Service)와 플랫폼 서비스(PaaS, Platform as a Service)를 진행중입니다. 클라우드 컴퓨팅의 세 가지 형태인 SaaS, PaaS, IaaS를 모두 제공하는 것입니다. 이런 회사는 구글밖에 없습니다.


또 오라클은‘오라클 프라이빗 클라우드’라는 것도 추가했습니다. 고객은 자사의 데이터 센터에 오라클 인프라를 설치하고, 프라이빗 클라우드 기반으로 활용하라는 것입니다. 고객에게 대여하는 장비는 오라클이 소유하고, 운영 관리, 업그레이드도 오라클이 합니다. 오라클 클라우드를 방화벽 내에서 이용하라는 접근법입니다.


오라클의 핵심 제품인 ‘DB’도 클라우드 환경에 맞게 재설계 됐습니다. 이번 행사에서 소개된 오라클 DB 12c는 ‘컨텐이너’라는 새로운 개념을 도입했습니다. 기업들은 컨테이너 DB를 구축하고, 거기에 플러그 DB를 플러그인하는 형태로 이용할 수 있습니다. 한 컨테이너 속의 플러그인 된 DB들은 컨테이너의 자원을 공유하지만, 논리적으로 분리돼 있습니다.


래리 앨리슨 회장은 이에 대해 “세계 최초의 멀티 테넌트를 지원하는 데이터베이스”라고 말했습니다. 한 때 래리 앨리슨 회장은 “멀티 태넌시는 끔찍한 기술”이라고 비난한 바 있을 정도도 이에 대해 비판적이었습니다. 여러 기업이 DB를 공유하는 것은 재앙이라는 주장입니다.


그랬던 래리 앨리슨 회장이 이제는 스스로 멀티-태넌시를 가능케하는 기술을 제공하겠다고 나섯습니다. 스스로 끔찍한 기술이라던 멀티-태넌시를 더 잘 구현하기 위해 오라클 DB 아키텍처를 바꾼 것입니다.


오라클과 래리 앨리슨의 이같은 변신은 놀랍습니다. 그러나 클라우드 컴퓨팅을 외면한채 IT산업에서 살아남기 어려운 것도 사실입니다.


그래서 오라클의 변신은 무죄!
2012/10/10 10:50 2012/10/10 10:50
사용자 삽입 이미지

- [딜라이트닷넷 창간3주년 특별기획/ 빅데이터③]

가트너는 2015년까지 포춘 500대 기업 대부분이 빅데이터 분석에 도전하겠지만 이중 85%는 실패할 것이라고 예측한 바 있습니다. 주목해야 할 점은 85%의 실패보다는 15%의 성공입니다. 빅데이터 분석에 성공하는 기업의 비결은 무엇일까요?

전문가들은 성공적인 빅데이터 분석을 위해서는 기술, 사람, 비즈니스 인사이트가 필수적이라고 지적합니다.

◆ 빅데이터 성공요소 ‘기술’ = 빅데이터가 주목을 받는 이유는 과거 기술로는 처리할 수 없었던 데이터들을 처리하고, 분석할 수 있는 새로운 기술들이 등장했기 때문입니다.

하 둡/맵리듀스가 가장 대표적인 빅데이터 기술이라고 볼 수 있습니다. 하둡은 대용량 데이터 처리를 위해 대규모 분산처리를 지원하는 프레임워크입니다. 맵리듀스는 대량의 데이터를 다수의 서버에 나눠 집계•가공하는 맵(Map) 과정과 처리 결과를 하나의 표에 정리해 출력하는 리듀스(Reduce)라는 과정을 반복하면서 비구조적 데이터를 처리해 나갑니다.

하둡/맵리듀스는 관계형 데이터베이스로는 엄두도 내지 못했던 데이터들을 분석의 대상으로 삼을 수 있게 한다는 점이 가장 큰 장점입니다.

최 근에는 CEP(복합 이벤트 처리)나 스트리밍 분석도 빅데이터 분석의 방법론으로 떠오르고 있습니다. 과거 비즈니스인텔리전스 기술은 일정 기간 저장된 데이터를 모델링 하고, 분석해 결과를 얻었습니다. 하지만 현대 기업들은 그렇게 한가하지 않습니다. 이 때문에 실시간 분석의 가치가 높아졌습니다. CEP는 실시간으로 발생하는 많은 이벤트 중에서 의미가 있는 것을 추출해 분석하는 기술입니다. 센서네트워크 등으로 통해 실시간으로 쏟아지는 무수한 데이터 등에서 필요한 데이터를 선별해 분석할 수 있습니다.

인 메모리 분석 기술도 빅데이터 시대를 맞아 인기를 끌고 있습니다. 이 역시 빠른 분석을 위한 것입니다. SAP는 HANA라는 인메모리 기반의 DB를 선보이기도 했고, SAS, 테라데이타 등도 인메모리 기술을 적극적으로 활용하고 있습니다.

◆ 빅데이터 성공요소 ‘사람’ = 빅데이터 시대에 가장 각광을 맞는 직업은 ‘데이터 사이언티스트’입니다. 백사장에서 바늘을 찾듯 엄청나게 쏟아지는 데이터 속에서 유의미한 무엇을 발견해 낼 수 있는 사람이 필요해진 것입니다.

하지만 이는 아무나 할 수 있는 일이 아닙니다. 기존에는 데이터를 다루는 직종으로 데이터 모델러, 데이터 아키텍트 등이 있었습니다. 이들은 전통적인 IT맨들이었습니다.

반면 데이터 사이언티스트들은 구조화되지 않은 데이터 속에서 지금까지 드러나지 않았던 숨겨진 패턴을 찾아내는 역할을 합니다.

가 트너는 데이터 사이언티스트가 컴퓨터 공학과 수학적 기반의 의미를 부여하고, 디지털 시스템에 지식을 결합하는 전문가로, 데이터의 저장ㆍ이동ㆍ통합, 분산처리를 활용해 정보를 요청하는 고객에게 최선의 기대 서비스를 제공한다고 설명합니다.  

이제는 IT뿐 아니라 통계학, 수학, 경제학 지식을 겸비한 전문가가 필요한 것입니다. 이런 데이터 사이언티스트를 확보하는 것은 매우 어려운 일입니다. 빅데이터 분석에 성공하는 기업들이 적은 가장 큰 이유도 데이터 사이언티스트를 확보하는 것이 어렵다는 점입니다.

◆ 빅데이터 성공요소 ‘비즈니스 인사이트’ = 빅데이터 기술과 데이터 사이언티스트가 있다고 빅데이터 분석이 성공할 수 있는 것은 아닙니다.

데 이터 사이언티스트들이 빅데이터 기술을 활용해 이끌어 낸 결과에 따라 어느 정도 비즈니스 방향은 예측할 수 있지만, 이 결과를 기업의 환경과 상황에 맞게 어떻게 활용할 것인지를 결정하지 못하면 기술과 사람은 쓸모 없게 됩니다. 이 때문에 빅데이터 분석에 비즈니스 통찰력은 필수적입니다.

SAS코리아 이재권 상무는 빅데이터 분석에 대해 “기술은 후순위, 비즈니스가 우선순위”라고 말합니다.

빅데이터 분석은 비즈니스를 예측하고, 최적화 하기 위한 활동입니다. 이를 위해서는 빅데이터 기술, 데이터사이언티스트, 비즈니스 통찰력 삼박자가 맞아야 합니다.

2012/10/09 14:33 2012/10/09 14:33

사용자 삽입 이미지
- [딜라이트닷넷 창간 3주년 특별기획/ 빅데이터]

최근 빅데이터 분석이 경영 전문가들에게 많은 관심을 받고 있습니다. 빅데이터가 치열한 경쟁 속에서 있는 기업 경영의 나침반이 될 것이라는 기대 때문입니다.


물론 기업이 IT 기술을 전략 수립에 활용하려는 시도는 어제오늘 일이 아닙니다. 기존에도 경영자정보시스템(EIS), 비즈니스인텔리전스 등의 이름으로 유사한 접근이 있었습니다.

그러나 이런 접근들이 적지 않은 성과를 내기도 한 반면, 데이터의 왜곡으로 인한 한계점을 노출하기도 했습니다.

그렇다면 빅데이터는 기존의 BI와 무엇이 다른 걸까요? 전문가들은 빅데이터 분석과 기존BI의 다른 점으로 ▲데이터 처리량 ▲데이터 유형 ▲데이터 (분석)속도▲데이터 분석 범위 등을 꼽습니다.

◆ 수백테라바이트를 넘어 페타바이트까지 = 우선 빅데이터 분석은 이름에서 알 수 있듯 대규모 데이터를 분석하는 역할을 합니다. 지금까지 기업들은 사내 정보를 데이터웨어하우스(DW)라는 창고에 쌓아두고 이를 분석해 통찰력을 얻고자 했습니다. 국내의 경우 대용량 DW라고 해도 100테라바이트를 조금 넘는 수준이었습니다.

그러나 빅데이터 분석은 DW에 쌓인 데이터만을 대상을 하지 않습니다. 이미 스마트폰과 소셜네트워킹, 센서네트워크 등을 통해 어마어마한 용량의 데이터가 수집되고 있습니다. 스마트폰은 전국민이 활용하는 시대를 눈앞에 두고 있고, 소셜네트워크는 모바일과 만나 갈수록 활용도가 높아지고 있습니다. 센서 가격도 떨어지면서 각종 전자제품에 센서들이 내장되고 있습니다. 예를 들어 로봇청소기에만 18개의 센서가 탑재돼 있다고 합니다.

IDC는 2011 년에 인류가 생성한 데이터가 1.8 제타바이트에 달한다고 합니다. 기업들이 분석할 데이터가 이제는 테라바이트 수준을 넘어 페타바이트까지 이르고 있습니다.

◆ 비정형, 비구조적 데이터는 기본  = IDC의 조사에 따르면 2009년부터 2014년까지 연평균 정형 데이터의 증가율은 24%에 불과한 반면 비정형 데이터의 증가율은 55%라고 합니다. 앞에서 언급한 센서네트워크 데이터, 소셜 데이터 등은 비정형 데이터를 기하급수적으로 늘리고 있습니다.

페이스북에서는 매월 300억개의 콘텐츠가 공유되고 있고, 트위터에서는 약 2억 건의 트윗이 발생하고 있다고 합니다. 이러한 소셜 미디어에서 생성되는 데이터는 주로 텍스트, 동영상, 오디오, 이미지 등의 비정형 데이터입니다.

최근에 소셜 분석이 국내외에서 인기를 끄는 것도 이 같은 이유 때문입니다. 트위터 등 소셜 미디어에서 쏟아지는 정보를 분석해 고객만족도 및 VoC(고객의 목소리)를 체크하겠다는 것입니다.

◆ 실시간 데이터 생성 시대…분석도 실시간으로 = 앞에서 언급한 것처럼 데이터의 양이 기하급수적으로 늘고 있다는 점은 데이터 분석 속도도 높여야 한다는 숙제도 안겨주고 있습니다.

과거의 분석 속도는 쌓이는 데이터를 감당하기도 힘들기 때문입니다. 빅데이터 시대는 실시간 데이터 분석이 필수적인 요소로 떠오르고 있습니다.

최 근 SAP HANA와 같은 인메모리 기반의 분석 플랫폼이 등장하고, 데이터를 저장하지 않고 흐르는 상태에서 분석하는 스트리밍 데이터 분석이나 복합 이벤트 처리 (Complex Event Processing : CEP) 등이 각광을 받는 것도 실시간 분석에 대한 요구의 반영입니다.

◆ 어제 데이터 분석을 넘어 내일 예측까지 = 기존에는 오늘 획득한 데이터를 업무가 끝난 밤 시간에 DW에 배치(Batch)하고, 그 정보를 분석했습니다. 이는 지금 분석하고 있는 정보가 지금 이순간이 아닌 어제의 정보를 분석하고 있다는 것을 의미합니다.

그 러나 빅데이터 분석 시대에는 지금까지 벌어진 일을 분석하는 것을 넘어 내일을 예측하는 것이 필요합니다. 예를 들어 지금까지 내비게이션은 목적지에 도달하는 길을 알려주는 역할에 충실했습니다. 조금 더 진보한 내비게이션은 교통량이 많은 길을 우회해 상대적으로 막히지 않는 길을 안내했습니다. 하지만 앞으로 막힐 곳까지 알려주는 내비게이션은 없었습니다.

빅데이터 시대에는 과거의 데이터와 현재의 데이터를 조합해 미래의 상황까지 예측해야 합니다.

2012/10/09 14:32 2012/10/09 14:32
사용자 삽입 이미지

- [딜라이트닷넷 창간3주년 특별기획/빅데이터]

IT는 정보기술(Information Technology)의 약자입니다. 정보를 다루는 기술이라는 의미입니다. 여기서 말하는 정보는 데이터에서 얻어집니다. 데이터를 수집∙가공해 의미있는 정보를 얻고, 이 정보를 분석해 지식을 얻어내는 것이 IT의 목적이라고 볼 수 있습니다. 정보와 지식으로 승화되지 않는 데이터는 저장소만 차지하는 낭비요소일 뿐입니다.

이는 빅데이터도 마찬가지입니다. 빅데이터에서 정보를 찾고, 그 안에서 지식을 얻는 것이 목적입니다.

가 트너는 빅데이터를 “고급 통찰력 및 의사 결정을 위해 비용 효과가 높은 혁신적인 정보 처리 과정을 필요로 하면서, 대량(Volume)이며 급격하게 늘어나고(Velocity), 다양한(Variety) 정보 자산”이라고 정의하고 있습니다.

가트너가 정의한 빅데이터의 조건은 “고급 통찰력 및 의사결정을 위해 사용되는 것”입니다. 단지 데이터의 양이 거대하고, 발생하는 속도가 빠르며, 종류가 다양하다는 것만으로는 빅데이터는 아니라는 이야기입니다.

예 를 들어 대부분의 기업들은 고객 콜센터의 전화통화 내용을 녹음하고 있습니다. 이는 10년 전이나 지금이나 마찬가지입니다. 하지만 과거에는 녹음의 목적이 문제가 발생하거나 분쟁이 일어났을 때 통화내용을 다시 확인하기 위한 용도에 불과했습니다. 이는 빅데이터 활용이 아닙니다. 콜센터 음성데이터가 쌓이면 테라데이터를 넘어 페타바이트에 이르는 거대한 분량이지만 우리는 이를 빅데이터라고 부르지 않았습니다.

반면 최근에는 음성인식 및 텍스트 마이닝, 하둡&맵리듀스 등의 기술을 이용해 이 음성데이터를 분석하려는 움직임이 일고 있습니다. 콜센터는 고객들의 불만과 요구사항이 가장 직접적으로 전달되는 창구입니다. 이 음성데이터를 분석해 고객들의 성별, 지역별, 연령별 문제점 및 요구사항을 찾아낸다면 고객만족도 및 충성도를 한층 높일 수 있을 것입니다. 이를 통해 용량만 차지하던 골치아픈 데이터였던 콜센터 음성데이터가 빅데이터로 거듭나게 되는 것입니다.

이처럼 같은 대량의 데이터라고 하더라도 분석을 통해 정보와 지식을 찾아내느냐에 따라 빅데이터와 단순한 데이터의 차이를 가져옵니다.

가 트너는 2015년까지 포춘 500대 기업 대부분이 빅데이터 활용에 나서지만, 이중 85%만이 성공을 거둘 것이라고 전망했습니다. 빅데이터 활용은 말처럼 쉽지 않다는 점을 보여줍니다. 빅데이터 활용을 위해서는 하둡이나 NoSQL과 같은 데이터 관리에 대한 기술적 접근 이외에도 제대로 된 분석 전략을 세우는 것이 필수적입니다.

2012/10/09 14:31 2012/10/09 14:31

사용자 삽입 이미지

VM웨어가 최대 경쟁자로 손꼽혔던 오픈스택 진영에 구애의 손길을 뻗었습니다. 26일(현지시각) 미국의 IT미디어 기가옴 단독 보도에 따르면, VM웨어는 인텔, NEC 등과 함께 오픈스택 재단의 골드멤버로 참여하기를 요청을 한 것으로 전해졌습니다. 오픈스택 재단 이사회는 28일(미국 시각) 열리는 이사회를 통해 이를 받아들일지 여부를 결정하게 됩니다.

오픈스택은 클라우드 인프라스트럭처 구축을 위한 오픈소스 소프트웨어입니다. NASA와 랙스페이스가 주도해 시작했지만, 현재 IBM, 델 등 다수의 글로벌 IT업체들이 오픈스택을 지원하고 있습니다.

그러나 VM웨어가 오픈스택 지원 대열에 설 것이라고 예상하는 이는 많지 않았습니다. VM웨어는 클라우드 컴퓨팅 시장에서 고가의 상용 소프트웨어를 상징하는 회사였고, 오픈스택의 경쟁 소프트웨어라고 볼 수 있는 V클라우드를 보유하고 있습니다.

지금까지 VM웨어는 오픈스택에 대해 좋은 평가를 내리지도 않았습니다. 지난 4월 VM웨어의 매튜 로지 부사장이 오픈스택을 두고 클라우드스택(시트릭스), 유칼립투스 등과 함께 ‘못생긴 세 누이들(three ugly sisters)’이라고 비난한 바 있을 정돕니다.

이 때문에 VM웨어가 왜 이 같은 행보를 보이는지 그 배경에 관심이 쏠리고 있습니다.

처음 이 소식을 알린 기가옴의 바브 대로우 기자는 VM웨어가 지난 달 인수한 ‘니시라’ 때문일 것으로 분석했습니다. 소프트웨어정의네트워킹(SDN) 업체인 니시라는 오픈스택 진영에서 큰 비중을 차지하는 업체였습니다. VM웨어는 니시라 인수를 통해 시스템뿐 아닌 전체 데이터센터를 가상화하는 전략을 완성해 가고 있습니다.

그는 또 최근 인수한 다이나믹옵스도 이 같은 움직임의 배경일 것으로 예상했습니다. 다이나믹옵스는 IT관리 소프트웨어 업체입니다. 다이나믹옵스는 VM웨어뿐 아니라 경쟁자인 젠(Xen)이나 KVM 등까지 멀티 가상화 환경을 지원합니다. 다이나믹옵스의 활용도를 극대화하기 위해서는 오픈스택과의 원만한 관계도 필수적일 것입니다.

시트릭스시스템스가 오픈스택 대신 클라우드스택에 집중키로 한 것과도 관계가 있어 보입니다. 시트릭스가 떠난 오픈스택의 한 자리를 차지해, 클라우드스택을 견제하는 전략이라는 해석입니다.

그러나 아직 누구도 VM웨어의 전략을 정확히 읽지는 못하고 있습니다. 오픈스택 진영 일각에서는 “트로이의 목마가 아니냐”는 의구심도 버리지 못하고 있습니다.
2012/08/29 10:11 2012/08/29 10:11

사용자 삽입 이미지
지난 6월 20일 일본에선 클라우드 대란이 일어난 바 있습니다. 클라우드 서비스 업체 ‘퍼스트 서버’가 초대형 전산장애를 낸 것입니다.


퍼스트서버는 야후재팬의 자회사로, 일본 내에서 인기있는 클라우드 서비스였지만 이날 장애로 무려 5698개 기업의 데이터를 날려버렸습니다.  

이 회사는 당시 자사 서비스의 버그를 해결하기 위해 대규모 소프트웨어 패치를 진행하다가 사고를 냈습니다. 파일 삭제 명령의 실행∙정지를 제어하고, 관리 대상 서버를 지정하는 기술에 문제가 있었다고 합니다.

퍼스트서버는 장애 이후 데이터 복구 소프트웨어를 통해 데이터를 복원하고 고객사들이 자신들의 데이터를 내려받을 수 있도록 노력했지만, 결국 3일 만에 데이터 복구를 포기한다고 선언했습니다. 데이터 복구 자체는 성공했지만, 각 고객사별 권한 제한이 불가능해 남의 회사 데이터까지 내려받을 수 있게 됐기 때문입니다.

지금까지 네트워크 오류나 전력 문제로 클라우드 서비스가 중단되는 문제는 여러 차례 있었지만, 퍼스트서버처럼 고객의 데이터를 분실하는 사고는 보기 드문 일입니다. 일본의 IT전문 미디어들은 이번 사태를 두고 ‘미증유의 사태’라고 표현합니다.

이번 사태는 클라우드 서비스를 이용하는 기업들에 몇 가지 교훈을 줍니다.

가장 큰 교훈은 클라우드 서비스 업체들의 약관을 보다 정밀하게 검토해야 한다는 점입니다. 클라우드 서비스 업체가 자랑하는 ‘SLA(서비스 수준관리)’만 믿다가는 낭패를 볼 수도 있음을 보여줍니다.

‘퍼스트 서버’는 가동률 100%를 내세워 업계 최고 수준의 SLA를 자랑했던 회사입니다. 일반적으로 업계에서 약속하는 가동률은 99.9%(윈도 애저), 99.95%(아마존 EC2) 등입니다. 퍼스트 서버는 이런 서비스와의 차별적 우위를 강조하기 위해 가동률 100%를 내세웠던 것 같습니다. (참고로, 미국의 통신사 버라이즌도 가동률 100%를 약속하고 있습니다)

문제는 퍼스트 서버의 약관에 데이터 분실에 대한 책임이 명시돼 있지 않았다는 점입니다. SLA 100%라는 구호를 보면 ‘데이터는 당연히 안전하게 보관되겠지’라고 환상을 갖게 되지만, 실제로는 그렇지 못했습니다. 그 결과 퍼스트 서버 고객사들은 서비스 가동 시간에 대한 약속을 지키지 못한 부분은 SLA 규약에 따라 보상을 받을 수 있지만, 데이터 분실에 대한 보상은 받을 수 없게 됐습니다.

사실 기업의 데이터 분실은 어떤 보상으로도 만회되기 어렵습니다. 이번 퍼스트 서버 사태로 온라인 쇼핑몰을 운영하던 기업은 상품 및 고객 정보가 날아갔고, 어떤 기업은 계약서를 주고 받은 이메일 데이터를 분실했습니다. 이 기업들은 보상금을 받는다 해도 그 상처를 회복하기가 쉽지 않을 것입니다.

또 특정 클라우드 서비스를 100% 믿지 말아야 한다는 교훈도 얻을 수 있습니다. 클라우드 서비스를 이용하더라도 최소한의 백업은 자체적으로 진행해야 한다는 점입니다. 자체적으로 서버와 스토리지를 두고 백업을 하든, 다른 클라우드 서비스로 백업을 하든 특정 클라우드 서비스에만 의존해서는 안 된다는 것을 퍼스트 서버 사태는 보여줍니다.

데이터는 기업 경영의 생명입니다. 서버가 고장나면 새로운 서버로 교체할 수 있지만, 데이터가 분실되면 기업의 운명이 달라질 수 있습니다.

우리 기업의 생명을 특정 회사의 관리에만 의존하는 것은 너무도 위험하다는 것을 퍼스터 서버 사태는 보여줍니다.
2012/08/28 09:37 2012/08/28 09:37