사용자 삽입 이미지
지난 주말 아파치 재단이 하둡1.0을 공식 발표했습니다. 아파치 하둡 데이터 프로세싱 프레임워크가 6년 만에 마침내 공식 버전이 나온 것입니다.

하둡은 대용량 데이터 처리를 위해 대규모 분산처리를 지원하는 프레임워크입니다

아파치 하둡 재단의 아룬 C. 무르티 부사장은  하둡 1.0에 대해 “수 많은 개발자와 위원회의 헌신적인 노력의 정점”이라고 평했습니다.

하둡은 이제 겨우 1.0 버전이 나왔을 뿐이지만, 최근 IT산업에서 차지하는 영향력이 적지 않습니다. 이미 여러 조직에서 하둡을 이용하고 있으며, 아직은 사용하지 않는 조직이라도 하둡에 대한 공부는 하고 있습니다.

유명한 클라우드 서비스인 아마존 웹 서비스(AWS)나 랙스페이스에서 이미 하둡을 이용하고 있고, 페이스북도 하둡의 추종자 중 하나입니다. 특히 하둡의 근원지인 야후는 4만2000 노드에서 하둡을 활용하고 있다고 합니다. 국내에서도 NHN 등이 하둡을 로그분석 등에 활용하고 있습니다.

이처럼 클라우드 컴퓨팅과 빅 데이터가 IT 업계의 핵심 화두로 떠오르면서, 하둡은 가장 인기있는 기술로 자리잡았습니다.

무르티 부사장은 “하둡은 조직들이 방대한 데이터를 저장∙처리하고, 쿼리를 던질 수 있는 사실상의 데이터 플랫폼이 됐다”면서 “새로운 버전은 성능∙안정성∙보안 면에서 가장 중요한 진보를 표상한다”고 강조했습니다.

무엇보다 하둡이 주목을 받는 것은 ‘빅 데이터’에 대한 가장 현실적인 대안이기 때문입니다. 지금까지 기업이나 조직들은 발생하는 수 많은 데이터 중 매우 일부만을 처리하고 분석했습니다. 고객의 다양한 목소리, 웹사이트∙SNS∙스마트 디바이스∙센서네트워크 등 다양한 채널을 통해 들어오는 정보들은 그냥 버려야 했습니다. 활용법이 없었기 때문입니다.
사용자 삽입 이미지

그러나 하둡은 이런 데이터를 기업이나 조직의 전략을 세울 때 이용할 수 있는 가능성을 제시합니다. 하둡과 맵리듀스(MapReduce)라는 데이터 처리 기술을 통해 기존에 버려야 했던 데이터까지 분석 대상으로 올릴 수 있기 때문입니다.

맵리듀스는 대량의 데이터를 다수의 서버에 나눠 집계•가공하는 맵(Map) 과정과 처리 결과를 하나의 표에 정리해 출력하는 리듀스(Reduce)라는 과정을 반복하면서 비구조적 데이터를 처리해 나갑니다.


이를 활용하면 고객이탈을 감지하거나 미래를 예측하는 등 그 동안 얻지 못했던 통찰력을 빅 데이터로부터 얻을 수 있을 것으로 전망됩니다.

특히 단순 오픈소스 프로젝트를 넘어 상업적인 IT업체들이 하둡을 적극적으로 채용하고 있다는 점에서 하둡의 전망이 밝습니다. 오라클, IBM, 테라데이타, 사이베이스 등 기존의 분석용 DB를 공급하던 업체들은 비구조적 데이터를 처리하기 위해 자신들의 솔루션을 하둡과 연계해 나가고 있습니다.

오픈소스 운영체제인 리눅스가 이들 기업들로부터 지원을 받기 시작하면서 급속도로 성장했다는 점을 상기하면 하둡에 대한 전망도 매우 밝아 보입니다.

하둡의 실질적인 활용은 이제 시작 단계입니다. IT기술을 선도하는 일부 업체들은 이미 하둡을 활용하고 있지만, 일반 기업들은 아직 저 멀리 있는 이야기입니다.

때문에 하둡1.0 출시는 적지 않은 의미를 가지고 있습니다. ‘공식’적으로 출시됐다는 점에서 일반 기업들이 안심하고 접근할 여지를 주기 때문입니다.

포털 업체나 클라우드 업체 이외에도 하둡은 쓸모가 많습니다. 통신사 등의 로그 데이터를 처리할 수도 있고, 의료분야에서는 대용량의 이미지 데이터를 처리할 수도 있습니다. 공장설비 장애 관리를 위한 데이터 분석도 하둡으로 할 수 있고, 판매시점관리(POS) 등에서 들어오는 데이터도 하둡으로 처리할 수 있습니다. 교통 흐름을 분석하거나 위치 정보와 연비 상황을 자동차 운전자에게 통보하는 등 다양한 활용이 가능합니다.

물론 이 같은 이야기는 아직 장밋빛 전망에 불과하니다. 하둡 역시 수 많은 IT업계의 기술들처럼 한 때의 유행으로 지나갈 수도 있습니다. 무엇보아 안정성과 보안을 중요시 여기는 CIP 하둡이 인터넷 기업에나 어울리는 기술이라고 생각할 수도 있습니다.

하지만 빅 데이터라는 거대한 흐름이 멈추지 않는 이상, 하둡과 같은 대용량 분산파일 시스템에 대한 탐구는 지속될 것입니다. 과연 2012년 하둡이 IT업계의 총아로 떠오를 수 있을지 주목됩니다

2012/01/10 10:32 2012/01/10 10:32
사용자 삽입 이미지

글로벌 소프트웨어 업계가 세일즈포스닷컴 따라잡기에 한창입니다. 오라클, IBM, SAP 등 내로라하는 SW 업체들이 한참 후발주자이자, 규모도 훨씬 더 작은 세일즈포스닷컴의 경쟁자가 되기 위해 안간힘을 쓰고 있습니다.

세일즈포스닷컴은 온라인 상에서 고객관계관리(CRM) 서비스와 애플리케이션 플랫폼을 제공하는 회사로, 전 세계 클라우드 컴퓨팅 시장의 선두 주자입니다. 클라우드 컴퓨팅의 상징인 아마존이나 구글의 클라우드 서비스의 매출이 10억 달러(1조 2000억원) 정도인 반면, 세일즈포스닷컴은 2012년 매출 30억 달러를 향해 가고 있습니다.

글로벌 SW 기업들은 이미 전통적인 CRM 소프트웨어 시장을 상당부분 세일즈포스닷컴에 넘겨줬고, 전사적자원관리(ERP) 등 다른 영역까지 세일즈포스닷컴에 빼앗길까 노심초사하고 있습니다.

때문에 이들은 최근 수천억 원에서 수조 원을 들여 세일즈포스닷컴의 비즈니스 모델과 유사한 클라우드 컴퓨팅 업체들을 사들이고 있습니다. 현재의 제품과 비즈니스 모델만을 계속 유지하다가는 장기적으로 성장력이 둔화될 가능성이 높고, 결국 세일즈포스닷컴에 따라잡힐지도 모르기 때문입니다.

우선 IBM은 지난 달 12일(미국시각) ‘스마터 커머스’ 사업 부문 강화를 위해 클라우드 기반 마케팅 및 세일즈 소프트웨어 업체인 디맨드텍(DemandTec)을 4억4000만 달러(한화 약 4980억 원)에 인수한다고 발표했습니다. 디맨트텍은 유통∙소매업자들을 위한 데이터 분석 소프트웨어 업체로, 온라인 상에서 SaaS(Software as a Service) 형식으로 서비스를 제공합니다.

IBM보다 일주일 전에는 세계 최대의 비즈니스 애플리케이션 소프트웨어 업체 SAP가 석세스팩터(SuccessFactors)라는 회사를 인수했습니다. 인수가는 무려 3조9000억 원입니다. 이 회사는 클라우드 기반으로 인사관리 서비스를 제공하는 회사입니다.

9월에는 오라클이 1조7300억 원에 라잇나우(RightNow)라는 회사를 인수했습니다. 라잇나우는 제품 수요조사나 고객 서비스를 온라인 상에서 제공하는 회사입니다.

오라클이 라잇나우를 인수한 것은 특히나 흥미롭습니다. 래리엘리슨 오라클 회장이 그토록 비난하던 멀티-태넌시 기술을 이용하는 대표적인 업체 중 하나가 바로 라잇나우이기 때문입니다. 멀티-테넌시는 하나의 소프트웨어와 DB를 여러 고객(기업)이 사용하는 모델로, 앨리슨 회장은 “멀티-테넌시는 끔찍한 아이디어”라고 주장한 바 있습니다. 하나의 DB에 여러 기업의 데이터를 담는 것은 위험하다는 것이 앨리슨 회장의 생각이었습니다.

하지만 래리 엘리슨의 반대에도 불구하고 멀티-테넌시 기반의 SaaS는 인기를 끌었고, 오라클도 결국은 대세를 거스를 수 없었습니다.

이 같은 일련의 인수러시는 기업용 소프트웨어 산업이 본격적으로 클라우드 기반으로 전환되고 있음을 보여주는 듯 보입니다. ‘빌려쓰는 소프트웨어’가 틈새가 아닌 대세가 되고 있는 것입니다.
2012/01/03 10:08 2012/01/03 10:08
최근 빅 데이터, 소셜네트워크서비스(SNS) 등이 떠오르면서 소셜 분석이라는 분야도 각광을 받고 있습니다. 소셜 분석이란 트위터∙페이스북, 인터넷 게시판, 뉴스 댓글 등 일반 사용자들이 솔직하게 남긴 글들을 취합해 분석하는 기술입니다.

기업은 사용자들이 자신의 제품과 서비스, 브랜드에 대해 어떻게 생각하고 있는지 알기를 원합니다. 때문에 많은 비용을 들여 설문조사를 하기도 하고, 전문기관에 분석을 맡기기도 합니다. 기업들은 이런 조사 결과를 기반으로 마케팅 및 영업 전략을 세워나갔습니다.

하지만 이런 조사들은 소비자들의 솔직한 마음을 알아내기에는 역부족이었습니다. 설문조사에 응했던 사람들이 100% 솔직하게 답하는 경우가 많지 않기 때문입니다. 응답자들은 고의적으로, 또는 자신도 모르게 거짓말을 하곤 합니다.

소셜 분석은 이 같은 한계를 극복할 수 있는 대안으로 떠올랐습니다. 소셜미디어를 통해 소비자들이 자신들끼리 이야기하는 것을 엿들을 수 있기 때문입니다. 이 목소리를 잘 종합해서 분석한다면 우리회사에 대한 정확한 평가를 기반으로 전략을 세울 수 있을 것으로 기대합니다.

기술적 측면으로 보자면 소셜분석을 위해서는 검색과 텍스트 마이닝 기술이 이용됩니다. 특정 키워드가 포함된 웹 문서(멘션)을 검색하고, 그 키워드가 긍정적으로 이용됐는지 부정적으로 이용됐는지 파악하는 것입니다.
 
국내 검색엔진 업체 코난테크놀로지가 제공하는 소셜분석 서비스 펄스K(www.pulsek.com)를 통해 직접 살펴보겠습니다.
사용자 삽입 이미지

펄스K에서 최근 사망한 ‘김정일’이라는 키워드를 넣으면 위와 같은 결과가 나옵니다. 부정적인 글들이 78.58% 차지했고, 긍정적인 글들은 11.84%밖에 되지 않습니다. 긍정도 부정의 감성도 포함되지 않은 글은 9.58%입니다.

이처럼 입력한 키워드가 어떤 평가를 받고 있는지 확인할 수 있습니다. 기업들은 자신의 제품이나 브랜드가 어떤 평가를 받고 있는지, 이런 평가를 주도하는 사람들이 누구인지 판단할 수 있습니다.

하지만 소셜 분석이라는 기술은 아직 허점이 많습니다. 웹 페이지나 트위터 멘션이 긍정적인 뉘앙스인지, 부정적인 뉘앙스인지 컴퓨터가 판단하는 것이 쉽지 않기 때문입니다.

소셜분석을 위해서는 각 단어가 부정적인 단어인지 긍정적인 단어인지 알 수 있는 태그를 달아둡니다. 예를 들어 ‘아름답다’ ‘사랑’ ‘훌륭하다’ 등에는 긍정의 태그가 붙을 것이고, ‘악마’ ‘나쁘다’ ‘어렵다’ 등의 단어에는 부정적인 태그가 달릴 것입니다.

하지만 인간의 언어는 그렇게 단순하지 않습니다.

트위터에서 한 이용자는 “경축, 김정일 사망. 민족의 대경사이자 이제 희망이 생겼다”라고 남겼습니다. 이 문장에는 경축, 대경사, 희망 등 긍정적인 단어가 가득합니다. 아마도 소셜 분석 솔루션(서비스)은 ‘김정일’이라는 키워드에 대해 이 멘션이 긍정적인 메시지고 판단할 것입니다.

언어의 오묘함도 소셜 분석을 어렵게 합니다. 개그콘서트에 등장하는 쌍칼 아저씨가 “예뻐~”라고 말하는 것은 단순히 예쁘다는 의미가 아니라 음흉한 느낌을 표현하는 것입니다. 과거 ‘사랑의 굴레’라는 드라마에는 “잘났어 정말”이라는 유행어가 있었는데, 이 역시 상대를 칭찬하는 표현이 아닙니다.

이처럼 단어 자체만 가지고 긍정적 메시지인지 부정적 메시지인지 판단하는 것은 어렵습니다. 때문에 소셜 문석 솔루션이 문맥까지 판단할 수 있어야 합니다.

하지만 이는 매우 어려운 일이며, 앞으로 업계가 풀어나가야 할 숙제입니다.
2011/12/29 13:28 2011/12/29 13:28

사용자 삽입 이미지
지난 달 어도비시스템즈(이하 어도비)가 모바일용 플래시 플레이어 개발을 중단했습니다. 어도비는 모바일 시장에서 플래시 플레이어 대신 AIR(어도비 통합 런타임)에 집중키로 했습니다. AIR는 플래시를 웹 브라우저가 아닌 독립 애플리케이션처럼 구동하는 기술입니다.


애플이 iOS에서 플래시 플레이어를 거부하고 있고, 마이크로소프트마저 윈도8의 매크로 화면에서 플러그인 기술을 차단했기 때문에 어도비의 전략변화는 어쩔 수 없는 측면이 있습니다.

기업이 시장의 변화에 따라 전략을 바꾸는 것은 흔한 일입니다. 어느 회사든 기존 제품이나 서비스를 중단할 수 있고, 신제품을 만들 수도 있습니다.

문제는 플래시 개발자들입니다.
 
플래시는 이미 튼튼한 생태계가 구축된 상황이어서, 어도비의 전략 변화는 생태계에 큰 영향을 미칩니다. 어도비가 모바일용 플래시 플레이어 개발을 중단함에 따라 플래시 개발자도 이제 새로운 전략을 취해야 합니다.

플래시 개발자는 이 같은 변화에 어떻게 대응해야 할까요?

먼저 모바일 시장을 버리고 PC 시장만 집중하는 선택을 할 수 있을 것입니다. 하지만 스마트폰 출하량이 PC를 넘어선 현 시점에서 이는 현명한 선택이 아닙니다. 새롭게 떠오른 거대한 시장을 포기하고, 이미 고착화 된 시장에 집중하겠다는 개발자는 없을 것입니다.

두 번째는 웹 브라우저는 포기하고 AIR 기반의 애플리케이션 시장을 노리는 전략입니다. 어도비 플래시 빌더를 이용하면서 AIR 기반의 애플리케이션을 만들 수 있습니다.

하지만 모든 콘텐츠를 네이티브 앱으로 배포하는 것은 다소 무리가 있습니다. 플래시 기술은 웹 페이지를 풍부하게 만드는 데 큰 역할을 해 왔습니다. 앱보다 웹으로 배포하는 것이 적당한 콘텐츠도 많이 있습니다.

모바일 상에서 웹 기반의 리치(Rich) 콘텐츠를 포기할 수 없다면 HTML5를 고려해야 합니다. 모바일용 웹 페이지를 플래시가 아닌 HTML5로 만들면 디바이스의 한계 없이 웹 콘텐츠를 배포할 수 있습니다.

플래시에 익숙해 있는 플래시 개발자들이 HTML5라는 기술을 새로 습득해야 한다는 문제점이 있습니다. 또 현재의 HTML5는 플래시 개발자들이 가진 풍부한 경험을 그대로 다 웹에 살려내기에는 기술이 성숙지 않았습니다. HTML5는 아직 개발 중이며, 현실에서 적용된 사례도 많지 않습니다.

그럼에도 장기적으로 상당수의 플래시 개발자들은 HTML5에 눈을 돌릴 것으로 보입니다. 플래시를 붙잡고 있는 것은 계속 퇴보하는 것이나 마찬가지이기 때문입니다.

이 때문에 어도비조차 HTML5에 많은 투자를 하고 있습니다. 어도비는 플래시 개발자들이 HTML5 기반의 웹사이트를 쉽게 만들 수 있도록 엣지(Edge)와 뮤즈(Muse) 등의 HTML5 개발도구를 제공하기도 합니다.

아울러 플래시 개발자들이 HTML5로 옮겨갈 경우 경쟁은 더욱 치열해 질 것입니다. HTML5 개발자들이 급속도로 늘어나기 때문입니다. 상당수의 플래시 개발자들은 풍부한 경험을 가지고 있습니다. 이 경험을 HTML5를 통해서 그대로 발현할 수 있느냐가 이 경쟁의 관건이 될 것으로 보입니다.
2011/12/27 09:57 2011/12/27 09:57

사용자 삽입 이미지
오늘(15일) 오전 한국IDC가 서울 삼성동 그랜드인터콘티넨탈 호텔에서 2012년을 예측하는 행사를 개최했습니다. IDC나 가트너와 같은 IT시장조사기관은 매년 다음 해의 이슈를 전망하는 행사를 엽니다.

 
이날 한국IDC가 발표한 2012년 전망을 요약한다면 “2012년은 진짜 대변혁의 시기가 될 것”이라는 점입니다. 한국IDC 리서치 총괄 장순열 상무의 말을 빌자면, “2020년에 e비즈니스를 계속할 수 있을 지 없을 지 2012년에 결정될 것”이라고 합니다. 때문에 “2012년에는 2020년을 예상하면서 로드맵을 그려야 한다”고 장 상무는 강조했습니다.
 
장 상무는 워드프로세서를 처음 상용화한 ‘왕 컴퓨터’나 미니컴퓨터의 상징 DEC가 흔적도 없이 시장에서 사라진 사실을 예로 들며, 이런 업체의 뒤를 따르지 않으려면 변화에 잘 대처해야 한다고 덧붙였습니다.
 
한국IDC가 2012년을 중요하다고 보는 이유는 ‘제3의 플랫폼이 안착되는 시기’이기 때문입니다. 한국IDC에 따르면, IT 시장은 20년~25년 주기로 플랫폼 주도권이 바뀐다고 합니다. 지난 1985년까지의 플랫폼은 메인프레임이었고, 그 이후 2011년까지는 PC의 시대였습니다.
 
2012년부터는 모바일이 플랫폼 주도권을 쥘 것이라고 장 상무는 말했습니다. 단적인 예로 올해부터 전 세계 스마트폰의 출하량이 PC 출하량을 넘어서게 될 것이라고 봤습니다. 한국의 경우 이미 스마트폰 출하량이 PC보다 많습니다. 기업들이 중요하게 생각하는 기본 플랫폼이 모바일로 바뀔 것이라는 전망입니다.
 
이와 같은 제3의 플랫폼이 대두되면서 기존의 모든 컴퓨팅 환경이 변화를 맞게 될 것이라고 한국IDC는 내다봤습니다. 모바일 디바이스나 애플리케이션을 비롯해, 클라우드 서비스, 모바일 브로드밴드 네트워크, 빅 데이터 분석, 소셜 기술 등 새로운 트렌드가 모두 모바일 플랫폼 기반으로 작동된다는 겁니다. 그 결과 2020년에는 이와 같은 부문이 IT 지출 성장분의 80%를 차지하게 될 것이라고 한국IDC는 밝혔습니다.
 
아래는 한국IDC가 선정한 2012년 10대 예측(Top 10 Predictions)입니다.
 
#1. 2012년 국내 ICT 시장, 성장률 하락하며 어려움 예상 (Difficulties in 2012)


2012년 국내 IT 시장은 전년에 비해 성장률이 하락하며 2.9% 성장에 머물 것으로 예상된다. CT 부문을 포함한 국내 전체 ICT 시장은 이보다 낮은 1.9%의 성장이 예상되고 있다.
 
#2. 제3의 플랫폼에 대한 관심 증가 (On a New Platform)


메인프레임 시기 및 클라이언트/서버 시대를 지나 새로운 플랫폼인 제3의 플랫폼이 IT 분야에서 점차 자리를 잡아가고 있다. 20~25년을 주기로 새로운 플랫폼이 출현 되었듯이 2011년을 기점으로 새로운 모바일 시장의 활성화, 클라우드 서비스 도입의 본격화, SNS 및 빅 데이터 관련 기술을 기반으로 새로운 플랫폼 시대가 시작되었으며 2012년 들어 이에 대한 인식은 더욱 확대될 전망이다.
 
#3. 멀티 클라이언트 디바이스 활용 확대 (Multi Client Devices)


과거 PC(데스트탑/노트북 포함)로 대표되었던 클라이언트 환경에서 다양한 디바이스를 활용하게 되는 멀티 클라이언트 디바이스 시대로의 변화가 본격화 될 것이다. 국내의 경우 이미 스마트폰 보급 대수가 데스트탑 및 노트북 보급대수를 넘어섰으며, 전 세계적으로도 2012년에 모바일 디바이스(스마트폰과 미디어 태블릿)가 출하량 및 지출 모두에서 PC시장의 규모를 넘어설 것으로 예상됨에 따라 멀티 클라이언트 환경이 일반화 될 것으로 보인다. 이러한 변화는 기업 및 개인용 시장의 활성화를 통해 각종 관리 및 OS 주도권을 비롯한 애플리케이션 시장의 변화를 예상케 하고 있다.
 
#4.모바일 지배력 확대에 따른 시장환경 변화 및 기회 증대 (More Mobility)


모바일 환경 도입은 비즈니스 측면 뿐만 아니라 IT 영역에도 주요 관심 영역이다. 4G를 포함한 모바일 네트워크 환경의 고도화는 물론, 제4 이동통신을 비롯, MVNO를 활용한 새로운 서비스 경쟁사의 시장 진입이 가시화 되고 있는 가운데 점유율 경쟁 및 새로운 요금정책, 대용량 트래픽을 발생시키는 서비스간 의견차이가 수익확보 차원에서의 이슈가 될 것이다. 한편, 모바일 시장 활성화에 따른 빅 데이터 분석 수요는 전체 IT 시장에 큰 영향을 미칠 것이다.
 
#5. 소셜 네트워크의 적용이 기업 경쟁력으로 부상 (Social Networking & Business)


일반 사용자 중심의 소셜 네트워크 관련 활동이 기업에서의 관심단계를 넘어서 수용단계로 확대, 진화하면서 기업이 반드시 도입해야야 할 주요 솔루션으로 자리잡을 것이다. 다양한 소통 채널의 확보는 물론, 생산성 향상과 고객지원 그리고 매출 증대로의 연계에 관심을 보임으로써 소셜 네트워크는 기업의 새로운 비즈니스 자산이 될 것이다. 한편 소셜 네트워킹 기술이 엔터프라이즈 IT 벤더의 전략에서 필수적인 구성요소로 인식되고 있어, 이에 따른 경쟁이 예상된다. 또한, 일부 서비스 제공 업체는 B2C 플랫폼으로서 영역을 확장하려 할 것이다.
 
#6. 클라우드 서비스 영역 진화 지속 (Cloud Services & Enablement)


모바일 영역의 활성화와 함께 기회 요인이 추가됨에 따라 클라우드 영역은 점차 인프라 이슈를 넘어서 새로운 플랫폼으로서의 역할이 강조될 것이며, 경쟁 또한 심화될 것이다. 전문 소프트웨어 공급업체들에 의한 클라우드 기반 소프트웨어 제공이 확대될 것이며 기존 인프라 환경을 포함해 다양한 서비스 인프라 모델을 통합, 관리할수 있는 분야의 성장이 예상된다. 그러나 시장 변화의 주요 요인으로서의 클라우드 의미는 퇴색되고 있다. 이미 일반화 단계로 접어들었다고 볼수 있다.
 
#7. 사물간 네트워크 확대 (Interactive Network of Things)


전세계적으로 1,000억개 이상의 센서 및 테그와 115억대가 넘는 제품이 네트워크를 통해 연계되고 있다. 또한 향후 2년간 커뮤니케이션이 가능한 무수히 많은 제품들이 네트워크상에 존재하게 될 것이다. 이상적인 유비쿼터스 환경의 본격화가 예상되고 있다. NFC 및 M2M를 비롯, 이러한 커뮤니케이션 지원을 위해 다양한 마이크로블로깅 관련 기술들에 대한 관심이 확대될 것이다.
 
#8. 빅 데이터 및 비즈니스 애널리틱스 영역에 주목 (Big Data & Business Analytics)


2012년 전세계 디지털 컨텐츠 볼륨이 2011년에 비해 48%가까이 증가한 2.7제타마이트(ZB)에 이르게 됨으로써 빅 데이터가 향후 갖추어야 할 필수적 역량으로 자리매김 할 전망이다. 이렇듯 폭증하는 데이터 및 정보들은 기존의 데이터베이스와 아키텍처로 처리할수 있는 단계를 넘어선 것으로 보이며, 새로운 프레임의 필요성이 요구되고 있다. 따라서 실시간에 기반하여 비즈니스 의사결정을 지원할 수 있는 분석 솔루션에 대한 관심이 집중되고 있어 데이터 영역 및 분석 영역이 통합된 최적화 솔루션 시장의 활성화가 예상된다.  
 
#9. 산업 특화된 인텔리전트 솔루션 영역 부상 (Intelligent Industry Solutions)
일반화된 솔루션의 경쟁력이 한계를 보이는 가운데, 제3의 플랫폼 영역에 포함된 다양한 기술 영역간의 결합을 통한 ‘산업 특화 솔루션’영역에 대한 관심이 부상할 것으로 보인다. 특히 클라우드 인프라를 통한, 서비스화에 따른 일반화의 한계를 극복하는 새로운 기회 시장으로 자리 잡게될 것이다. 산업에 특화된 역량을 보유한 비 IT 시장 참여 그룹들의 부상이 예상되는 가운데, 파트너쉽 등을 통한 관련 시장의 생태계 변화가 예상된다.
 
 #10. 변화를 위한 선택의 기로 (“Crossroad” momentum)


IT 산업의 변화가 가속화 되는 가운데, IT 산업의 리더들은 과감한 투자와 운명적인(=매우 중요한) 결정들을 내려야 하는 상황을 맞고 있다. 제3의 플랫폼에서 언급되었듯이 IT 시장은 이미 중대한 변화를 거치고 있다. 과거 변화의 기로에서 올바른 선택을 하지 못해 도태되었던 일부 업체가 시사하는 점을 상기해야 할 것이다. 새로운 환경에서 변화를 강요 받기 보다는 변화를 적극 수용하는 기회를 마련해야 할 것이다.
2011/12/15 17:25 2011/12/15 17:25
페이스북을 이용하시는 분들 중에는 상태 업데이트에 글을 올린 후 수정이 안 돼서 어려움이 겪은 분들이 있을 겁니다. 페이스북은 오탈자가 있어도 수정할 수 없도록 돼 있습니다. 오직 글을 삭제할 수 있을 뿐입니다.

왜 그럴까요?

이는 ‘빅 데이터’ 기술의 특징이라고 볼 수 있습니다. . ‘빅 데이터’는 정보기술 산업(IT)이 다루는 대상인 ‘정보’의 종류가 많아지고, 그 규모도 엄청나게 커지는 것을 의미합니다. 기존의 관계형 데이터베이스로는 감당할 수 없는 데이터가 등장한 것입니다.

페이스북의 경우 하루에 생성되는 데이터가 일반 기업들의 1년치 데이터보다 많다고 합니다. 페이스북은 지난 8월 기준으로 30페타 바이트의 데이터를 보유하고 있었습니다. 이는 미국 의회 도서관이 보유한 책의 3000배가 넘는 규모입니다.
사용자 삽입 이미지

기존 데이터 처리 기술로는 이 많은 양의 데이터를 감당할 수 없습니다. 때문에 빅 데이터를 처리할 때는 관계형 DB가 아닌 하둡과 맵리듀스, NoSQL이라는 새로운 기술을 주로 활용하게 됩니다.

페이스북 역시 하둡과 맵리듀스, 카산드라(NoSQL의 한 종류)를 이용해 데이터를 처리합니다.

이 기술들의 특징은 데이터 정합성 보다 대용량 데이터를 처리하는 데 중점을 두고 있다는 점입니다. 페이스북에서는 글을 입력했는데, 제 때 바로 반영되지 않거나 여러 개가 동시에 올라가기도 하고, 댓글 10개라고 표시돼 있는데 들어가보면 세 개밖에 없는 일들이 벌어지곤 합니다.

이는 위에 언급한 기술들의 특징입니다. 관계형DB는 단 하나의 데이터라도 잃어버리면 안 된다는 사상 위에 설계된 기술이지만, 하둡이나 NoSQL은 데이터에 조금쯤은 오류가 있어도 좋다는 생각입니다.
사용자 삽입 이미지

하지만 페이스북이 빅 데이터 기술만 이용하는 것은 아닙니다. 페이스북도 마이SQL이나 오라클 같은 관계형 DB를 사용합니다. 대표적인 것이 프로필입니다. 상태 업데이트와는 달리 사용자 프로필은 언제라도 수정할 수 있습니다. 또 사용자 프로필 데이터에는 오류가 발생하지도 않습니다.

최근 국내 기업들도 하둡과 맵리듀스, NoSQL을 이용하는 사례가 늘고 있습니다. 하지만 앞에서 살펴본 것처럼 이 기술들은 장.단점이 분명합니다. 데이터의 정합성이 중요한 업무에 이 기술들을 사용하면 안 됩니다.

페이스북처럼 데이터 정합성이 중요한 서비스에는 관계형 DB를 이용하고, 상대적으로 데이터 정합성은 중요하지 않지만, 많은 데이터를 빠르게 처리하고자 할 때만 빅 데이터 기술을 이용해야 합니다.
2011/12/12 08:51 2011/12/12 08:51
사용자 삽입 이미지

블로그와 <디지털데일리> ‘2008년 IT혁신상품’, 벤처스토리을 통해 소개를 한 적이 있는 회사인 엔써즈가 오늘(5일) KT에 인수됐습니다. 헐값에 넘어간 것이 아닙니다. 450억 원이라는 가치 평가를 받았습니다. KT는 엔써즈 김길연 대표 및 경영진의 지분 45%를 200억 원에 인수했습니다.

국내 소프트웨어 스타트업 기업 중에는 유례없이 높은 평가를 받은 것입니다. 유사한 사례로는 NHN이 검색엔진 업체 첫눈을 350억 원에 인수한 사례가 있을 뿐입니다.

엔써즈가 이처럼 높은 가치 평가를 받은 이유는 단연 기술력입니다. 보통 스타트업 기업들은 반짝이는 아이디어를 내세우거나 틈새시장을 노립니다. 아니면 해외에서 성공한 비즈니스 모델을 재빠르게 한국 시장에 적용하는 방식을 취합니다. 그러나 엔써즈는 원천기술로 승부를 걸었습니다. 엔써즈의 기술력은 이미 업계에서 정평이 난 상태였습니다.

엔써즈는 원천기술은 ‘동영상 검색’입니다. 동영상의 DNA를 분석해 같은 동영상을 판별하는 기술을 보유하고 있습니다. 검색엔진에서 검색을 하면 제목만 다른 똑 같은 동영상이 수십 개 올라와 있어 필요한 영상을 찾는 것이 어려운데, 엔써즈는 동영상 당 하나씩만 결과를 얻기 때문에 필요한 동영상을 쉽게 찾을 수 있습니다.

원천기술의 힘은 다양한 여러 분야에 응용할 수 있다는 점에서 나옵니다. 동영상의 유사성을 판별하는 기술을 가진 엔써즈는 이를 통해 다양한 비즈니스 모델을 만들었습니다. 동영상이 얼마나 퍼져 있는지 확인하고 싶은 저작권자들이나 불법 동영상이 올라오는 것을 막고 싶은 온라인 서비스 업체, 웹하드 업체 등이 엔써즈의 기술을 이용했습니다. 최근에는 스크린샷 하나만으로 동영상을 찾아내는 기술을 선보였습니다.

동영상이라는 특수 분야에 대한 기술력을 보유한 엔써즈는 이를 확장해 한류 콘텐츠를 중심으로 한 미디어 사업까지 확장하기도 했습니다.

KT는 엔써즈의 이 같은 기술력과 확장성을 인정해 200억 원이라는 금액을 과감히 베팅한 것입니다.

흥미로운 점은 엔써즈의 투자자 중에 하나인 소프트뱅크벤처스가 이번에 지분을 팔지 않았다는 점입니다. 소프트뱅크벤처스는 지분을 매각하지 않고 전략적 주주로서 해외 사업 확장을 적극적으로 지원할 계획이라고 밝혔습니다.

이는 소프트뱅크벤처스가 450억 원이라는 엔써즈의 가치평가에 동의하지 않는다는 것으로 이해됩니다. 엔써즈가 훨씬 더 많은 가치를 보유한 회사라고 생각하고 있는 것입니다. 앞으로 엔써즈의 기술력이 더 성숙하면 450억 원보다 더 높은 평가를 받을 수 있고, 그 때 지분을 매각하겠다는 계획입니다.

역시 스타트업이 높은 평가를 받을 수 있는 가장 확실한 수단은 기술력입니다.
2011/12/05 16:48 2011/12/05 16:48
아마 이 기사를 클릭한 독자들 중 일부는 이 기사 제목은 ‘낚시’일 것이라고 예상했을 지도 모르겠습니다. 글로벌 1위의 소프트웨어 기업 마이크로소프트와 공간 인테리어는 아무 관계가 없을 듯 보이기 때문입니다.

그런데 낚시가 아닙니다. 정말 MS가 사무실 내부 공간 배치에 관한 인테리어 사업에 나섰습니다.
 
물론 MS가 비즈니스 모델을 바꾼 것은 아닙니다. MS는 여전히 소프트웨어 기업입니다. MS가 사무실 인테리어에 나선 이유는 바로‘스마트워크’ 때문입니다.

최근 1~2년 모바일 디바이스가 발전하면서 스마트워크에 대한 관심이 높아졌습니다. 시간과 공간의 제약을 받지 않고 일을 하면서 일의 효율성과 효과성을 높이자는 것이 스마트워크입니다. 스마트워크는 국내에선 범정부 차원에서 도입되고 있으며, 기업들도 앞다퉈 스마트워크 도입에 나서고 있습니다.

MS는 이 같은 스마트워크 흐름에 맞춰 이메일, 협업포털 등 다양한 소프트웨어를 제공하면서 매출을 올리기도 했습니다.

하지만 MS는 지금까지의 스마트워크에 대한 ‘회의감’을 표시합니다. 기업이 직원들에게 스마트폰과 스마트패드를 나눠주고, 모바일을 통해 이메일을 확인하고 결재를 올릴 수 있도록 했어도 업무의 효율성과 효과성이 크게 개선되지 않았다고 보는 것입니다.

MS는 “아무리 최첨단 IT기술을 도입해도 문화가 바뀌지 않으면 소용이 없다”는 결론을 내렸다고 합니다. 이후 어떻게 하면 진정한 스마트워크를 이룰 수 있을까 연구에 들어갔습니다.

그 결과 MS는 스마트워크를 이루기 위해서는 IT기술보다는 ‘일하는 공간’과 ‘사람’이 중요하다는 결론을 내렸습니다.

내부 직원들을 대상으로 다양한 조사와 테스트를 진행해 연구한 결과, 책상 배치에 따라 업무 생산성이 다르고, 회의실 구조 및 분위기에 따라 아이디어가 달라진다는 사실을 깨달았다고 합니다.  
 
사용자 삽입 이미지

한국MS 이승식 부장은 “5~6명이 몇 시간씩 회의를 할 때는 성과가 없다가 회의 끝나고 2~3명이 담배 피우면서 얘기할 때 아이디어가 떠오르는 경우를 경험하는 사람들이 많다”고 말합니다. 분위기 딱딱한 회의실에서 바퀴 달린 의자에 둘러 앉아 이야기하는 것은 아이디어에 도움이 안 된다는 것입니다. 회의실을 편하게 담배 피우며 수다 떠는 듯한 분위기로 만들면 아이디어를 더 쉽게 얻을 수 있다고 합니다.

MS는 미국 시에틀 본사에 ‘워크플레이스 랩(업무공간 연구소)’를 설립해 어떤 사무공간이 효과적인지 정식으로 연구했습니다. 그 결과 휴게실 형태의 미팅 공간이나 개인 전화 공간, 허브 형태의 책상 배치, 개인 업무 공간 등 어떻게 하면 가장 효과적인지 방법론을 만들었습니다.

이 방법론을 바탕으로 MS 전 세계 지사의 사무실 리모델링을 하고 있습니다. 현재 싱가폴에 있는 MS 아시아태평양지역본부 사무실도 전체적인 리모델링을 진행하고 있고, 한국MS 사무실에도 일부 이 방법론을 도입했다고 합니다.
사용자 삽입 이미지

MS는 자체적으로 도입한 것을 넘어 이 결과물을 바탕으로 컨설팅 사업에 나섰습니다. MS에는 비즈니스 컨설팅 조직이 없기 때문에 삼일PwC와 협력해 이 사업을 진행합니다. MS가 도출한 방법론을 가지고 삼일PwC의 컨설턴트들이 현장에 접목하는 것입니다.

한국MS 이승식 부장은 “수험생 방의 벽지를 바꿨더니 성적이 올라갔다는 이야기를 들은 적이 있다”면서 “단순히 심미적인 효과뿐 공간에 변화를 주면 업무 환경에 변화를 가져올 수 있다”고 말했습니다.

물론 MS가 사무실 공간 컨설팅만 하는 것은 아닙니다.

일하는 방식에 대한 방법론도 제공합니다. 기존에는 직원들을 업무별로 분류했습니다. 하지만 MS는 일바는 스타일로 분류해서 최적의 업무 환경을 제공해야 한다고 보고 있습니다. 회의가 많은 사람인지, 외근이 많은 사람인지 분석해서 사무 공간 및 IT기술을 설계합니다.
2011/12/02 09:08 2011/12/02 09:08
기업의 DB는 크게 운영DB(OLTP)과 분석DB(OLAP)으로 나뉩니다. 운영DB은 현재의 거래정보를 입력하고 저장하는 용도이며, 분석 DB는 운영 DB로부터 데이터를 이관 받아 각종 통계를 내고 트렌드를 분석하는 데 사용됩니다.

금융권에서는 이를 담당하는 시스템을 계정계와 정보계라고 부르기도 합니다. 계정계는 창구∙온라인뱅킹∙ATM 등에서 일어난 거래를 처리하고, 정보계는 계정계 데이터를 끌어와서 각종 마케팅 및 전략 수립 이용할 수 있도록 분석합니다.

운영DB와 분석DB로 나누어 관리하는 이유는 하나의 시스템에서 모든 업무를 하는 것이 불가능하기 때문입니다. 하나의 DB에서 트랜잭션 처리와 분석업무를 모두 할 경우 병목현상이 발생해 애플리케이션 속도가 대폭 늦어질 것입니다. 만약 ATM에서 돈을 찾았는데, 두 시간 뒤에 통장에서 돈이 빠져나간 것으로 처리된다면 엄청난 혼란이 일 것입니다.

이 가운데 운영DB와 분석DB를 하나로 통합할 수 있다고 나선 용기 있는 회사가 있습니다. 바로 ERP(전사적자원관리)의 대가(大家) SAP입니다.

사용자 삽입 이미지
SAP는 메모리 기반의 DB 어플라이언스인 ‘HANA’라는 제품을 보유하고 있습니다. 이 제품은 인메모리 컴퓨팅 기술이 구현된 DB와 서버, 스토리지가 통합된 어플라이언스 시스템으로, 모든 저장공간이 하드디스크가 아닌 메모리로 구성된 것이 특징입니다.

지금까지 HANA는 분석용 DB로 사용돼 왔습니다. 디스크 대신 메모리에 저장된 데이터는 읽는 시간이 훨씬 빠르기 때문에 짧은 시간에 더 많은 데이터를 분석할 수 있기 때문입니다.

하지만 SAP는 HANA를 단순 분석속도를 높여주는 DB로 규정하고 있지 않습니다. 트랜잭션처리와 분석을 하나의 DB위에서 진행할 수 있도록 하겠다는 포부를 밝히고 있습니다. 그만큼 속도가 빠르다는 주장입니다.

또 일반적으로 분석용 DB는 열(컬럼, column) 기반으로 아키텍처를 사용하고 있지만, HANA는 컬럼 별로 읽을 수도 있고 행(로우, Row) 별로도 읽을 수 있다고 합니다. 여기에 정형 데이터와 비정형 데이터까지 모두 하나의 DB에서 처리할 수 있다는 것이 SAP측의 설명입니다.

SAP는 2012년까지 자사의 중소기업용 ERP 솔루션인 비즈니스원과 클라우드 ERP에 이를 적용한다고 계획을 밝혔습니다. 이를 위한 첫걸음으로 HANA SP3부터 자사의 분석 플랫폼인 넷위버 비즈니스웨어하우스(BW) 용도로 사용할 수 있도록 했습니다.

아직 계획 단계에 불과하지만, 만약 SAP의 비전이 현실화 된다면 엔터프라이즈 컴퓨팅 분야에는 엄청난 변화가 일 것입니다. 계정계와 정보계가 통합된다는 것은 업계의 일대 혁명입니다.

이는 더 이상 ETL(추출,변환,적재)이나 CDC(변화데이터캡처), 데이터웨어하우징과 같은 기술들이 필요 없게 됨을 의미합니다. 또 계정계에서 정보계로 데이터를 이전시키기 위한 모든 프로세스도 사라집니다.

하소 플래트너 SAP 창업자는 HANA에 대해 “기업 컴퓨팅 업계의 레볼루션이 될 것”이라고 자평합니다.

과연 SAP가 장담하는 이런 일이 현실화될지 궁금해집니다.
2011/11/16 10:49 2011/11/16 10:49
사용자 삽입 이미지
IT업계에서 요즘 가장 뜨거운 화두 중 하나는 ‘빅 데이터(Big Data)’입니다. 빅 데이터는 말 그대로 데이터의 규모가 크다는 뜻입니다.

사실 데이터 규모가 커지는 것은 어제 오늘 일이 아닙니다.

이미 지난 20년 동안 데이터는 감당하기 힘들 정도로 늘어났습니다. 이런 상황에서 새삼스럽게 ‘빅 데이터’라는 새로운 용어가 등장한 이유는 무엇일까요?

일단 데이터 증가 속도가 과거와 달리 기하급수적으로 증가한다는 점이 달라졌습니다. 올해 생성될 디지털 데이터는 1.8 제타바이트로 추정됩니다. 제타바이트는 1.8조 기가바이트입니다. 2020년에는 약 35.2제타바이트에 이를 것으로 전망됩니다.

그러나 빅 데이터는 단순히 데이터의 규모만 커지는 것을 의미하지 않습니다.

데이터의 종류도 더욱 다양해진다는 점도 빅 데이터의 특징입니다. 지금까지의 데이터는 대부분 구조화된 데이터였습니다. 때문에 데이터를 분석하는 기술도 이런 구조화된 데이터를 중심으로 발전해 왔습니다.

하지만 이제는 구조화되지 않은 데이터가 중요해지고 있습니다. 페이스북에 형식에 맞춰 글을 쓰는 사람은 없습니다. 텍스트과 그림, 영상이 섞여있기도 합니다. 이 외에 각종 센서네트워크를 통해 수집되는 데이터, 위치 및 지리 데이터 등 엄청나게 다양합니다.

이처럼 다양한 데이터가 대규모로 군집해 있는 것이 ‘빅 데이터’입니다.

한편 ‘빅 데이터’가 주목을 받는 또 다른 이유는 그 안에 지금까지 깨닫지 못했던 정보들이 담겨 있기 때문입니다.

예를 들어, 페이스북에 올라온 ‘감기 걸렸다’는 문장들을 통합해 위치정보와 분석할 경우, 감기 바이러스가 어느 쪽으로 확산돼 가고 있는지 파악할 수 있습니다.

또 사람들이 트위터에 올린 글의 기분 변화를 분석한 결과 ‘불안감’이 늘어날 경우 주가가 낮아진다는 조사도 있습니다. 이처럼 빅 데이터를 잘 분석하면, 새로운 통찰력을 얻을 수 있을 것으로 기대됩니다.

하지만 여러 종류의 대규모 데이터를 모아만 놓는다고 저절로 통찰력이 생기는 것은 아닙니다. 이를 과학적으로 분석해서 통찰력을 찾아내야 합니다. 백사장에서 바늘을 찾듯 엄청나게 쏟아지는 데이터속에서 유의미한 무엇을 발견해 내는 것입니다.

빅 데이터에서 새로운 통찰력을 얻어내는 역할을 하는 사람을 ‘데이터 사이언티스트(Data Scientist)’라고 부릅니다.

비즈니스적 측면에서, 데이터 사이언티스트들은 구조화되지 않은 데이터 속에서 지금까지 드러나지 않았던 숨겨진 패턴을 찾아내는 역할을 합니다. 그 동안은 몰랐던 고객의 행동이나, 잠재 시장 등이 그것입니다.

기존에는 데이터를 다루는 직종으로 데이터 모델러, 데이터 아키텍트 등이 있었습니다. 이들은 전통적인 IT맨들이었습니다.

하지만 데이터 사이언티스트들은 전통적 개념의 IT맨들이 아닙니다.

이제는 통계학자, 수학자, 경제학자 등이 IT를 활용해 빅 데이터로부터 통찰력을 얻어냅니다.

당연히 IT업체들도 데이터 사이언티스트 확보에 혈안이 돼 있습니다. 예를 들어 글로벌 IT기업인 EMC는 ‘애널리틱스 랩’이라는 부서를 운영하고 있습니다. 이 부서는 데이터 사이언티스트들로 구성돼 있습니다. 경제학, 통계학, 심리학 등을 전공한 박사급 인재들입니다.

이들은 기업들이 빅 데이터로부터 통찰력을 얻어낼 수 있도록 조언을 하고, 교육을 하는 역할을 합니다.

데이터 사이언티스트가 되기 위해서는 단순히 하나의 분야만 알아서는 안 됩니다. 기본적으로 통계학이나 경제학에 대한 지식이 있어야 합니다.

또 분산 컴퓨팅, 하둡, 자료구조 등과 같은 IT기술과 엔지니어링도 알아야 하고, 수학과 같은 기초학문에 대한 능력도 필수적입니다.

때문에 데이터 사이언티스트가 되는 것은 실제로 매우 어려운 일입니다. 물론 이 같은 능력을 갖출 수 있다면 어느 회사에서라도 환영 받을 수 있을 것입니다.

2011/11/07 08:50 2011/11/07 08:50