지난 3일 미국 내에서 인터넷익스프로러(IE)6의 점유율이 1% 미만으로 떨어졌다는 발표가 있었습니다.
 
인터넷 시장조사기관 넷 애플리케이션 조사에 따르면, 12월부터 미국에서 IE6는 사실상 사망했다고 볼 수 있습니다.

넷 애플리케이션은 아울러 전 세계 IE6의 점유율(12월 기준)은 7.7%이며, 중국이 25.2%로 가장 높고 한국은 7.2%로 중국에 이어 세계 두 번째로 높다고 전했습니다.

하지만 한국에서의 IE6 점유율 7.2%가 과연 정확한 조사일까요?
 
주변에서 피부로 느껴지는 IE6 점유율은 이 보다 높게 느껴집니다. 넷 애플리케이션과 같은 통계들은 표본을 통해 측정한 결과입니다.
 
국가마다 인수비율에 따라 표본을 달리하기 때문에 인구수가 상대적으로 적은 우리나라의 경우 표본도 적어서 조사 정확성이 떨어질 수도 있을 것입니다.

반면 IE6 점유율을 낮추기 위해 안간힘을 쓰고 있는 한국마이크로소프트의 조사 결과는 넷 애플리케이션의 발표와 상당히 큰 차이를 보입니다.
 
한국MS가 측정한 IE6의 점유율을 넷 애플리케이션 조사 결과의 4배가 넘는 29.3%입니다. 물론 한국MS의 조사는는 지난 10월을 기준으로 하고 있기 때문에 12월 버전인 넷 애플리케이션 결과와 직접 비교하기는 힘듭니다. 2개월 동안 IE6 점유율이 내려갔을 것이 분명하기 때문입니다.
 
하지만 2개월 동안 IE6의 점유율이 줄어들 것을 감안하더라도 4배 이상의 차이는 다소 의아합니다.

그럼 진짜 점유율은 얼마일까요?
 
아마 이를 가장 잘 알 수 있는 곳은 아마 인터넷 포털 업체들일 것입니다. 국내의 인터넷 이용자들이라면 네이버, 다음 등 대형 포털사이트를 이용하지 않는 사람은 많지 않습니다.
 
인터넷에 접속하는 모든 브라우저를 조사하는 것이 가장 정확한 수치를 얻을 수 있겠지만 이는 사실상 불가능하기 때문에 대형 포털에 접속하는 브라우저를 조사하면 가장 진실과 가까운 수치를 얻을 수 있을 것입니다.

네이버에 접속하는 브라우저 통계(12월 1일 기준)는 아래와 같습니다.
 
사용자 삽입 이미지

IE8이 51.3%이 가장 높고 IE6는 13.7%를 기록했습니다. IE6 점유율이 한국MS 조사보다는 한참 낮은 수치이지만 넷 애플리케이션보다는 두 배 가까이 높은 수치입니다.

아래는 인터넷 포털 다음에 접속하는 브라우저 통계( 2011.12.29~2012.1.4)입니다.
사용자 삽입 이미지

역시 인터넷익스플로러가 42.1%로 가장 높고 IE6는 11%를 기록했습니다.

이는 네이버와 다음의 접속자 브라우저를 전수 조사한 결과입니다. 조사 시점이 조금 다르기 때문에 1대 1로 비교할 수는 없지만 두 사이트의 결과가 유사하다고 이해할 수 있습니다.

다음의 경우 일부의 뉴스콘텐츠를 모바일 홈페이지(m.daum.net)에서는 볼 수 없고 PC용 홈페이지(www.daum.net)에서만 볼 수 있기 때문에 모바일 브라우저의 점유율이 상대적으로 높게 측정된 것으로 보입니다.

이를 토대로 볼 때 현재 국내의 IE6 점유율은 10%대 초반인 것으로 결론내릴 수 있습니다. 세계적 기준에서는 여전히 굉장히 높은 수치입니다. 정부와 업계, 마이크로소프트 등이 캠페인까지 벌이고 있지만 IE6의 위세는 여전한 듯 보입니다.

세계적으로 IT신기술을 빠르게 수용하는 것으로 유명한 우리나라에서 IE6가 이토록 오랫동안 생명을 유지하고 있는 것은 참으로 의아합니다.
2012/01/12 14:56 2012/01/12 14:56
사용자 삽입 이미지

어제 네이버가 실시간 검색순위 중 일부를 임의로 제외하는 일이 벌어져 논란이 일고 있습니다.

최근 신정아 씨가 낸 책 ‘4001’에서 자신을 성추행하려 했다고 밝힌 전 조선일보 기자 C씨의 실명이 실시간 인기 검색 순위에 오르자 이를 노출시키지 않은 것입니다.

이에 대해 네티즌들이 지금 무엇을 검색하고 있는지 알려주는 실시간 인기 검색어를 네이버가 편집할 권한이 있는지에 대한 논란이 일고 있습니다.

네이버가 실시간 검색순위를 편집한 이유는 C씨에 대한 명예훼손이라고 봤기 때문입니다. 신정아 씨가 책에서 C씨의 본명을 언급하지 않았는데, 네이버를 통해 이것이 알려지는 것은 C씨에 대한 명예훼손이 될 수 있다고 본 것입니다.

C씨가 네이버를 상대로 명예훼손 소송을 걸 수 있기 때문에 사전적으로 조치했다는 것입니다.

네이버 관계자는 이를 ‘개똥녀’와 유사한 사례라고 설명했습니다. 개똥녀는 애완견의 배설물을 치우지 않고 지하철에서 하차한 한 여성에게 네티즌이 붙인 별명입니다. 공공장소에서 다른 사람을 전혀 배려하지 않은 그녀의 행동은 인터넷 상에서 엄청난 비난을 받았습니다.

이런 상황에서 네이버 인기검색어에 그녀의 실명이 올라가면 대다수의 사람이 개똥녀가 누구인지 알게 되고, 그녀에게 사이버 테러가 가해질 것입니다. 이는 개똥녀에 대한 명예훼손이고 실시간 검색어에서 개똥녀의 실명을 뺄 수밖에 없다는 것입니다.

특히 이른바 ‘김명재 판결’ 이후 포털 사업자의 책임이 더욱 강해졌다고 이 관계자는 설명했습니다.

김명재 판결이란, 명예훼손 가능성이 있으면 피해자 신고 없이도 포털이 이를 삭제할 의무가 있다는 대법원 판결입니다. 여자친구의 자살로 인해 인터넷 상에서 비난을 받던 김씨는 NHN, 다음커뮤니케이션, 야후코리아 등 3개 포털을 상대로 제기한 손해배상 청구소송에서 이겼습니다.

이 판결이 실시간 검색어를 문제 삼은 것은 아니지만 포괄적으로 명예훼손에 대해 포털 사이트가 책임을 져야 한다는 취지의 판결입니다. 네이버가 실시간 검색어를 삭제한 것은 이 판결의 취지를 받아들였다고 볼 수 있습니다.

하지만 다른 포털 사이트의 입장은 좀 다릅니다.

다음이나 네이트의 경우 실시간 인기 검색순위를 편집하는 일은 거의 없다고 합니다.

다음커뮤니케이션 관계자는 “이번 C씨 문제와 관련 검색어 자동완성(서제스트)에서는 삭제는 했다”면서도 “실시간 검색 순위는 조절하지 않는다”고 밝혔습니다. 이 관계자는 “검색순위는 이용자들이 어떤 키워드를 검색했느냐를 보여주는 역할만 할 뿐”이라면서 “음란물 등 사회적으로 문제가 되는 것만 아니라면 검색순위에 손대지는 않는다”고 말했습니다.

네이트측도 마찬가지입니다. 네이트를 운영하는 SK커뮤니케이션즈 관계자는 “실시간 검색어는 질의어에 따라 자동으로 생성되는 것이기 편집하지 않는다”고 밝혔습니다.

이 관계자는 특히 “실시간 검색어 순위는 시간이 지나면 바뀌기 때문에 굳이 삭제할 필요도 없다”면서 “검색 질의어에 대한 인위적 조작은 있을 수 없는 일”이라고 강조했습니다.

다음과 네이트는 김명재 판결을 모르는 것일까요?

다음 관계자는 “이 판례를 너무 확대 해석해서 조치하면 표현의 자유를 심대하게 침해할 수 있다”고 말했습니다.
2011/03/25 12:50 2011/03/25 12:50
제 블로그를 종종 방문하는 독자 분이라면 제가 음성인식 분야에 관심이 많다는 것을 느끼실 수 있을 겁니다. 네. 저는 음성인식을 비롯해 자연언어처리 기술 전반에 많은 관심을 가지고 있습니다.

이 때문에 음성인식 관련 블로그 기사를 여러 차례 포스팅 했습니다. 아래가 음성인식과 관련된 기사들입니다.

구글 넥서스원 음성인식, 우리도 할 수 있을까
영어유치원, 쓸 데 없는 낭비 될 수도
구글 음성검색…구글이 무서워졌다
한국어 스마트폰 음성검색, 최강자는 누구?
네이버 음성검색의 놀라운 진보…구글 수준

이런 저에게 최근 가장 신선한 충격을 준 서비스는 네이버 음성검색입니다. 지난 10월 ‘한국어 스마트폰 음성검색, 최강자는 누구?’라는 기사를 쓸 때만해도 구글에 비해 한 참 수준이 떨어졌던 네이버 음성검색 기술이 지난 1월에 ‘네이버 음성검색의 놀라운 진보…구글 수준’ 기사를 쓸 때는 구글에 맞먹는 수준으로 올라있었기 때문입니다.

이 짧은 기간 동안 네이버에는 무슨 일이 있었던 걸까요? 이 같은 질문에 답을 얻기 위해 네이버 음성검색 기술개발을 이끌어 온 이상호 음성검색팀장을 만났습니다.
사용자 삽입 이미지

이 팀장은 음성합성으로 박사학위를 취득한 음성공학 전문가로, LG전자 등에서 음성인식 기술을 연구해 왔습니다. 이후 검색엔진 전문업체 첫눈에서 검색엔진을 개발하다가 인수합병으로 NHN에 합류했습니다.

그런데 이 팀장이 저에게 건넨 명함에는 ‘음성검색팀’이 아닌 ‘검색모델링1팀’ 소속으로 돼 있었습니다. 네이버의 검색모델링팀은 검색결과의 순위(랭킹) 알고리즘을 개발하는 팀이라고 합니다. 옛날 명함을 그대로 쓰고 있다는 사실은 그가 음성검색팀을 맡은 지 얼마 되지 않는다는 점을 보여줍니다.

이 팀장에 따르면, NHN에 음성검색팀이 꾸려진 것은 불과 지난 해 7월 15일이라고 합니다. 당시는 구글과 다음이 음성검색 모바일 애플리케이션을 막 출시해 관심을 끌던 시기였습니다.

네이버는 그 이전에는 음성인식에 큰 관심이 없었던 듯 보입니다. 이 팀장은 네이버에 합류한 이후 줄곧 검색 모델링 업무를 맡았다고 합니다.

네이버는 지난 해 10월 음성검색 앱을 처음 출시했습니다. 하지만 이 때의 음성검색은 7월에 발족한 음성검색팀이 개발한 서비스가 아니었습니다. HCI랩이라는 국내 음성인식 전문업체의 기술을 이용한 것이었습니다.

제가 구글, 네이버, 다음의 음성검색 성능을 비교한 기사인 ‘한국어 스마트폰 음성검색, 최강자는 누구?’는 이 시점에 나온 것입니다. 당시 네이버의 음성검색의 수준은 구글에 한 참 못 미쳤습니다.

하지만 네이버는 12월 22일 훨씬 음성인식 기술이 향상된 음성검색 서비스를 선보였습니다. 이 버전이 음성검색팀의 기술이 처음 적용된 서비스입니다. 제가 ‘네이버 음성검색의 놀라운 진보…구글 수준’이라는 기사가 이 시점의 기사입니다.

음성검색팀이 처음 꾸려진 7월 15일로부터 불과 5개월 만에 구글에 비견할만한 음성검색 서비스를 개발한 것입니다.

음성인식은 지난 20년 동안 국내외 많은 전문가들이 매달려 온 기술입니다. 그럼에도 아직 완벽하게 상용화할 만한 기술을 개발한 기업이나 연구단체는 많지 않습니다. 네이버가 5개월 만에 이런 수준의 음성검색 서비스를 만들어냈다는 것은 거의 기적이 아닐 수 없습니다.

알고 보니 그 비결은 네이버 음성검색 팀의 구성원들에 있었습니다.

이상호 팀장을 비롯한 4명의 음성검색 팀원들은 이미 LG전자에서 함께 음성인식 기술을 연구해 왔던 인물들이라고 합니다. LG전자 이후 각자 제 갈 길을 걸어왔는데 우연히 NHN에서 다시 집결한 것입니다.

지난 해 7월 이상호 팀장에게 ‘자체 기술로 음성검색 서비스를 만들어라’라는 미션이 주어졌을 때 이 팀장이 같은 조직 안에 있는 옛 동지들을 모은 것입니다.

이 팀장은 “5개월 만에 결과가 나왔지만 사실 5개월 동안 새로 연구한 것은 거의 없다”면서 “과거에 이미 함께 연구하면서 머릿속에 있는 것들을 현실에 구현하기만 한 것”이라고 말했습니다.

그는 이를 피아니스트에 비유했습니다. 피아니스트가 사람들에게 실력을 보여주는 시간은 5분에 불과하지만 10년 이상 피아노 연주를 연습해 왔다는 것입니다. 음성검색 서비스를 만드는 데는 불과 5개월만이 걸렸지만, 10년 이상 음성인식 기술을 연구해왔기 때문에 가능했다는 설명입니다.

네이버 음성검색 서비스는 내부적으로도 매우 성공적인 프로젝트로 평가 받고 있습니다. 당초 3월에 처음 출시하기로 했었는데, 이를 3개월 앞당겨 12월에 만족할 만한 성능의 서비스를 선보인 것입니다.

이 팀장은 이 같은 성과의 비결에 대해 “교과서 대로만 하려고 노력했다”고 말했습니다. 사실 원래 교과서 대로 하는 게 더 어려운 법입니다. 야구선수가 교과서대로 던지고 교과서 대로 치고 싶지만, 누구나 그렇게 하지 못하는 것처럼 말입니다.

그는 “실수를 안 하려고 굉장히 노력했고, 10년 동안 컴퓨터의 성능이 좋아져 빠른 시간 안에 기술 개발이 가능했다”고 덧붙였습니다.

처음에는 태스크포스팀(TFT)와 유사하게 발족한 네이버 음성검색팀은 이제 정식 팀이 돼서 새로운 인력도 충원하고 있다고 합니다. 현재로서는 음성검색 품질을 더 높이기 위해 노력하고 있고, 어느 정도 수준에 오르면 검색을 넘어 음성 받아쓰기에까지 도전할 예정이라고 합니다.

네이버가 음성 받아쓰기 서비스도 구글과 경쟁할 수준이 될지 궁금해지고, 또 기대도 됩니다.
2011/03/15 08:39 2011/03/15 08:39
최근 인터넷 업계에 베끼기 논란이 종종 있습니다. 네이버의 미투데이나 다음의 요즘, 싸이월드의 C로그 등은 트위터 짝퉁이라는 비판을 받고 있고, 네이버톡도 카카오톡을 표절했다는 비판도 받고 있습니다.

관련기사
벤처 베끼기에 폐쇄성까지…네이버톡의 한계
국내 포털들 트위터•페이스북 따라하기 급급

이런 논란은 비단 인터넷 업계에만 있는 것은 아닙니다. 최근 문화방송에서 인기를 끌고 있는 가수 오디션 프로그램인 ‘위대한 탄생’은 엠넷의 ‘슈퍼스타K’를 따라했다는 비판이 많았습니다.

하지만 기존의 서비스를 차용했다고 무조건 비판하는 것은 무리가 있습니다. 어차피 하늘 아래 새로운 것은 별로 없기 때문입니다.

예를 들어 미국의 마이스페이스닷컴은 한국의 싸이월드와 매우 많이 유사합니다. 전 세계를 뒤흔들고 있는 페이스북 역시 싸이월드를 참조한 것입니다. 마크 주커버그도 방한해 싸이월드를 방문한 적이 있다고 합니다.

그럼 싸이월드는 하늘 아래 새로운 서비스였을까요? 물론 아닙니다.

싸이월드는 처음에 미국의 식스디그리스닷컴(sixdegrees.com)이라는 회사를 베낀 서비스입니다. 식스디그리스닷컴은 6명만 건너면 전세계 모든 사람이 다 이어진다는 이론을 바탕으로 만들어진 서비스입니다. 싸이월드 상징인 아바타도 원래 세이클럽에서 먼저 시작한 것을 싸이월드가 받아들인 것입니다.

싸이월드는 식스디그리스 위에 미니홈피를 더하고, 세이클럽 아바타를 수익모델로 이용해 성공한 케이스입니다.

SK커뮤니케이션즈는 싸이월드를 세계 최초의 소셜네트워크서비스(SNS)라고 홍보하고 있지만, 이는 사실이 아닌 것입니다. 물론 최초로 성공한 SNS 서비스인 것은 분명합니다.

네이버의 울트라 히트 서비스인 지식iN도 역시 네이버가 처음으로 생각해낸 것은 아닙니다. 지식iN 역시 다른 서비스로부터 시작됐습니다. 지식iN 이전에 국내에는 디비딕이라는 유사서비스가 존재하고 있었습니다. 디비딕은 미국의 하우투(HowTo)를 따라한 서비스였습니다.

그럼 순수창작이 아닌 싸이월드, 네이버 지식iN은 가치가 없는 서비스일까요? 물론 그렇지 않습니다. 마이스페이스, 페이스북 역시 마찬가지입니다.

문제는 새로운가 아닌가가 아니라 어떻게 조합하느냐에 달려있습니다.

네오위즈도 세이홈피라는 미니홈피를 운영한 적이 있습니다. 그런데 싸이월드 미니홈피는 성공했고, 세이홈피는 실패했습니다. 싸이월드의 1촌은 성공했지만 유사한 개념으로 시작한 식스디그리스는 실패했습니다.

싸이월드 성공의 배경에는 1촌이라는 개념과 미니홈피라는 새로운 서비스, 여기에 아바타와 도토리라는 수익모델이 어우러져 있습니다.

싸이월드를 똑같이 참조했지만 마이스페이스닷컴은 위기를 겪고 있고, 페이스북은 세계에서 제일 잘 나가는 서비스가 됐습니다.

마찬가지로 네이버 지식iN은 성공했지만, 디비딕이나 하우투는 실패했습니다. 네이버 지식iN은 기존의 검색이라는 서비스와 맞물려 ‘지식 검색’이라는 새로운 서비스로 자리매김 했기 때문에 성공할 수 있었습니다. 물론 광고도 엄청난 효과가 있었습니다.

스마트폰의 킬러 애플리케이션으로 자리잡은 카카오톡도 왓츠앱(Whatsapp)을 따라한 것입니다. 왓츠앱은 유료인 반면 카카오톡은 무료로 시작했기 때문에 국내에서 반향을 일으킬 수 있었습니다.

최근 나오는 베끼기 비판도 이런 맥락에서 판단해야 할 것입니다. 다른 서비스를 차용했다는 사실만으로 비판하는 것은 가혹합니다. 모두가 처음에는 벤치마킹에서 시작하기 때문입니다.

창의성이란 독창적인 것만으로 달성되는 것이 아닙니다. 독창성과 함께 유의성이 있어야 창의성이 완성됩니다.

창의적 인터넷 서비스는 기존의 독창적 서비스들을 어떻게 유의미하게 엮어 내느냐에 달려있다고 볼 수 있을 것입니다.

결국 지켜봐야 할 것은 독창성이 아니라 유의성인 것 같습니다.
2011/03/10 17:36 2011/03/10 17:36
사용자 삽입 이미지

어제(17일) 한국인터넷자율정책기구(KISO) 주최로 한양대학교에서 ‘인터넷 상의 허위정보와 표현의 자유, 그리고 자율규제’라는 주제로 토론회가 있었습니다. 지난 연말 전기통신기본법 제47조 제1항 ‘허위통신죄’가 위헌 판결을 받음에 따라, 앞으로 인터넷상의 마타도어나 흑백선전을 어떻게 규제할 것인가에 대해 논의하는 자리였습니다.

토론회의 결론은 인터넷 상의 표현의 자유는 최대한 존중 받아야 하며, 규제는 자율에 맡겨야 한다는 식으로 내려졌습니다.

논점은 두 가지로 정리할 수 있습니다. ▲인터넷 상의 허위정보를 규제할 것이냐 말 것인지 ▲규제를 한다면 새로운 법을 만들지 아니면 KISO같은 민간자율기구에 맡겨야 할 것인지 입니다.

이는 쉽게 판단할 일은 아닙니다. 명백한 거짓말로 혼란을 일으켰을 때는 어떻게 해야 할지 사회적 합의를 이뤄야 하기 때문입니다. 예를 들어 천안함 사태 직후 트위터 등에 ‘예비군을 소집한다’는 거짓 정보를 흘린 사람, 북한의 연평도 포격 상황에서 ‘북한 공격이 아니며 남한의 자작극’이라는 허위 글을 올린 사람을 어떻게 할 것이냐의 문제입니다.

표현의 자유를 강조하는 입장에서는 “거짓말을 할 자유가 있다”고 말합니다. 건국대학교 황용석 교수의 “허위는 부정직한 것이지 불법은 아니다”라는 말이 대표적입니다.

그러나 반대측에서는 허위정보가 국가적 사회적 혼란을 일으킬 수 있기 때문에 규제해야 한다고 생각합니다. 현 정부가 이런 입장입니다. 정부는 지금도 인터넷에 허위정보가 넘쳐, 사회를 혼란스럽게 한다고 보고 있습니다.

만약 허위정보를 규제해야 한다면 어떤 방식이 가장 좋을까요. 현재 정부 및 한나라당은 대체입법을 통해 위헌 판결난 전기통신기본법의 빈 자리를 대신하겠다는 계획인 것 같습니다.  임동수 한나라당 의원 등 여당의원 10명은 4일 ‘전기통신기본법 일부개정안’을 국회에 제출한 바 있습니다.

개정안은 ‘국가안전보장에 중대한 위험을 초래’, ‘자유민주적 기본질서의 파괴와 사회혼란을 유도’, ‘공공복리의 현저한 저해’를 목적으로 허위통신을 하면 처벌한다는 내용을 담고 있습니다.

그러나 이 법의 경우 전기통신기본법이 위헌판결 받았던 요소를 개선하지 않고, 그대로 답습하고 있어서 또 위헌판결일 날 가능성이 높다는 것이 전문가들의 지적입니다. 전기통신기본법이 ‘공익’이라는 모호한 개념으로 국민의 기본권을 제한하기 때문에 위헌 판결을 받았는데, 이 법 역시 ‘공공복리’ 등 명확치 않은 개념을 사용하고 있습니다.

이 때문에 법이 아닌 ‘자율규제’를 통해 문제를 해결해야 한다는 주장이 설득력을 얻고 있습니다. 이날 토론회의 결론도 이 방향으로 내려졌습니다. 여기서 말하는 자율규제란 인터넷 업체들의 자율에 맡기자는 것으로, 인터넷자율정책기구(KISO) 등이 자율적으로 허위정보를 제한하도록 하자는 것입니다. KISO는 네이버, 다음, SK커뮤니케이션즈 등 포털업체들이 구성한 기구로, NHN 김상헌 대표가 의장을 맡고 있습니다.

그러나 이마저도 논란이 있을 수 있습니다. ‘자율’이라는 단어가 긍정적 어감을 주지만, 이는 서비스 제공자의 자율이지 이용자의 자율이 아닙니다. 예를 들어 블로그에 올린 글이 법에 의해 차단되든, KISO의 정책에 의해 차단되는 사용자 입장에서는 자신의 표현의 자유가 제한된 것은 마찬가지입니다.

특히 어느 수준에서 국민의 표현의 자유를 제한할 것인가에 대한 결정권을 법률이 아닌 민간기구에 맡긴다는 것도 어쩐지 이상합니다. 법률은 대의기관인 국회를 거쳐서 결정되기 때문에 사회적 합의를 이룬 것이라고 볼 수 있지만, KISO 정책은 사회적 합의를 이룬 것이라고 보기 힘듭니다. 얼핏보면 KISO에 의회의 권력을 넘기는 것처럼 보이기도 합니다.

또 만약 전기통신기본법 대체 입법을 하지 않는다면, 허위사실이 포함된 인터넷 게시물도 합법이라는 말인데, 합법 게시물을 서비스 제공업체들이 자율적으로 차단하거나 삭제한다는 것도 앞뒤가 맞지 않습니다.

때문에 이 문제는 신중하게 접근해야 할 문제로 보입니다. 미네르바 사건에서 보듯 정권에 의해 법률이 악용될 가능성이 있는 것이 사실입니다. 이 때문에 대체입법에 부정적 기류가 있는 것입니다.

하지만 국민의 표현의 자유를 제한하는 문제이니만큼 최대한 사회적 합의를 이뤄내야 할 것입니다. 이 역할을 민간 단체에 위임할 것인지는 좀더 신중할 필요가 있어 보입니다.
2011/02/18 16:30 2011/02/18 16:30

지난 해 10한국어 스마트폰 음성검색, 최강자는 누구?라는 제목으로 블로그 포스팅을 한 적이 있습니다. 실험을 통해 네이버,다음, 구글의 음성검색 성능을 비교해 본 것이었습니다. 당시 실험 결과 구글의 음성인식 품질이 월등히 뛰어났고, 네이버나 다음은 당장 현실에서 사용하기에는 다소 무리가 있는 품질을 보였었습니다.

이후 3개월이 조금 지났습니다. 각 사는 지난 3개월 동안 음성검색의 품질을 높이기 위해 많은 노력을 해 왔습니다. 음성검색은 스마트폰 시대의 킬러 서비스가 될 가능성이 있기 때문입니다.

과연 네이버, 다음, 구글의 음성검색 품질은 얼마나 향상됐을까요? 다시 실험을 해 봤습니다. 삼성 갤럭시S 휴대폰 3개를 준비해 각 회사의 음성검색 앱을 동시에 실행시켜 음성 키워드를 입력하는 방식으로 실험했습니다. 이 때문에 음성인식 품질뿐만 아니라 음성검색 속도까지 확인할 수 있었습니다.

검색 키워드는 지난 해 10월에 입력한 키워드와 동일한 것으로 실험했습니다. 아래 표를 보시죠.

 

네이버

다음

구글

MC몽 지식인

OK

OK

OK

갤럭시k

OK

갤럭시케익

OK

정아름

OK

정아랑

OK

박세미

OK

OK

OK

궈징징

OK

OK

4징징

김민아

이나

OK

OK

숙청

OK

OK

OK

길학미

OK

OK

정슬기

OK

성스2

OK

보라

OK

OK

OK

 네이버의 경우 김민아김이나로 인식한 경우를 제외하고 모두 정상적으로 검색됐습니다. 다음의 경우 10개 중 3개의 오류를 보였고, 구글은 10개중 2개를 틀렸습니다. 하지만 길학미의 실제 발음이 길항미로 된다는 점에서 길항미도 정상적인 결과로 본다면 구글은 1개만 오류를 보인 것입니다.

1차 실험 결과를 상기해 볼까요?

 

구글

네이버

다음

MC몽 지식인

OK

OK

MC몽 쇼핑몰

갤럭시K

OK

주식시세

소녀시대

정아름

OK

아아아

OK

박세미

OK

박수희

OK

궈징징

저 징징

짱구의진실

터키행진곡

김민아

OK

질리나

OK

숙청

OK

OK

숙종

길학미

지렁이

시지야식

OK

정슬기

OK

주식시세

전선희

보라

TORA

하하

OK


네이버에 3개월 동안 무슨 일이 일어난 것일까요? 경천동지할 발전이 있군요. 1차 실험에서는 10개 중 2개만이 정상적인 결과를 보인 반면 2차 실험에서는 10개 중 9개의 음성 키워드를 제대로 인식했습니다.

사실 네이버는 이 기간동안 음성검색 엔진을 교체했습니다. 국내 음성인식 업체인 HCI랩의 기술을 사용하던 네이버는 지난 해말 자체 음성검색엔진을 개발하고, 스마트폰 음성검색 서비스에 이를 반영했습니다. 그 결과 위와 같은 경이적인 성능 개선을 이뤄냈습니다.

다음의 음성검색도 많이 발전했습니다.50%의 인식률이었던 1차 실험에 비해 2차 실험에서는 70%의 인식률을 보였습니다. 갤럭시K->갤럭시 케익, 정아름->정아랑에서 보듯 정확한 결과는 아니더라도 유사한 검색어를 찾아내는 것을 보니 많은 성능 개선이 있었던 듯 보입니다. 다음측은 한국과학기술원(ETRI)에서 개발한 기술을 이용하고 있습니다.

 

네이버

다음

구글

유재석 결별 통보

OK

모빌

OK

윤도현 소속사 강승윤

OK

OK

OK

고소영 산후조리원

OK

OK

OK

오재원 사망

온스

우지원 사망

OK

황장엽 수양딸

OK

OK

OK

옥수수의 습격

OK

옥수수 습격

옥수수 습격

전주리 방송사고

OK

정주리 방송사고

전 주 방송사고

황장엽 아내

OK

황정음 아내

OK

중국 한글 공정

OK

OK

OK

이수근 말실수

OK

OK

OK

복합 어절 음성 키워드 검색에서도 네이버의 품질향상이 눈에 띕니다. 이번 실험에서도 네이버는 10개중 1개만이 틀린 검색 결과를 보였습니다. 구글도 옥수수 의 습격OK로 보면 90%의 인식률을 보였습니다. 띄어쓰기 오류의 경우 ‘OK’로 볼 수도 있지만, 띄어쓰기 오류가 형태소 분석 오류를 가져오고, 이를 기반으로 검색을 하면 엉뚱한 검색 결과가 나올 수 있기 때문에 파란색으로 표시했습니다. 다음의 경우에는 이번에도 70%의 인식률을 보였습니다.

문장으로 검색하면 어떤 결과가 나올까요. 그래서 도서 베스트셀러 톱10(알라딘 기준)으로도 검색해 봤습니다.

 

네이버

다음

구글

정의란 무엇인가

OK

정의 무엇인가

정의 무엇인가

아프니까 청춘이다

OK

아프니까 청춘 이다

아프 니까 청춘 이다

그들이 말하지 않은 스물 세 가지

그들이 말하지 않 23가지

그들 이 말하지 않 23까지

OK

이상한 나라의 앨리스

OK

이상한 나라 앨리스

OK

종이 여자

OK

구미 여자

OK

리딩으로 리드하라

OK

리딩 으로 리드하라

Reading 으로 리드하라

친구가 되어 주실래요

친구가되어주실래요

친구 되어 주실래요

친구가 되어 주 실 래요

 바보들의 결탁

OK

바보들의 견학

OK

코끼리에게 날개 달아주기

OK

코끼리 에게 날개 달아 주기

코끼리 에게 날개 달아주기

나쁜 사마리아인들

OK

OK

OK


베스트셀러 톱10으로 실험한 결과에서도 네이버는 높은 음성인식률을 보였습니다. 띄어쓰기 오류를 제외하면, 네이버와 구글은 거의 100% 인식률을 보였고, 다음은 종이여자->구미여자’, ‘바보들의 견학->바보들의 결탁등 약간의 오류를 나타냈습니다.

실험 결과를 종합하면 네이버의 경우 3개월만에 구글과의 기술 격차를 없앴음을 알 수 있습니다. 이토록 짧은 기간 안에 구글의 음성인식 기술을 따라잡을 것이라고는 생각치 못했는데, 놀라운 결과입니다.

다음도 아직 네이버나 구글에 비해 뒤지기는 하지만, 3개월 전보다 많은 기술 향상이 있었습니다. 특히 기존 실험에서는 음성 검색 키워드와는 전혀 관계 없는 엉뚱한 키워드를 뽑아내곤 했지만, 이제는 그런 경우는 거의 없습니다.

다만 검색 속도 면에서는 구글이 아직 많이 앞서 있는 듯 보입니다. 아래는 위의 실험을 동영상으로 찍은 것입니다.



모든 키워드에서 구글이 가장 빠른 결과를 보였고, 이어 네이버가 결과를 나타냈습니다. 다음의 경우 구글이나 네이버에 비해 음성인식 시간이 상당히 길다는 약점을 나타냈습니다. 다음은 검색 품질과 함께 검색 속도 개선에도 신경을 써야할 것으로 보입니다.
2011/01/26 13:21 2011/01/26 13:21

사용자 삽입 이미지
네이버의 뉴스캐스트가 도입된 이후 논란이 끊이지 않습니다. 특히 뉴스캐스트 제도로 트래픽이 늘어난 언론사들은 가십성 뉴스로 클릭을 유도한 후, 이상야릇한 광고, 혐오스런 사진 광고로 돈을 벌고 있습니다.

언론사들은 점점 더 품위를 잃고 있고, 사회의 공기라는 역할보다 ‘트래픽 장사꾼’이라는 천박한 모습을 보여주고 있습니다.

이와 관련 미디어오늘의 기자이자 유명 블로거인 정환님이 이에 대한 비판으로 ‘네이버가 언론을 망치고 있다’는 글을 봤습니다.

하지만 이에 대한 책임을 과연 네이버에 물을 것이냐는 다시 생각해 봐야 할 문제인 것 같습니다. 네이버 뉴스캐스트 이후 언론사닷컴들이 타락하고 있는 것은 사실이지만, 이를 네이버 책임이라고 하기엔 네이버로서는 너무 억울할 것 같습니다.

네이버는 각 언론사로 이동할 수 있는 길만 만들어 놓았을 뿐입니다. 그 길 끝에 무엇이 있는지는 언론사 스스로 책임져야 할 수 밖에 없는 문제입니다. 왜 길을 만들었냐고 탓해야 할까요?

흔히 강도의 칼과 요리사의 칼을 비교하곤 합니다. 강도가 칼을 들고 사람을 해쳤다고 해서 대장장이를 원망하는 것은 합리적이지 않습니다.

잠시 기억을 과거로 되돌려 봅시다.

뉴스캐스트 이전엔 네이버 메인 뉴스박스를 네이버 스스로 편집했습니다. 그러나 이는 언제나 구설수의 대상이었습니다. 네이버가 보수화 됐느니 어쨌느니 비판을 받아야 했습니다. 어떤 국회의원은 대선을 앞두고 “네이버는 평정했다”는 발언을 하기도 했습니다. 

인터넷 포털  업체 입장에서는 특정 정치색으로 규정되는 것은 무조건 피해야 합니다. 특히 네이버처럼 대부분의 국내 네티즌이 이용하는 서비스가 ‘보수적’이라고 낙인이 찍히면 비즈니스에 큰 타격을 받을 수 밖에 없습니다. 진보적인 이용자들이 떠나버릴 테니까요. 

네이버가 뉴스캐스트라는 제도를 도입한 것은 정치적 시비를 벗어버리기 위한 어쩔 수 없는 선택이었을 것입니다. 네이버로서는 트래픽을 양보하면서라도 정치적 시비에서 벗어나고 싶었던 것입니다. 

또 “네이버가 언론을 망치고 있다”는 주장이 100% 사실도 아닙니다. 물론 현재 대부분의 언론이 망가지고 있지만, 모든 언론이 다 그런 것은 아닙니다.

예를 들어 ‘블로터닷넷(www.bloter.net)’을 봅시다. 뉴스캐스트가 망쳤다기 보다는 오히려 살린 사례가 될 것입니다. 블로그 기반 IT전문 인터넷 미디어인 블로터닷넷은 네이버 뉴스캐스트 이전에는 사실 IT전문가들만 보는 미디어였습니다. 하지만 뉴스캐스트와 제휴로 대중적 IT미디어로 자리매김했습니다.

그렇다고 블로터닷넷이 일부 일간지나 경제지처럼 연예 찌라시 노릇을 한 것도 아니고, 제목으로 낚시질 한 것도 아닙니다. 비뇨기과, 치과, 성형외과의 외설스럽고 혐오스러운 광고를 달지도 않았습니다. 

이는 뉴스캐스트가 언론을 망친 게 아니라, 언론사가 스스로의 탐욕으로 뉴스캐스트라는 도구를 잘못 이용한 것임을 보여줍니다.

반대로 뉴스캐스트에 들어간 언론만 망가진 것도 아닙니다. 스스로를 ‘대한민국 대표 진보언론’이라고 규정한 모 인터넷 미디어는 네이버와 뉴스캐스트 제휴를 맺지 않았음에도 네이버 인기 검색어가 포함된 찌라시 수준의 연예 기사를 억지로 만들어 트래픽 낚시질을 하고 있습니다.

물론 2009 1월 네이버 뉴스캐스트 이후 온라인 언론 환경이 갈수록 혼탁해지고 있는 것은 사실입니다. 하지만 이는 뉴스캐스트를 악용하는 언론사 스스로의 탐욕 때문이지, 뉴스캐스트 책임이라고 하기에는 무리가 있습니다.

2011/01/13 11:13 2011/01/13 11:13
사용자 삽입 이미지사용자 삽입 이미지
지난 주 NHN의 계열사였던 큐브리드가 독립했다는 소식이 전해졌었습니다. NHN이 큐브리드의 지분을 모두 매각한 것입니다. 이로써 큐브리드는 NHN에 인수된 지 2년만에 다시 홀로서기에 들어갔습니다.(관련 기사 : 큐브리드 재독립…NHN, 지분 매각)

큐브리드는 국내에서 최초의 데이터베이스관리시스템(DBMS)이라고 봐도 무방합니다. 큐브리드의 전신인 한국컴퓨터통신은 1988년 설립된 회사로, 1995년부터 국산 DBMS인 '유니SQL'의 본격 상용화했습니다. 이후 교육행정정보시스템(NEIS) 등에 도입되면서 큰 관심을 끌기도 했었고 2008년 NHN에 인수되면서 오픈소스 전문기업으로 다시 태어났습니다.

이런 상황에서 NHN의 큐브리드 매각 소식은 다소 놀라운 것이었습니다. 물론 비즈니스적 가치로만 본다면 NHN이 큐브리드를 매각한 것은 타당합니다. 그 동안 큐브리드가 큰 이익을 가져다 주지 못했기 때문입니다.

그러나 큐브리드는 단지 매출 및 이익이라는 관점을 넘어 NHN에 많은 기여를 했습니다. 이기적인 독점기업이라는 이미지를 큐브리드의 오픈소스 전략이 상쇄했고, 큐브리드의 기술은 네이버의 많은 서비스에 적용됐습니다.

이 때문에 갑작스러운 NHN의 큐브리드 매각 공시를 접하면서 이를 어떻게 해석해야 할 지 한참 생각해야 했습니다.

일단 NHN측과 큐브리드측은 둘 다 “윈윈(Win-Win)을 위한 매각”이라고 설명합니다. NHN으로부터 큐브리드 지분을 인수한 정병주 대표는 “B2C 서비스 기업인 NHN 울타리 안에서는 큐브리드의 B2B 사업을 펼치기 어려웠기 때문에 독립적인 사업으로 전환하는 것이 옳다고 판단했다”고 말했습니다.

NHN측도 “큐브리드가 독립적으로 사업을 다각화하고, 그 성과를 스스로 재투자하기 위해서는 지분구조 개선이 불가피했다”고 설명했습니다.

일견 타당한 듯 보이는 설명입니다. 하지만 ‘NHN이 국산 중소 소프트웨어 업체의 알맹이만 쏙 빼먹고 껍데기는 뱉어버린 것이 아닌가’하는 의구심을 지울 수는 없었습니다.

지난 2008년 NHN이 큐브리드를 인수한 이후, 큐브리드의 핵심 기술인력은 NHN으로 편입됐습니다. 제품 연구개발은 NHN이, 영업∙마케팅∙기술지원은 큐브리드가 진행한다는 이중화 전략이었습니다.
그 후 2년 NHN은 조용히 큐브리드를 매각했습니다. 큐브리드 제품을 만든 핵심 기술인력은 여전히 NHN에 남아있고, 영업∙마케팅∙기술지원 인력만 홀로 독립한 것입니다.

그 결과 DBMS 제품은 매각 이후에도 NHN의 지적재산권으로 남아있게 됩니다. 그 제품을 계속 발전시켜나갈 연구개발인력도 NHN에 남아있습니다.

새로 독립한 큐브리드(회사명)는 큐브리드(제품명) DBMS의 지적재산권을 보유하지 못한 것입니다. 큐브리드는 앞으로 NHN으로부터 DBMS 제품을 받아서 시장에 공급하고 기술을 지원하게 됩니다. 큐브리드는 일종의 ‘총판’이 되는 것입니다. 20년간 DBMS 개발하고 발전시켜온 것은 큐브리드였는데 말입니다.

만약 NHN이 큐브리드 인수와 매각이라는 과정을 거치지 않고 큐브리드에 있던 인력들을 스카우트했다면 어땠을까요? 아마 ‘인력 빼가기’ ‘독점기업의 횡포’라는 무수한 비난을 들었을 것입니다.

하지만 큐브리드 인수합병 이후에는 ‘NHN이 오픈소스를 지원한다’ ‘NHN의 폐쇄적 마인드를 버리기 시작했다’는 식의 칭찬을 많이 들었습니다.

그 이후 NHN이 조용히 다시 큐브리드를 매각함으로 해서 NHN은 원하는 인력과 기술만 확보했습니다.

NHN은 20년간 기술과 시장을 개척해온 중소기업의 기술만 쏙 빼먹은 것일까요. 아니면 큐브리드의 B2B 비즈니스 활성화를 위해 특단의 대책을 내린 것일까요.
2010/12/29 12:13 2010/12/29 12:13
사용자 삽입 이미지
저는 지금까지 업계나 언론에서 네이버의 폐쇄성을 비판하는 목소리에 대해 크게 동의하지 않았습니다. ‘폐쇄성 자체는 비판의 대상이 아니다’라는 것이 저의 생각이었습니다.

폐쇄성이 고객 만족도를 떨어뜨리거나, 서비스 경쟁력을 저하 시키는 것이 아니라면, 폐쇄성도 하나의 훌륭한 전략이 될 수 있습니다. 일례로 애플은 매우 폐쇄적인 앱스토어 전략을 취하고 있지만, 이를 통해 각종 보안의 위협으로부터 스스로를 지킬 수 있었고, 애플 자체의 생태계를 만들 수도 있었습니다.

네이버도 외부 웹 검색보다는 내부DB검색에 치중하면서, DB 콘텐츠 경쟁력을 강화한 전략이 들어맞았습니다. 이런 전략은 네이버를 국내에서 압도적인 검색시장 1위로 만들었고, 이제는 지금은 다른 경쟁사들도 이 전략을 따라 하고 있습니다.

그런데 지난 15일 출시한 네이버 미(me.naver.com)을 보면서 ‘네이버의 폐쇄적 전략은 여기가 한계구나’라는 생각을 떨칠 수 없었습니다.

지금까지의 네이버의 폐쇄적 전략은 내부 자산을 유출시키지 않기 위한 것이었습니다. 지식IN이라는 막강한 데이터를 홀로 향유하면서, 경쟁자들보다 우월한 검색결과를 보여줬습니다. 이는 네이버 외부보다 내부에 더 많은 콘텐츠와 정보가 있었기 때문에 가능했습니다. 이용자들은 네이버 안에서 뉴스와 블로그, 카페, 지식IN만으로 충분히 만족했습니다.

‘네이버 미’는 네이버 이 같은 장점을 극대화 하겠다는 전략의 산물입니다. 네이버 메일, 카페, 뉴스, 블로그, 지식인, 미투데이, 해피빈 등 네이버라는 울타리 안의 모든 콘텐츠를 한 눈에 볼 수 있도록 하겠다는 서비스입니다.

하지만, 과연 누가 여기서 놀까요? 요즘 재미있는 것은 다 밖에 있는데 말이죠. 특히 요즘은 소셜네트워킹 시대입니다. 친구들은 페이스북에, 트위터에, 싸이월드에 있는데 ‘네이버 미’에서 혼자놀기의 진수를 보여줄 수는 없습니다.

물론 미투데이가 네이버의 계획처럼 성공한다면 킬러 서비스로 자리매김할 수 있지만, 지금으로선 그럴 가능성을 높이 평가하긴 어렵습니다.

많은 언론들은 네이버를 두고 ‘가두리 양식장’이라는 비유를 종종 하곤 합니다. 하지만 사람들은 이제 입맛이 바뀌었습니다. 이제 네이버가 양식한 해산물에 흥미가 떨어진 것입니다. 네이버가 아무리 금이야 옥이야 기른 생선이더라도, 사람들은 맛있는 해산물이 있는 다른 곳으로 갈 수밖에 없습니다.

이에 대한 해결책은 새로운 맛있는 해산물을 기르던가, 아니면 다른 해산물이 내 양식장에 들어 오도록 문을 열어야 합니다. 물론 문을 열면 네이버가 키운 해산물도 밖으로 빠져 나갈 것입니다. 내 해산물들은 그대로 지키고, 다른 해산물만 받아들일 수는 없습니다.

하지만 네이버의 새로운 해산물인 ‘미투데이’는 아직 별 맛이 없고, 외부의 훌륭한 해산물도 네이버에서는 맛 볼 수 없습니다. 네이버 미는 여전히 기존 네이버 양식장의 해산물을 좀더 맛있게 요리하려는 시도에 불과한 것으로 보입니다.

물론 네이버측도 이를 알고 있습니다. 내년 상반기 ‘me구독’ 버튼을 오픈API로 공개해 외부 웹사이트나 게시판 등의 콘텐츠에도 적용하겠다고 밝혔습니다. 이는 RSS(Really Simple Syndication)의 변형일 뿐입니다. 표준인 RSS도 큰 성공을 거두지는 못했는데, 웹사이트 몇 개, 게시판 몇 개 더 구독할 수 있다고 문제가 해결될까요?

지금 네이버에 필요한 것은 친구입니다. 네이버 미 안에서 함께 놀 친구들을 만들지 못하고, 구경거리만 늘어 놓는다고 해서 소셜네트워킹이라는 현재의 거대한 흐름에 동참하긴 어려울 듯 보입니다.
2010/12/17 10:46 2010/12/17 10:46
사용자 삽입 이미지

흔들리는 버스 안에서, 길을 걷는 도중에 인터넷 검색을 하고 싶으실 때 어떻게 하십니까? 흔들리는 버스 안에서는 작은 스마트폰의 터치 스크린을 통해 검색어를 입력하는 것이 불편하고, 이동 중 검색을 위해 가던 걸음을 멈춰서는 것도 싫습니다.

저는 이럴 때 스마트폰 음성검색을 사용합니다. 음성검색은 말로 검색키워드를 입력하는 서비스로, 작은 화면 때문에 글자 입력이 불편한 스마트폰의 단점을 극복하는 데 매우 유용합니다.

현재 국내에서 스마트폰 음성검색 서비스를 내 놓은 회사는 구글, 다음, 네이버입니다. 구글과 다음이 지난 6월 스마트폰에서 음성을 통해 검색어를 입력할 수 있는 애플리케이션을 선보인 이후 최근에는 네이버까지 스마트폰 음성검색 시장에 뛰어들었습니다.

세 회사는 각기 다른 기술을 사용하고 있습니다. 구글은 미국에서 직접 음성인식 기술을 개발했고, 다음은 한국전자통신연구원(ETRI)의 기술을 이전 받았습니다. 네이버는 국내 음성인식 업체인 HCI의 기술을 사용하고 있습니다.

음성검색의 핵심은 음성인식 기술입니다. 음성인식이 잘 되지 않을 경우 아무리 좋은 검색 기술을 보유하고 있어도 쓸모가 없습니다. 의도와 다른 검색결과는 필요가 없으니까요.

그래서 간단한 실험을 해 봤습니다. 세 서비스에 같은 검색어를 말로 입력했을 때 어떤 서비스가 가장 좋은 인식률을 보이는지 테스트 해 봤습니다.

검색 키워드는 네이버와 다음의 인기 검색어를 기준으로 했습니다. 사람들이 가장 많이 검색하는 키워드이기 때문입니다. 네이버 인기 검색어의 경우 사람 이름 등 1어절로 된 경우가 대부분이었고, 다음 인기 검색어는 2~3 어절로 구성된 경우가 많았습니다.

또 하나 객관적인 실험을 위해 음성 키워드는 직접 말하지 않고 녹음을 해서 틀었습니다. 말 할 때 마다 결과가 달라질 수 있으므로, 똑 같은 음성 키워드에 어떻게 반응하는 지 살펴보기 위한 것입니다.

 

구글

네이버

다음

MC몽 지식인

OK

OK

MC몽 쇼핑몰

갤럭시K

OK

주식시세

소녀시대

정아름

OK

아아아

OK

박세미

OK

박수희

OK

궈징징

저 징징

짱구의진실

터키행진곡

김민아

OK

질리나

OK

숙청

OK

OK

숙종

길학미

지렁이

시지야식

OK

정슬기

OK

주식시세

전선희

보라

TORA

하하

OK


위 표는 네이버의 12일 인기 검색어를 테스트 한 것입니다. 구글은 10개 중 7개가 성공해 가장 좋은 음성인식 성공률을 보였고, 다음이 5개, 네이버가 2개 성공시켰습니다.

구글이 실패한 음성키워드도 보라-토라, 궈징징-저징징 등 유사성이 컸지만, 네이버의 경우 갤럭시K-주식시세, 정아름-아아아, 궈징징-짱구의진실 등 유사성이 전혀 없는 음성인식 결과를 보여 실망스럽습니다.

다음의 50% 성공률은 네이버에 비하면 나쁘지 않은 수치이지만, 실생활에서 사용하기에는 어려운 수준이라고 생각됩니다.

 

구글

네이버

다음

유재석 결별 통보

유재석 개별 통보

 피해자가 가해자로

 박지성 결혼정보

윤도현 소속사 강승윤

김도연 소속사 강승윤

 OK

 윤도현 소속사 가수 니은

고소영 산후조리원

OK

 인식실패

 OK

오재원 사망

OK

 OK

 OK

황장엽 수양딸

OK

 OK

 황장엽 샌달

옥수수의 습격

OK

 OK

 옥수수의 자격

전주리 방송사고

안주리 방송사고

 OK

 남규리 방송사고

황장엽 아내

OK? 황장엽 안에

 황장엽 북한지위

 황장엽 안내

중국 한글 공정

OK

 인식실패

 중국 가는 배 농장

이수근 말실수

 이수근 딸실수

 OK

 OK


위는 다음의 11일 일간 인기검색어로 테스트 한 것입니다. 네이버 인기 검색어와 달리 여러 개의 어절로 검색어가 구성돼 있습니다.

여기에서는 네이버가 10개 중 6개를 성공시켜 1위를 기록했습니다. 구글도 5개 성공시켰습니다. 구글의 경우 '황장엽 아내-황장엽 안에'를 성공한 것으로 해석할 경우 네이버와 6개 동률입니다.

그러나 다음은 10개 중 3개 밖에 성공시키지 못해 다어절 키워드에 취약한 모습을 드러냈습니다.

첫 번째 실험에서 최악의 결과를 보여줬던 네이버의 음성인식 성공률이 두 번째 실험에서 비약적으로 올라간 것이 눈에 띕니다.

첫 번째 실험과 두 번째 실험의 차이점이라면, 첫 번째 녹음은 남성인 제가 했고, 두 번째 녹음은 여성이 했다는 점입니다. 상대적으로 첫 번째 녹음한 저의  발음은 어눌한 편이고, 두 번째 녹음한 여성의 발음은 분명한 편입니다.

이 결과를 가지고 어떤 결론을 내릴 수 있을까요. 표본이 적기 때문에 이 정도 실험으로 결론을 내리는 것은 다소 무리이겠지만, 음성인식이 가장 훌륭한 서비스는 구글이라는 점은 분명해 보입니다.

아마 다른 실험을 반복한다고 해도 같은 결과가 나올 것 같습니다.

네이버는 남성보다는 여성, 어눌한 발음보다는 분명한 발음에 더 좋은 성능을 발휘하는 것으로 유추됩니다. 두 번째 실험에서 더 복잡한 음성검색어를 말 했음에도 첫번째 실험보다 더 좋은 인식 결과를 보여줬기 때문입니다. 하지만 첫 번째 실험에서 보듯 어눌한 발음의 남성 목소리에 너무 취약한 모습입니다.

다음의 음성인식은 다소 어중간한 모습을 보여주고 있습니다. 한 단어 검색에는 중간 정도의 결과를 보여주지만, 다어절 검색어는 성능이 급격히 낮아지는 모습을 보여주고 있습니다.

참고로, 이번 실험은 아무 잡음이 없는 조용한 환경에서 녹음기로 진행됐습니다. 표본은 적지만, 같은 환경에서 이뤄진 실험이기 때문에 전혀 의미 없는 결과는 아니라고 생각됩니다.
2010/10/13 13:12 2010/10/13 13:12