사용자 삽입 이미지

흔들리는 버스 안에서, 길을 걷는 도중에 인터넷 검색을 하고 싶으실 때 어떻게 하십니까? 흔들리는 버스 안에서는 작은 스마트폰의 터치 스크린을 통해 검색어를 입력하는 것이 불편하고, 이동 중 검색을 위해 가던 걸음을 멈춰서는 것도 싫습니다.

저는 이럴 때 스마트폰 음성검색을 사용합니다. 음성검색은 말로 검색키워드를 입력하는 서비스로, 작은 화면 때문에 글자 입력이 불편한 스마트폰의 단점을 극복하는 데 매우 유용합니다.

현재 국내에서 스마트폰 음성검색 서비스를 내 놓은 회사는 구글, 다음, 네이버입니다. 구글과 다음이 지난 6월 스마트폰에서 음성을 통해 검색어를 입력할 수 있는 애플리케이션을 선보인 이후 최근에는 네이버까지 스마트폰 음성검색 시장에 뛰어들었습니다.

세 회사는 각기 다른 기술을 사용하고 있습니다. 구글은 미국에서 직접 음성인식 기술을 개발했고, 다음은 한국전자통신연구원(ETRI)의 기술을 이전 받았습니다. 네이버는 국내 음성인식 업체인 HCI의 기술을 사용하고 있습니다.

음성검색의 핵심은 음성인식 기술입니다. 음성인식이 잘 되지 않을 경우 아무리 좋은 검색 기술을 보유하고 있어도 쓸모가 없습니다. 의도와 다른 검색결과는 필요가 없으니까요.

그래서 간단한 실험을 해 봤습니다. 세 서비스에 같은 검색어를 말로 입력했을 때 어떤 서비스가 가장 좋은 인식률을 보이는지 테스트 해 봤습니다.

검색 키워드는 네이버와 다음의 인기 검색어를 기준으로 했습니다. 사람들이 가장 많이 검색하는 키워드이기 때문입니다. 네이버 인기 검색어의 경우 사람 이름 등 1어절로 된 경우가 대부분이었고, 다음 인기 검색어는 2~3 어절로 구성된 경우가 많았습니다.

또 하나 객관적인 실험을 위해 음성 키워드는 직접 말하지 않고 녹음을 해서 틀었습니다. 말 할 때 마다 결과가 달라질 수 있으므로, 똑 같은 음성 키워드에 어떻게 반응하는 지 살펴보기 위한 것입니다.

 

구글

네이버

다음

MC몽 지식인

OK

OK

MC몽 쇼핑몰

갤럭시K

OK

주식시세

소녀시대

정아름

OK

아아아

OK

박세미

OK

박수희

OK

궈징징

저 징징

짱구의진실

터키행진곡

김민아

OK

질리나

OK

숙청

OK

OK

숙종

길학미

지렁이

시지야식

OK

정슬기

OK

주식시세

전선희

보라

TORA

하하

OK


위 표는 네이버의 12일 인기 검색어를 테스트 한 것입니다. 구글은 10개 중 7개가 성공해 가장 좋은 음성인식 성공률을 보였고, 다음이 5개, 네이버가 2개 성공시켰습니다.

구글이 실패한 음성키워드도 보라-토라, 궈징징-저징징 등 유사성이 컸지만, 네이버의 경우 갤럭시K-주식시세, 정아름-아아아, 궈징징-짱구의진실 등 유사성이 전혀 없는 음성인식 결과를 보여 실망스럽습니다.

다음의 50% 성공률은 네이버에 비하면 나쁘지 않은 수치이지만, 실생활에서 사용하기에는 어려운 수준이라고 생각됩니다.

 

구글

네이버

다음

유재석 결별 통보

유재석 개별 통보

 피해자가 가해자로

 박지성 결혼정보

윤도현 소속사 강승윤

김도연 소속사 강승윤

 OK

 윤도현 소속사 가수 니은

고소영 산후조리원

OK

 인식실패

 OK

오재원 사망

OK

 OK

 OK

황장엽 수양딸

OK

 OK

 황장엽 샌달

옥수수의 습격

OK

 OK

 옥수수의 자격

전주리 방송사고

안주리 방송사고

 OK

 남규리 방송사고

황장엽 아내

OK? 황장엽 안에

 황장엽 북한지위

 황장엽 안내

중국 한글 공정

OK

 인식실패

 중국 가는 배 농장

이수근 말실수

 이수근 딸실수

 OK

 OK


위는 다음의 11일 일간 인기검색어로 테스트 한 것입니다. 네이버 인기 검색어와 달리 여러 개의 어절로 검색어가 구성돼 있습니다.

여기에서는 네이버가 10개 중 6개를 성공시켜 1위를 기록했습니다. 구글도 5개 성공시켰습니다. 구글의 경우 '황장엽 아내-황장엽 안에'를 성공한 것으로 해석할 경우 네이버와 6개 동률입니다.

그러나 다음은 10개 중 3개 밖에 성공시키지 못해 다어절 키워드에 취약한 모습을 드러냈습니다.

첫 번째 실험에서 최악의 결과를 보여줬던 네이버의 음성인식 성공률이 두 번째 실험에서 비약적으로 올라간 것이 눈에 띕니다.

첫 번째 실험과 두 번째 실험의 차이점이라면, 첫 번째 녹음은 남성인 제가 했고, 두 번째 녹음은 여성이 했다는 점입니다. 상대적으로 첫 번째 녹음한 저의  발음은 어눌한 편이고, 두 번째 녹음한 여성의 발음은 분명한 편입니다.

이 결과를 가지고 어떤 결론을 내릴 수 있을까요. 표본이 적기 때문에 이 정도 실험으로 결론을 내리는 것은 다소 무리이겠지만, 음성인식이 가장 훌륭한 서비스는 구글이라는 점은 분명해 보입니다.

아마 다른 실험을 반복한다고 해도 같은 결과가 나올 것 같습니다.

네이버는 남성보다는 여성, 어눌한 발음보다는 분명한 발음에 더 좋은 성능을 발휘하는 것으로 유추됩니다. 두 번째 실험에서 더 복잡한 음성검색어를 말 했음에도 첫번째 실험보다 더 좋은 인식 결과를 보여줬기 때문입니다. 하지만 첫 번째 실험에서 보듯 어눌한 발음의 남성 목소리에 너무 취약한 모습입니다.

다음의 음성인식은 다소 어중간한 모습을 보여주고 있습니다. 한 단어 검색에는 중간 정도의 결과를 보여주지만, 다어절 검색어는 성능이 급격히 낮아지는 모습을 보여주고 있습니다.

참고로, 이번 실험은 아무 잡음이 없는 조용한 환경에서 녹음기로 진행됐습니다. 표본은 적지만, 같은 환경에서 이뤄진 실험이기 때문에 전혀 의미 없는 결과는 아니라고 생각됩니다.
2010/10/13 13:12 2010/10/13 13:12

트랙백 주소 :: 이 글에는 트랙백을 보낼 수 없습니다