에스티마의 인터넷이야기 EstimaStory.com

Thoughts on Internet

Archive for 12월 15th, 2009

“구글 선생님, 제가 졌습니다.”-음성검색의 가능성

with 16 comments

나 자신 Native English speaker가 아닌 관계로 음성검색의 가능성을 그다지 깨닫지 못했다. 가만보면 미국인들은 전화를 사용할때 음성으로 연락처목록을 검색해 전화를 걸어주는 Voice Dialing기능이 아주 중요하다. 아마 운전을 많이 하는 생활패턴때문에 그런지 모르겠다. 하지만 한국에서는 그다지 음성검색을 사용하지도 않고 보이스메일을 남기는 습관도 없기 때문에 전화를 음성으로 조작한다는데 좀 익숙하지 않은 편이다.

그런데 오늘 아침 우연히 일본의 블로거 유카와씨의 “구글모바일어플의 음성검색이 정말 대단하다“는 포스팅을 읽고 그 잠재력에 대해 다시한번 생각을 하게 되었다.

유카와씨의 이야기는 대략 이렇다.

기본적으로 (일본어) 음성인식기술이 그렇게 훌륭하지않다는 선입관을 가지고 있었다. iPhone 3GS에 기본장착된 음성인식도 그렇게 잘되는 것 같지 않았다. 그래서 구글이 모바일어플에 일본어 음성검색기능을 탑재했다는 이야기를 들었을 때도 별 기대를 하지 않았다. 그러다가 구글블로그에서 자랑스럽게 발표한 것을 보고 한번 직접 테스트해보기로 했다. 우선 “마구도나루도” (맥도널드의 일본식 발음)

어 단번에 찾아지네. 그럼 이번에는 스타벅스를 찾아보자. “스타바쿠스”

역시 잘 찾아진다. 그럼 다음에는 “프론토”(일본의 커피전문점), “프론토 점포” 역시 다 한번에 알아듣고 검색이 된다. 이렇게 잘될 줄 몰랐다. 조금 놀랐다.

그럼 이번에는 내 이름을 한번 검색해보자. “유카와 츠루아키”

아니 내 이름까지도 정확히 알아듣고 결과를 보여주다니!  (이 부분은 좀 놀랍다는…일본인 인명이 쉬운 것이 아닌데. 아마 유명블로거라서 그런 것이 아닌지)

그렇다면 이번에는 “츠부야키 쟈날리스토”를 시험해보자. 이 말은 원래 존재하는 단어도 아니고 내가 맘대로 만든 말이니 못알아들을지도… (지껄이는 저널리스트라는 뜻으로 유카와상이 자기 별명처럼 지어서 트위터에 표시한 말)

우와! 대단하다. 구글선생, 내가 졌습니다. 앞으로 음성검색 열심히 쓰도록 하겠습니다!

여기까지가 유카와씨의 이야기. 사실 많은 일본인들이 별 기대없이 음성검색을 사용해봤다가 비슷한 놀라움을 느꼈을 듯 싶다.

나도 여기(미국)에서 우리 회사 직원들중 아이폰 유저가 “나는 웬만하면 음성으로 검색한다”는 이야기를 듣고 뭐 나와는 별 상관이 없는 일이라고 생각했다. 그런데 이번 음성검색데모와 함께 직접 시험해보니 나도 앞으로는 적극적으로 음성검색을 사용해봐야겠다는 생각이 들었다. 특히 안드로이드폰 Droid를 사용해 보니 초기화면에 검색창과 음성검색 아이콘이 자리잡고 있어 더욱더 음성검색을 많이 쓰게 되는 것 같다.

예를 들어 오늘 운전을 하면서 아이폰으로 Podcast를 듣고 있었다. 그런데 라디오쇼중에 ‘Watershed moment”라는 말이 나왔다. 대충 뜻은 알고 있었지만 한번 정확한 뜻 확인을 위해 검색해보고 싶은 생각이 들었다.

신호에 잠시 정지했을때 Google Mobile App을 실행하고 “Watershed moment”라고 말해봤다.

내가 말을 하면 음성데이터를 순간적으로 Google Cloud에 보내고 분석한 결과를 다시 되돌려준다. 걸리는 시간은 1~2초.

정확히 단어를 인식해서 바로 검색결과를 보여준다. 내용을 사실 열어볼 필요도 없다. 첫번째 검색결과에 나온 것처럼 Watershed moment는 ‘A critical turning point’라는 뜻이다. 이 단어를 터치스크린 키보드를 입력했으면 말로 검색하는 것보다 10배이상 시간이 더 걸렸을 것이다. (운전하면서 그렇게 하기는 너무 위험하다)

특히 아이폰의 특성상 내 현재위치를 알고 있기 때문에 ‘맥도널드’ 등의 레스토랑 상호로 검색하면 현재 위치를 중심으로 가장 가까운 곳부터 표시해준다. 전화번호, Direction등을 터치하면 바로 전화를 걸거나 지도를 볼 수 있어서 더 할 나위없이 편리하다.

물론 음성검색이 100% 정확한 것은 아닌 것 같다. 특히 우리처럼 Native Speaker가 아닌 경우는 아무리 여러번 말을 해도 구글이 못알아듣는 경우가 있긴하다. (그러나 네이티브에게는 아주 친절한 듯 ㅠ.ㅠ)

휴대폰은 사실 말로 입력하는 기계다. 조그만 키보드로 입력하는 기계가 아니다. 사람들이 한번 음성으로 검색하는데 익숙해지기 시작하면 쉽게 버릇으로 자리잡을 것 같다. 점점 많은 사람들이 모바일로 검색을 하기 시작하는데 그렇다면 앞으로 모바일검색의 절반이상은 음성검색으로 이뤄지지 않을까? 운전을 하면서, 길을 걸어가면서 뭔가 궁금한 사람들이 일일이 조그만 키보드로 입력하려고 하지는 않을 것 같다. 그냥 귀에 전화를 가져다대고 궁금한 내용을 말하면 되지 않을까?

음성인식기술은 사실 쉽게 쫒아갈 수가 없는 분야다. 더구나 많은 사람들이 이용하면 할 수록 그 데이터를 통해 인식율을 더 높일 수 있기도 하다. 시장점유율이 높은 회사일수록 더 훌륭한 기술을 축적할 가능성이 높다. 이런 엄청난 기술을 쌓아가고 있는 구글이라는 회사를 어떻게 경쟁해서 이겨야할지… 도대체 몇년뒤의 검색시장은 어떤 모습이 될지. 상상이 가지않는다.

Written by estima7

2009년 12월 15일 at 12:17 오전