에스티마의 인터넷이야기 EstimaStory.com

Thoughts on Internet

Posts Tagged ‘voice search

음성검색, 모바일검색의 미래

with 10 comments

지난번에 Droid를 통해서 Google Voice Search를 써보고 그 잠재력에 눈을 떴다고 포스팅한 일이 있습니다.

아이폰에서도 구글모바일앱을 설치하면 음성검색을 할 수 있지만 ‘영어’로만 해야하는 것이고 앱을 찾아서 실행하고 마이크버튼을 누른다음 말을 해야 해서 좀 번거롭다고 생각한 것이 사실입니다.

아이폰에서는 구글 모바일앱을 찾아서 실행한 뒤 화면 위에 보이는 마이크아이콘을 터치해야 합니다. 그런데 트위터를 통해 ‘Tip’을 하나 알게 됐습니다. 구글모바일앱을 실행시킨뒤 그냥 귀에 가져다 대고 말하기만 하면 됩니다. 따로 마이크아이콘을 누를 필요가 없습니다. 음성검색이 전화를 거는 것보다도 쉽다는 것을 알게 된 뒤 구글모바일앱을 아이폰초기화면으로 가져왔습니다. 그리고 갑자기 뭔가 검색할 일이 생기면 사파리를 열어 타이핑을 하는 대신 그냥 귀에 가져다 대고 말하는 버릇이 생겼습니다. (제 영어발음을 ‘테스트’하는 효과도 있어 나름 재미있습니다ㅎㅎ)

그런데 최근 이 ‘음성검색’이 정말 편리하다고 실감하는 일이 자주 생깁니다. 단순하지만 의미심장한 두가지 사례를 소개해드리고 싶습니다.

며칠전에 뉴욕출장을 다녀왔습니다. 맨하탄 한가운데의 Penn Station에 내렸는데 나와보니 택시를 기다리는 줄이 한없이 깁니다. 일단 호텔에 가서 체크인을 해야 합니다만 회사직원이 예약을 해서 저는 어느 호텔인지 모릅니다. 옆에 같이 동행한 회사직원에게 어느 호텔인지 물어봤습니다. 얼마나 먼지 보고 웬만하면 택시말고 다른 방법을 찾으려고요. “Millennium Broadway Hotel”이랍니다. 이런 젠장~ 왜 이렇게 길어. 양손에 짐을 든 채로 택시줄에 서서 아이폰에 이 긴 호텔이름을 버추얼키보드로 입력한다고 생각해보세요(^^)

그래서 그냥 아무 생각없이 귀에 가져다 대고 “밀레니엄 브로드웨이 호텔”이라고 말해봤습니다. 구글이 제 발음을 잘 알아듣기를 기원하면서요. 바로 검색결과가 떠오릅니다.

지금 보스턴에서 다시 검색하니까 이렇게 나오는데 뉴욕에서 검색했을때는 근처에 호텔이 있어서 그런지 지도가 같이 표시됐습니다.

지도옆에 표시된 Direction을 누르고 현재위치에서 호텔까지 가는 최단거리를 구글맵으로 열어보니 걸어서 10여분이면 갈 수 있다는 것을 알게 됐습니다.

옆에 동행한 직원은 제가 음성으로 검색한 것을 모르고 “어떻게 그렇게 빨리 정보를 찾아냈느냐”고 조금 놀라는 표정을 짓고 있습니다. ^^; 나중에 이야기해주니 감탄하더군요.

아이폰으로 음성검색을 할때 구글이 제 위치를 알고 있다는 것도 큰 강점입니다. 현재 위치에서 가까운 곳에 있는 호텔 등을 검색하면 지도를 같이 보여줍니다. 이런 경우 대개 가는 길을 확인하거나 전화를 걸려는 경우가 대부분이지 않습니까. 그 목적에 부합한 결과가 나옵니다. 예를 들어 저희 회사 건너편에 있는 “Doubletree Hotel”을 음성검색해봅니다.

정확하게 제가 원하는 정보가 나옵니다. 전화를 걸려면 번호를 터치하면 되고 가는 길을 확인하려면 ‘Get Directions’를 누르면 됩니다.

Droid와 같은 안드로이드폰에서 구글맵내비게이션을 쓰면 “Navigate to Doubletree hotel”라고 말하면 자동으로 GPS내비모드로 전환됩니다.

또 다른 사례 하나. 어제 집에서 아파트이웃에 사는 한국분들이 모여서 조촐하게 와인를 마시는 시간을 가졌습니다. 이런 저런 이야기를 하는데 한 분이 뉴욕에 가면 “피터 루거”라는 스테이크하우스에 가보라고 강력추천을 하십니다. 세계에서 가장 맛있는 스테이크집이랍니다. 조금 있으면 잊어버릴 것 같아서 어딘가에 메모를 할까 하다가 혹시나 해서 아이폰을 살짝 집어들었습니다. 이야기 도중에 고개를 돌리고 살짝 아이폰에 속삭입니다. “피터 루거” 정확한 영어스펠링은 모르지만 혹시 똑똑한 구글이 찾아주지 않을까 싶은 생각이 들어서요.

나왔습니다.

아이폰을 바로 들어서 말씀하신 분에게 보여드립니다. “여기가 맞나요?” 당연히 맞습니다. ㅎㅎㅎ

갈수록 똑똑해지는 구글. MS나 야후, 어떻게 이런 회사와 경쟁해야 할지 걱정입니다.

마침 MS도 Bing 아이폰앱을 내놓고 음성검색을 지원합니다만 테스트한 결과 인식율이 구글보다 떨어지고 오작동이 아직 많아서 쓸만한 상황이 아닙니다. 빨리 추격하길 기대합니다.


음성검색이 앞으로 모바일검색의 미래를 바꿔놓지 않을까하는 생각이 듭니다. (과연 한국어음성검색은 언제 선을 보일지도 관심거리입니다)

Written by estima7

2009년 12월 24일 at 8:12 오후

모바일웹트랜드에 게시됨

Tagged with , ,

“구글 선생님, 제가 졌습니다.”-음성검색의 가능성

with 16 comments

나 자신 Native English speaker가 아닌 관계로 음성검색의 가능성을 그다지 깨닫지 못했다. 가만보면 미국인들은 전화를 사용할때 음성으로 연락처목록을 검색해 전화를 걸어주는 Voice Dialing기능이 아주 중요하다. 아마 운전을 많이 하는 생활패턴때문에 그런지 모르겠다. 하지만 한국에서는 그다지 음성검색을 사용하지도 않고 보이스메일을 남기는 습관도 없기 때문에 전화를 음성으로 조작한다는데 좀 익숙하지 않은 편이다.

그런데 오늘 아침 우연히 일본의 블로거 유카와씨의 “구글모바일어플의 음성검색이 정말 대단하다“는 포스팅을 읽고 그 잠재력에 대해 다시한번 생각을 하게 되었다.

유카와씨의 이야기는 대략 이렇다.

기본적으로 (일본어) 음성인식기술이 그렇게 훌륭하지않다는 선입관을 가지고 있었다. iPhone 3GS에 기본장착된 음성인식도 그렇게 잘되는 것 같지 않았다. 그래서 구글이 모바일어플에 일본어 음성검색기능을 탑재했다는 이야기를 들었을 때도 별 기대를 하지 않았다. 그러다가 구글블로그에서 자랑스럽게 발표한 것을 보고 한번 직접 테스트해보기로 했다. 우선 “마구도나루도” (맥도널드의 일본식 발음)

어 단번에 찾아지네. 그럼 이번에는 스타벅스를 찾아보자. “스타바쿠스”

역시 잘 찾아진다. 그럼 다음에는 “프론토”(일본의 커피전문점), “프론토 점포” 역시 다 한번에 알아듣고 검색이 된다. 이렇게 잘될 줄 몰랐다. 조금 놀랐다.

그럼 이번에는 내 이름을 한번 검색해보자. “유카와 츠루아키”

아니 내 이름까지도 정확히 알아듣고 결과를 보여주다니!  (이 부분은 좀 놀랍다는…일본인 인명이 쉬운 것이 아닌데. 아마 유명블로거라서 그런 것이 아닌지)

그렇다면 이번에는 “츠부야키 쟈날리스토”를 시험해보자. 이 말은 원래 존재하는 단어도 아니고 내가 맘대로 만든 말이니 못알아들을지도… (지껄이는 저널리스트라는 뜻으로 유카와상이 자기 별명처럼 지어서 트위터에 표시한 말)

우와! 대단하다. 구글선생, 내가 졌습니다. 앞으로 음성검색 열심히 쓰도록 하겠습니다!

여기까지가 유카와씨의 이야기. 사실 많은 일본인들이 별 기대없이 음성검색을 사용해봤다가 비슷한 놀라움을 느꼈을 듯 싶다.

나도 여기(미국)에서 우리 회사 직원들중 아이폰 유저가 “나는 웬만하면 음성으로 검색한다”는 이야기를 듣고 뭐 나와는 별 상관이 없는 일이라고 생각했다. 그런데 이번 음성검색데모와 함께 직접 시험해보니 나도 앞으로는 적극적으로 음성검색을 사용해봐야겠다는 생각이 들었다. 특히 안드로이드폰 Droid를 사용해 보니 초기화면에 검색창과 음성검색 아이콘이 자리잡고 있어 더욱더 음성검색을 많이 쓰게 되는 것 같다.

예를 들어 오늘 운전을 하면서 아이폰으로 Podcast를 듣고 있었다. 그런데 라디오쇼중에 ‘Watershed moment”라는 말이 나왔다. 대충 뜻은 알고 있었지만 한번 정확한 뜻 확인을 위해 검색해보고 싶은 생각이 들었다.

신호에 잠시 정지했을때 Google Mobile App을 실행하고 “Watershed moment”라고 말해봤다.

내가 말을 하면 음성데이터를 순간적으로 Google Cloud에 보내고 분석한 결과를 다시 되돌려준다. 걸리는 시간은 1~2초.

정확히 단어를 인식해서 바로 검색결과를 보여준다. 내용을 사실 열어볼 필요도 없다. 첫번째 검색결과에 나온 것처럼 Watershed moment는 ‘A critical turning point’라는 뜻이다. 이 단어를 터치스크린 키보드를 입력했으면 말로 검색하는 것보다 10배이상 시간이 더 걸렸을 것이다. (운전하면서 그렇게 하기는 너무 위험하다)

특히 아이폰의 특성상 내 현재위치를 알고 있기 때문에 ‘맥도널드’ 등의 레스토랑 상호로 검색하면 현재 위치를 중심으로 가장 가까운 곳부터 표시해준다. 전화번호, Direction등을 터치하면 바로 전화를 걸거나 지도를 볼 수 있어서 더 할 나위없이 편리하다.

물론 음성검색이 100% 정확한 것은 아닌 것 같다. 특히 우리처럼 Native Speaker가 아닌 경우는 아무리 여러번 말을 해도 구글이 못알아듣는 경우가 있긴하다. (그러나 네이티브에게는 아주 친절한 듯 ㅠ.ㅠ)

휴대폰은 사실 말로 입력하는 기계다. 조그만 키보드로 입력하는 기계가 아니다. 사람들이 한번 음성으로 검색하는데 익숙해지기 시작하면 쉽게 버릇으로 자리잡을 것 같다. 점점 많은 사람들이 모바일로 검색을 하기 시작하는데 그렇다면 앞으로 모바일검색의 절반이상은 음성검색으로 이뤄지지 않을까? 운전을 하면서, 길을 걸어가면서 뭔가 궁금한 사람들이 일일이 조그만 키보드로 입력하려고 하지는 않을 것 같다. 그냥 귀에 전화를 가져다대고 궁금한 내용을 말하면 되지 않을까?

음성인식기술은 사실 쉽게 쫒아갈 수가 없는 분야다. 더구나 많은 사람들이 이용하면 할 수록 그 데이터를 통해 인식율을 더 높일 수 있기도 하다. 시장점유율이 높은 회사일수록 더 훌륭한 기술을 축적할 가능성이 높다. 이런 엄청난 기술을 쌓아가고 있는 구글이라는 회사를 어떻게 경쟁해서 이겨야할지… 도대체 몇년뒤의 검색시장은 어떤 모습이 될지. 상상이 가지않는다.

Written by estima7

2009년 12월 15일 at 12:17 오전

음성검색과 비주얼검색, 검색의 새로운 장을 열다.

with 16 comments

구글이라는 회사에는 정말 계속해서 감탄할 수 밖에 없네요. 오늘 오후 바쁜 월요일 일을 대충 끝내고 테크뉴스를 훑기 시작하다가 구글 뉴스때문에 정신이 없었습니다. Realtime Search, Google Goggles, Favorite Places (바코드서치) 등등 경탄스러운 기술들을 한꺼번에 쏟아내서 쫓아가기도 힘들게 만들더군요.

아이폰을 오래 써왔고, 마침 지난주부터 잠시 Droid까지 사용하고 있는터라 이번 구글의 새로운 검색기술 발표가 대부분 모바일과 밀접한 연관을 가지고 있다는 것을 더더욱 실감할 수 있었습니다. 마침 Google Goggles의 경우는 최신 안드로이드폰인 Droid에서 가장 잘 작동되는 것 같아 마음껏 테스트를 해볼 수 있었습니다.

특히 음성검색과 비주얼검색은 앞으로 사람들의 검색의 이용행태를 송두리째 바꿔버릴 가능성이 있다는 생각이 들었습니다.

특히 저는 지난주부터 Droid를 쓰면서 음성검색의 새로운 가능성에 눈을 떴습니다.

Droid의 첫 화면입니다. 위에 보면 검색창이 붙박이로 있죠? 마이크표시를 누르면 바로 음성검색이 가능합니다. 아이폰에서도 구글 모바일앱을 설치하면 음성검색이 가능했지만 Default가 아니어서 별로 사용할 생각을 안했습니다만 Droid의 경우 첫화면에 있어서 자주 시도하게 되더군요. 특히 Google Map Navigation을 사용하면서 그 편리성에 감탄했습니다. 운전하면서 타이핑이 쉽지 않은 관계로 음성으로 찾기를 시도했는데 제 후진 발음에도 생각보다 잘 찾아지더라고요. 아래 비디오를 보시면 이해하실 겁니다.

그래서 오늘은 제 아이폰 첫번째 페이지로 구글앱을 가지고 왔습니다. 몰랐는데 구글앱을 실행시키고 귀에 폰을 가져다대고 말하면 바로 음성인식을 하는군요. 아주 편리합니다.

맨위 왼쪽에서 두번째가 구글앱입니다.

그런데 보니까 구글 음성검색이 일본어도 지원한다는 것이 아닙니까. 영어외의 언어도 지원하는지 몰랐는데 깜짝 놀랐습니다. 더구나 일본어는 음성인식이 어렵지 않을까 생각하던 참이었습니다. (한자어에 워낙 비슷한 발음이 많아서…) 일본어 음성검색 소개 비디오를 보십시오. (일본어기는 하지만)

물론 데모동영상이긴 하지만 일본어음성검색의 완성도가 높아서 사실 깜짝 놀랐습니다. 뭐든지 궁금한 정보를 말하면 알려주는 알라딘의 요술램프같다는 생각도 드네요.  “신주쿠에서 시부야로” 같은 경로검색 같은 것 뿐만 아니라 동영상을 검색하려면 “Youtube”를 넣어서 말한다든지, 사진을 검색하려면 “사진”을 넣어서 말한다든지 하는 요령을 터득하면 말로 뭐든지 검색해낼 수 있을 것 같습니다.

오사카사투리도 알아듣는다든지, “에~또”하는 일본인 특유의 의미없는 말투는 제거하고 인식한다든지, 시끄러운 거리에서도 문제없이 인식한다든지 하는 이야기에는 정말 감탄했습니다. 제 아이폰을 일본어설정으로 바꾸고 테스트해본 결과 제 별로 훌륭하지 않은 일본어발음으로도 충분히 쓸만하다는 사실을 알게됐습니다.ㅎㅎ

거의 아주 정확하게 찾아낸다는 것을 알 수 있습니다.

사실 모바일폰에서 이런 단어를 타이핑하는 것이 아주 번거롭다는 점을 생각하면 대단한 진보이며 앞으로 모든 사람들이 애용하는 기능이 되지 않을까 싶습니다.

구글의 오늘 발표에서는 “현재 영어, 중국어, 일본어 음성검색을 지원하며 앞으로 모든 주요언어를 다 지원할 예정”이라고 밝혔습니다. 특히 구글 번역기술을 이용해 어떤 말을 음성으로 하면 그 말을 해석해 다른 언어음성으로 실시간 변환해 전달해주는 기술도 내년에는 선보일 것이라고 했습니다. 공상과학소설에서나 보던 자동번역기가 등장할 날도 멀지 않은 것일까요?

다음으로 감탄한 것은 Google Goggles라는 이름으로 발표한 비주얼 검색입니다. 수많은 이미지를 인덱싱해서 저장한 뒤 그 Pattern을 기억하고 있다가 어떤 비슷한 이미지를 올리면 매칭해서 그 이미지가 무엇인지 찾아주는 기술입니다. (말이 복잡) 비디오 보세요.

마침 Droid를 가지고 있기에 바로 안드로이드마켓에서 Google Goggles앱을 다운로드받아서 테스트해봤습니다. 우선은 주위에 보이는 별로 안알려진 로고, 글자 같은 것을 찍어보니까 잘 못찾더군요. 그래서 잘 안되는 줄 알았습니다.

집에 와서 든 생각이 인터넷으로 검색해서 나온 사진을 한번 찍어보자는 생각이 들었습니다. 우선 MIT에 있는 Stata센터라는 유명한 건물사진을 검색해서 찍어봤습니다. 남대문사진도 해봤습니다.

잘 찾죠? 웹에 이미 공개되어 있는 사진은 이미 구글이 잘 인덱싱을 해놔서 잘 되는 것이 아닌가 하는 생각이 들었습니다. 그래서 이번에는 제가 예전에 뉴욕 록펠러센터에 올라가서 직접 찍은 센트럴파크사진을 가지고 다시한번 시도해봤습니다.

설마했는데 되서 깜짝 놀랐습니다. 혹시나 해서 우리 아들 데리고 2002년에 캘리포니아 몬트레이에 가서 찍은 사진을 한번 테스트해봤습니다. 앞에 아이의 사진이 있고 뒤에 레스토랑의 모습이 찍혀있습니다. Bubba Gump라는 Seafood체인레스토랑입니다.

헉~ 설마했는데… 몬트레이에 있는 그 레스토랑이라는 것까지 정확히 알려주고 있습니다.

벌써 이 정도가 구현된다면 우리 아들 얼굴을 파악해내서 제가 피카사앨범에 올린 사진과 이미 대조를 끝내서 ‘동일인물’로 파악하고 있지 않을까 하는 생각도 들었습니다. Privacy문제때문에 “절대 안한다”고는 하지만 기술적으로 충분히 가능하다는 것을 보여준 셈이니까요. 피카사의 얼굴인식기능도 갈수록 정교해지고 있고…

어쨌든 농담으로 계속 이야기하던 “구글의 세계정복”이 어떤 의미에서 진짜 가능한 것이 아닐까… 갑자기 등골이 서늘해졌습니다…. ㅎㅎ

마지막으로 Droid를 이용한 Google Goggles 테스트 동영상입니다.

Written by estima7

2009년 12월 8일 at 12:34 오전

Webtrends에 게시됨

Tagged with , , ,