Posts Tagged ‘음성검색’
구글I/O에서 인상적이었던 부분들
오늘(5월15일) 있었던 구글 I/O 컨퍼런스의 내용을 이제야 따라잡고 있다. 그런데 CNET에 올라와있는데 키노트내용 전체 동영상이 4시간55분 분량이다. ㅎㄷㄷ…
그래서 CNET에 올라온 짧은 편집동영상클립을 몇개만 챙겨봤다. 그 중에서 인상적이었던 것을 공유한다.
나는 무엇보다 위 동영상이 인상적이다. 데스크탑 크롬브라우저에서 아예 키보드에 손도 대지 않고 “Ok Google”하면서 음성으로 검색하는 것을 보여준다. (개인적으로 느끼기에) Siri보다 더 잘 알아듣는 음성검색의 성능도 뛰어나지만 자세히 보면 무엇보다도 사용자가 원하는 정보를 간결하게 정돈해서 보여주는 구글의 검색능력을 느낄 수 있다. 이것이 바로 구글의 진정한 강점이다.
마침 데모로 보여주는 산타크루즈 관련 정보는 나도 직접 생활속에서 검색을 많이 했던 내용이라 더욱 피부에 와닿았다. (내가 사는 쿠퍼티노에서 산타크루즈 비치는 30분정도 거리다. 어떤 비치가 좋은지, 식당은 어디를 가야하는지, 길경로는 어떻게 되는지 직접 이리저리 검색을 해봤던 경험이 있다.) 지식그래프(Knowledge graph)와 연동해서 빠른 속도로 정보를 찾아내 나에게 맞게 검색결과를 잘 개인화시켜서 보여주는 능력은 구글경쟁력의 원천이다.
다만 한국에서는 이런 구글검색의 강점을 느끼기는 힘들 것 같다. 개인화 검색, 로컬검색에 강한 구글이 검색할 한글 콘텐츠도 많지 않고 인구의 대부분이 수도권에 집중해서 살고 있기 때문에(?) 한국 인터넷사용자들이 검색결과의 차별화에 별로 신경을 안쓰기 때문이다. 한국에서 강점을 발휘하기가 쉽지 않은 구조다.
구글+의 한층 개선된 UI도 인상적이었다. 특히 사진을 자동으로 분석해서 자동해쉬태그를 달아주는 기능은 구글만이 제공할 수 있는 것이 아닐까 싶었다. Geek, nerd들만을 위한 소셜네트워크라는 비판도 있지만 꾸준히 개선해 간다.
하지만 무엇보다도 구글+에 추가된 사진편집기능이 놀라왔다. 빅 곤도투라 부사장이 자신과 자신의 가족사진을 가지고 보여준 사진 enhance기능은 대단히 훌륭했다. 이건 뭐 포토샵같은 전문 사진 에디팅소프트웨어가 전혀 필요없게 된 것 아닌가. 버벅대는 iPhoto를 쓸 필요가 있을까. 그냥 찍은 사진을 구글로 다 올려버리면 되는 것 아닌가하는 생각도 들었다.
UI가 대폭 개선된 새로운 구글맵도 실제 사용해보면 어떨지 궁금하다. 데스크톱웹과 모바일웹의 통일성을 구현한듯 하다.
뮤직스트리밍서비스인 All Access는 어떨지 모르겠다. 판도라, 스포티파이가 장악하고 있는 영역에 구글이 들어간 것인데 과연 선도업체를 넘어설만한 차별화요소가 있는지 궁금하다. 일단 Trial로 지금 가입해서 음악을 들어보고 있는 중이다. 일단은 판단유보.
키노트발표를 다 본 것은 물론 아니지만 안드로이드에 대한 비중이 상대적으로 적고 오히려 데스크톱웹 중심으로 발표가 이뤄졌다는 점도 흥미롭다. (석찬님의 안드로이드가 위험하다! 포스팅 참고) 구글글래스 이야기가 나오지 않은 점은 조금 의외였다.
마지막으로 래리 페이지의 모습에 감탄했다. 그가 CEO가 되기 전부터 구글사람들로부터 그가 말을 할때 너무 어눌하고 어색하다는 얘기를 들은 일이 있었다. 그래서 CEO가 됐을 때도 그것 때문에 CEO로서의 자질이 떨어지는 것이 아닌가하는 우려도 내부에서 있었다고 한다. 그런데 그게 성대마비증상 때문에 그랬었는지는 몰랐다. 사실 아무런 장애없이 멀쩡한 재벌회장이나 오너, CEO들도 대외적으로 기자나 직원들앞에 나서서 이야기하는 것을 게을리하거나 꺼리는 경우가 많다. 그런데 (세상에 아쉬울 것 하나 없을 것 같은) 구글 CEO 래리 페이지가 이렇게 키노트이벤트에 나와서 30분이나 연설하고나서 청중들로부터 온갖 질문을 받고 성실히 대답하는 모습이 인상적이었다. 오늘 구글의 주가가 급등한 것은 다 이유가 있다.^^
운동하다 검색하기-즉흥검색의 가능성
요즘 아이패드를 가지고 헬스클럽에 가는 재미가 있다. 예전에는 조그만 아이폰화면을 들여다 보느라 눈이 아팠는데 아이패드는 화면이 크고 밝아서 운동하면서 보기에 최적이다.
사실 요즘 헬스클럽 운동기구에는 TV가 붙어있어서 채널을 돌려가면서 시청할 수가 있다. 하지만 나는 수동적으로 TV에서 나오는 것을 그저 보는 것은 별로 좋아하지 않는다. 내가 내가 보고 읽는 것을 콘트롤 할 수 있어야한다.
그래서 한 1시간정도 elliptical machine에서 슬슬 걸으면서 팟캐스트로 다운받아놓은 NBC, CBS, ABC뉴스를 보거나 회사서류, 이메일을 읽거나 미처 못읽은 테크뉴스를 스캔하는 편이다. 물론 아이폰으로 밀린 트윗을 읽거나 RT하기도 한다. (뉴스를 봐야 미국 세상 돌아가는 것을 알 수 있고, 그래야 미국회사를 경영하고 미국사람들과 막힘없이 대화를 할 수 있다. 그래서 열심히 뉴스를 본다. 보다보니 아주 재미있다.)
뉴스를 보다보면 가끔씩 답답한 것이 어려운 단어나 idiom이 나올 때이다. 모르는 말이 나왔을때 기억해뒀다가 나중에 찾아봐야지 하지만 그렇게 되지 않는다. 그럴때마다 바로 누구에게 물어볼 수 있으면 좋을텐데 했다. (말이 쉽지 잘 안된다) 그런데 이제는 아이패드와 아이폰을 함께 가지고 다니니 편리한 조합이 됐다. 아이패드로 보다가 모르면 바로 아이폰으로 찾아보면 되니까.
예를 들어 오늘 ABC World News를 보다가 딱 그런 경우를 만났다. 네브라스카주가 20주이상의 태아의 경우 낙태를 금지하는 법안을 채택한 것을 두고 벌어지는 논란을 다룬 리포트였다.
뉴스도중에 ‘슈네니건‘이라는 단어가 나왔는데 그게 무슨 뜻인지 기억이 안났다. 분명히 예전에 찾아봤는데… (내가 어휘력이 많이 딸린다) 순간 그냥 지나가려다가 “지금 바로 검색해보면 되겠다“는 생각이 들었다.
아이패드위에 놓아둔 아이폰을 집어들고 구글앱을 터치한다음 바로 귀에 전화를 대고 속삭였다. “슈네니건“(뉴스에서 들은 발음을 최대한 비슷하게 따라했다)
(솔직히 타이핑을 해서 검색한다는 것은 이런 경우 상당히 난감하다. 쉬운 스펠링이 아니니까. 또 운동중에 작은 아이폰키보드로 타이핑하는 것도….)
내 말이 끝나자마자 아이폰은 음성데이터를 구글크라우드에 보내서 순간적으로 분석하고 있다. 내 엉터리발음을 제대로 알아먹기를 바랐다. (솔직히 이런 경우 원어민이 아니면 성공율이 높지 않다)
다행히 정확히 찾아주었다! 검색결과만 보면 굳이 사이트를 들어가지 않아도 ‘Shenanigans’가 ‘속임, 사기’ 등의 뜻을 가지고 있는 것을 알 수 있다. 그래도 2번째 Merriam-Webster사전사이트를 터치해보면
아이폰에 최적화되어 있는 사전 항목 페이지가 뜬다. 편리!
참고로 구글서치에서 이처럼 미국인들도 정확히 의미를 알기 어려운 약간 난해한 단어를 검색하면 사전사이트가 자동으로 상위에 나와서 찾기가 편하게 되어 있다. (구글이 직접 사전서비스를 제공하지는 않는다)
어쨌든 모바일시대에는 이같은 ‘즉흥적인 검색‘이 대세를 이룰 것 같은 생각이 든다. 대개는 “나중에 찾아봐야지”하지만 PC앞에 가면 잊어버리는 경우가 많다. 하지만 아이폰, 안드로이드폰 등 항상 인터넷에 연결되어 있는 스마트폰을 사용하면 언제 어디서나 궁금한 점이 있으면 즉각 찾아볼 수 있다. 가까운 곳의 음식점, 서점 등의 로컬정보이외에도 “한국의 인구는?”, “이 단어의 뜻은 뭐지?”, “현대 소나타의 최초 발매연도는?” 등등 갑자기 떠오르는 궁금증을 생각날때 바로 해결할 수 있다.
특히 전화를 걸듯이 귀에 가져다대고 물어만 보면 바로 결과를 찾아주는 음성검색은 더욱 위력을 발휘할 듯 싶다. 그냥 옆에 있는 사람에게 질문하듯이 말해도 답을 찾아주는 검색. (그래서 그런지 미국에서는 여러 단어를 조합한 복합검색의 비중이 날이 갈수록 늘어나고 있다)
그제 업데이트된 구글앱을 아이패드에 설치하자 아이패드에서도 음성검색이 가능해졌다. 앞으로는 랩탑, 데스크탑에서도 음성검색이 가능할 듯 싶다.
이런 구글이 전세계언어를 대상으로 음성검색을 들고 나오면 어떻게 경쟁하는가가 심히 걱정되는 요즘 다음도 음성검색을 준비한다는 반가운 소식. 열심히 준비해서 한국인의 목소리를 더 잘 알아듣는 멋진 검색서비스를 들고 나와주기를 바란다!
참고: 그러고 보니 옛날에도 비슷한 포스팅을 한 일이 있었다. “구글선생님, 제가 졌습니다”-음성검색의 가능성
음성검색, 비주얼검색-검색습관의 변화가 임박했다
요즘 우리가 생각하는 인터넷 검색의 방법이 송두리채 바뀔 것 같다는 생각을 가끔 한다. 내 자신 생활속에서 변화를 느끼기 때문이다.
오늘 아침만해도 프랑스에서 아이폰이 올해 2백만대 가까이 판매됐다는 기사를 맥북으로 읽으며 “프랑스의 인구는 몇명이나 될까”하고 생각했다. 그런데 랩탑에서 브라우저탭을 하나 더 열고 검색하기는 조금 번거롭다는 생각이 들었다. 그래서 자연스럽게 옆에 있는 아이폰을 집어들고 “Population of France”라고 말했다.
너무 쉽다. 사실 서치결과 링크를 클릭해볼 필요도 없이 대략 프랑스의 인구가 6천1백만~2백만이라는 것을 한눈에 알 수 있다. 이런 일에 몇번 익숙해지면 예전의 습관으로 다시 돌아가기 어렵게 된다. 뭔가 궁금할 때는 컴퓨터를 켤 필요없이 그냥 전화에 말하면 되는 것이다.
오늘 음성검색을 많이 쓴다는 우리 회사 매니저 제임스와 이야기하면서 비슷한 이야기를 했다. 제임스 왈 자기의 경우 “음성으로 검색하는 것이 너무 익숙해져서 이제는 신기한 기술이라는 생각도 안든다. 이젠 그냥 일상이다”라고 말한다.
다만 내게 조금 불편한 것은 가끔씩 구글이 내 발음을 잘 못 알아듣는다는 것이다. 내 발음이 부정확해서 그런 것이라고 생각했는데 오늘 마침 말 나온 김에 제임스에게 확인해봤다.
예를 들어 내가 “Bridge School”이라고 말을 하면 구글은 자꾸 “British School”로 알아듣는다. 가끔씩 이렇게 구글이 못알아듣는 단어가 있는데 이게 구글 잘못인지 내 발음의 문제인지 분간이 되지 않는다. 나름대로 정확하게 발음해보려고 노력하는데…
그래서 제임스에게 아이폰으로 “Bridge School”을 찾아보라고 했다. 그러자 그가 대답하길 “British School을 찾아보라고?”라며 나에게 반문하는 것이다! 순간 “헉, 아! 내 발음이 정말 잘못된 것이었구나”하고 자각했다.
제임스에게 시켜서 아이폰으로 검색해보니 구글은 “Bridge School”이라고 정확하게 인식한다. 이번에는 내가 제임스가 시키는대로 “G”발음을 조금 교정한 후에 다시 말해보니까 이번엔 구글이 “Bridge School”로 알아듣는다… ㅎㅎ 감동.
음성인식소프트웨어의 경우 최근에 아이폰앱이 나온 Dragon Naturally라는 제품이 있다. 이것도 아주 뛰어난 음성인식율을 자랑한다.
그러나 제임스는 구글이 더 말을 잘 알아듣는 것 같다는 이야기를 한다. Context를 더 잘 이해하고 음성인식을 하는 것 같다는 것이다. 즉, 한 단어만을 말할때는 좀 인식율이 떨어지지만 한 문장을 말할 경우에는 더 잘 인식한다. 내 경우 “Bridge”라고 한 단어를 말할 경우에는 잘 인식하지 못했지만 “Bridge over troubled water”라고 하면 잘 인식했다.
Cloud라는 구글의 수퍼컴퓨터가 Background로 움직이고 있는 것을 생각하면 당연한 일이 아닐까 싶기도 하다. (하지만 내 경우 아직도 어떤 단어의 경우는 음성검색이 잘 되지 않는다. 다만 이것이 내 발음문제인지, 구글의 문제인지는 확실히 구별이 되지 않는 경우가 많다)
어쨌든 음성검색이 모든 스마트폰에 보편화되기 시작하면 사람들의 검색행동에 큰 변화가 일어날 듯 싶다. 적어도 미국에서는 시간 문제다.
또 한가지 내가 생각하는 검색의 큰 변화는 비주얼서치에서 올 것 같다. 지난주에 뉴욕에서 트위터모임을 가졌다. 그 자리에서 구글의 미키가 자신의 안드로이드폰으로 Google Goggles 시범을 보였다. 주문한 와인의 Label을 카메라로 찍어서 바로 검색한 것이다. 라벨을 카메라로 찍은지 10여초 지나서 구글은 정확하게 와인정보를 찾아주었다. 아래 유튜브비디오도 비슷한 테스트결과를 보여준다.
와인라벨을 보고 이름을 바로 타이핑, 검색해서 찾는 것이 더 편리하지 않느냐는 이야기도 하겠지만 내 경험상 쉽지 않은 경우가 많았다. 엄청나게 많은 와인의 종류와 빈티지를 고려할때 쉽게 검색해내기 어려웠다. 더구나 작은 스마트폰으로는 더 어렵다. 이런 경우 Google Goggles가 큰 활약을 할 수 있다. 그래서 아직은 베타테스트 단계지만 벌써 큰 가능성을 느끼기 시작하고 있다. 아이폰버전으로 빨리 Google Goggles가 나오길 기대한다.
벌써부터 나는 길을 다니면서 뭔가 궁금한 것이 생길때마다 어떤 방법으로 검색할지 고민하기 시작했다. 타이핑이 나을 수도 있고 음성으로 쉽게 찾을 수 있을 것 같기도 하고 잘 모를때는 사진을 찍어 보면 되지 않을까하는 생각조차 한다. 앞으로 몇년 뒤 일반인들의 검색습관이 어떻게 바뀌어갈지 귀추가 주목된다.
사족: 이 포스팅이 벌써 음성+비주얼검색에 대한 내 4번째 포스팅이다. 첫번째 음성검색과 비주얼검색, 검색의 새로운 장을 열다, 두번째 구글선생님, 제가 졌습니다. 음성검색의 가능성 , 세번째 음성검색, 모바일검색의 미래 내가 좀 오버하는 것 아닌가 하는 생각도 든다. 어쨌든 내 자신 음성검색이 앞으로 엄청난 가능성을 가지고 있지 않은가 하는 생각에서 자꾸 언급하게 되는 것 같다.
“구글 선생님, 제가 졌습니다.”-음성검색의 가능성
나 자신 Native English speaker가 아닌 관계로 음성검색의 가능성을 그다지 깨닫지 못했다. 가만보면 미국인들은 전화를 사용할때 음성으로 연락처목록을 검색해 전화를 걸어주는 Voice Dialing기능이 아주 중요하다. 아마 운전을 많이 하는 생활패턴때문에 그런지 모르겠다. 하지만 한국에서는 그다지 음성검색을 사용하지도 않고 보이스메일을 남기는 습관도 없기 때문에 전화를 음성으로 조작한다는데 좀 익숙하지 않은 편이다.
그런데 오늘 아침 우연히 일본의 블로거 유카와씨의 “구글모바일어플의 음성검색이 정말 대단하다“는 포스팅을 읽고 그 잠재력에 대해 다시한번 생각을 하게 되었다.
유카와씨의 이야기는 대략 이렇다.
기본적으로 (일본어) 음성인식기술이 그렇게 훌륭하지않다는 선입관을 가지고 있었다. iPhone 3GS에 기본장착된 음성인식도 그렇게 잘되는 것 같지 않았다. 그래서 구글이 모바일어플에 일본어 음성검색기능을 탑재했다는 이야기를 들었을 때도 별 기대를 하지 않았다. 그러다가 구글블로그에서 자랑스럽게 발표한 것을 보고 한번 직접 테스트해보기로 했다. 우선 “마구도나루도” (맥도널드의 일본식 발음)
어 단번에 찾아지네. 그럼 이번에는 스타벅스를 찾아보자. “스타바쿠스”
역시 잘 찾아진다. 그럼 다음에는 “프론토”(일본의 커피전문점), “프론토 점포” 역시 다 한번에 알아듣고 검색이 된다. 이렇게 잘될 줄 몰랐다. 조금 놀랐다.
그럼 이번에는 내 이름을 한번 검색해보자. “유카와 츠루아키”
아니 내 이름까지도 정확히 알아듣고 결과를 보여주다니! (이 부분은 좀 놀랍다는…일본인 인명이 쉬운 것이 아닌데. 아마 유명블로거라서 그런 것이 아닌지)
그렇다면 이번에는 “츠부야키 쟈날리스토”를 시험해보자. 이 말은 원래 존재하는 단어도 아니고 내가 맘대로 만든 말이니 못알아들을지도… (지껄이는 저널리스트라는 뜻으로 유카와상이 자기 별명처럼 지어서 트위터에 표시한 말)
우와! 대단하다. 구글선생, 내가 졌습니다. 앞으로 음성검색 열심히 쓰도록 하겠습니다!
여기까지가 유카와씨의 이야기. 사실 많은 일본인들이 별 기대없이 음성검색을 사용해봤다가 비슷한 놀라움을 느꼈을 듯 싶다.
나도 여기(미국)에서 우리 회사 직원들중 아이폰 유저가 “나는 웬만하면 음성으로 검색한다”는 이야기를 듣고 뭐 나와는 별 상관이 없는 일이라고 생각했다. 그런데 이번 음성검색데모와 함께 직접 시험해보니 나도 앞으로는 적극적으로 음성검색을 사용해봐야겠다는 생각이 들었다. 특히 안드로이드폰 Droid를 사용해 보니 초기화면에 검색창과 음성검색 아이콘이 자리잡고 있어 더욱더 음성검색을 많이 쓰게 되는 것 같다.
예를 들어 오늘 운전을 하면서 아이폰으로 Podcast를 듣고 있었다. 그런데 라디오쇼중에 ‘Watershed moment”라는 말이 나왔다. 대충 뜻은 알고 있었지만 한번 정확한 뜻 확인을 위해 검색해보고 싶은 생각이 들었다.
신호에 잠시 정지했을때 Google Mobile App을 실행하고 “Watershed moment”라고 말해봤다.
내가 말을 하면 음성데이터를 순간적으로 Google Cloud에 보내고 분석한 결과를 다시 되돌려준다. 걸리는 시간은 1~2초.
정확히 단어를 인식해서 바로 검색결과를 보여준다. 내용을 사실 열어볼 필요도 없다. 첫번째 검색결과에 나온 것처럼 Watershed moment는 ‘A critical turning point’라는 뜻이다. 이 단어를 터치스크린 키보드를 입력했으면 말로 검색하는 것보다 10배이상 시간이 더 걸렸을 것이다. (운전하면서 그렇게 하기는 너무 위험하다)
특히 아이폰의 특성상 내 현재위치를 알고 있기 때문에 ‘맥도널드’ 등의 레스토랑 상호로 검색하면 현재 위치를 중심으로 가장 가까운 곳부터 표시해준다. 전화번호, Direction등을 터치하면 바로 전화를 걸거나 지도를 볼 수 있어서 더 할 나위없이 편리하다.
물론 음성검색이 100% 정확한 것은 아닌 것 같다. 특히 우리처럼 Native Speaker가 아닌 경우는 아무리 여러번 말을 해도 구글이 못알아듣는 경우가 있긴하다. (그러나 네이티브에게는 아주 친절한 듯 ㅠ.ㅠ)
휴대폰은 사실 말로 입력하는 기계다. 조그만 키보드로 입력하는 기계가 아니다. 사람들이 한번 음성으로 검색하는데 익숙해지기 시작하면 쉽게 버릇으로 자리잡을 것 같다. 점점 많은 사람들이 모바일로 검색을 하기 시작하는데 그렇다면 앞으로 모바일검색의 절반이상은 음성검색으로 이뤄지지 않을까? 운전을 하면서, 길을 걸어가면서 뭔가 궁금한 사람들이 일일이 조그만 키보드로 입력하려고 하지는 않을 것 같다. 그냥 귀에 전화를 가져다대고 궁금한 내용을 말하면 되지 않을까?
음성인식기술은 사실 쉽게 쫒아갈 수가 없는 분야다. 더구나 많은 사람들이 이용하면 할 수록 그 데이터를 통해 인식율을 더 높일 수 있기도 하다. 시장점유율이 높은 회사일수록 더 훌륭한 기술을 축적할 가능성이 높다. 이런 엄청난 기술을 쌓아가고 있는 구글이라는 회사를 어떻게 경쟁해서 이겨야할지… 도대체 몇년뒤의 검색시장은 어떤 모습이 될지. 상상이 가지않는다.