이 글을 마지막으로 넥서스원 포스팅을 마치도록 하겠습니다. 처음에 말씀드렸듯이 며칠 빌린 것이기 때문에 오늘 돌려드려야 합니다. 그리고 블로그는 다시 쉬도록 하겠습니다.


제가 어릴 적 재미있게 봤던 미국 드라마 중에 '전격 Z작전' 이라고 있었습니다. 초등학교(그당시엔 국민학교) 입학하기 전에 봤던 것 같은데 20년도 더 지난 일이라 기억이 잘 나지는 않습니다만, 주인공 마이클 아저씨가 키트라는 자동차에 타서 한마디만 하면 키트 혼자 알아서 운전하고 주인공이랑 대화도 하고 변신도 하고... 아무튼 그당시 어린이들 사이에선 키트가 인기였습니다. 저도 키트 장난감을 구매했던 기억이 납니다.




20년이 지난 지금, 아직까지도 키트같은 인공지능 자동차는 나오지 않았지만 가까운 미래에 반드시 현실로 이루어질 것이라 생각합니다. 기술의 발전 속도는 기하급수적으로 빨라지고 있으니까요. 말 한마디로 TV 채널을 변경하고, 컴퓨터 프로그램을 실행시키고, 각종 전자기기를 켰다 껐다 하고, 실시간 통역기로 외국인과 대화하는 세상이 그리 멀지 않았다고 생각합니다.

구글 음성검색은 이 모든 상상을 현실로 체험할 수 있는 첫 걸음이라 생각합니다. 아직은 부족한 점이 많지만 사용하면 사용할 수록 구글 음성검색의 정확도는 더 높아지게 되어 있습니다. 사용자들의 음성 DB가 계속 축적되기 때문입니다. 그리고 이렇게 쌓인 DB는 다른 음성인식 기술의 토양으로 활용될 것이며, 이는 이 분야의 발전 속도를 크게 앞당길 것으로 보입니다. (이건 그냥 개인적인 생각입니다.)


지난 6월 16일 구글 코리아는 '구글 한국어 모바일 음성검색' 서비스를 런칭했습니다. 그날 간담회에 초대받았더라면 제가 자세한 내용을 알 수 있었을 텐데, 그렇지 못했던 관계로 다른 분들의 후기를 참조하였습니다. 일단 구글 직원분들이 제작한 동영상 하나 감상해보세요.




아무래도 구글 측에서 제작했으니 검색이 잘 되었던 케이스만 골라서 편집했을 것이라고 의심해볼 수 있겠습니다. 따라서 제가 위 동영상에 나온 검색어를 전부 똑같이 검색해봤습니다. 제 목소리가 듣기 거북하시겠지만 ;;; 특별히 신경써서 발음하지 않아도 정확한 음성인식 결과를 보여줬습니다. 그런데 제가 가지고 있는 디카가 옛날 거라 그런지 아니면 제가 다룰 줄 몰라서 그런지, 폰 화면에 초점을 맞추는 게 잘 안되더군요. 흐릿해도 양해 바랍니다.

아래는 테스트 목록입니다.

신사동 맛집
제주도 펜션
박지성 골 동영상
앤디워홀 작품
육개장 맛있게 끓이는 법
달러환율
남아프리카 공화국 수도는
강남 자동차 정비소
샌프란시스코 날씨
신촌 영화관
서울 남산도서관
녹차라떼 칼로리
삼청동 와인





여기까지만 보면 구글 음성검색이 대단한 것이라는 생각을 하게 될 것입니다. 일단 속도도 매우 빠르고 인식율도 매우 높기 때문입니다. 하지만 대단한 것은 분명한데 아직까지 부족한 부분도 있습니다. 첫술에 배부를 수는 없겠지요? 아직 시작한지 한달 밖에 되지 않았기 때문에 문제점들은 앞으로 계속해서 보완해 나가면 될 것입니다.

제가 음성검색을 테스트 해보면서 느낀 문제점에 대해 두가지만 짚어 보겠습니다.

1. 검색에 자주 쓰이는 단어가 아닌 경우 인식율이 떨어진다.
이 문제는 어떻게 보면 장점이 될 수도 있고 단점이 될 수도 있습니다. 예를 들어 삼청동 와인의 경우 상청동 또는 산청동 와인으로 발음해도 삼청동 와인이 검색됩니다. 잘 모르는 단어를 검색했을 때 유저가 찾고 있을 만한 정보를 알아서 캐치해준다는 면에선 장점이 될 수도 있겠지만, 정말 종로구 삼청동이 아닌 용산구 산청동을 찾고 싶었던 사람들에겐 불편함이 될 수 있겠지요.

2. 숫자 인식 문제
예를 들어 '5515번 버스 노선도' 라고 발음하면 '5510 5번 버스 노선도' 라고 인식합니다. 마찬가지로 '501번 버스 노선도' 라고 발음해도 '500 1번 버스 노선도' 라고 인식합니다. 사실 이 검색어는 어차피 쓸만한 검색결과를 보여주지 않습니다만 어쨌든 숫자를 인식하는 방식에 문제가 좀 있다는 말입니다. 그런데 연도는 잘 인식합니다. '2002년 월드컵' 으로 검색하면 그대로 인식합니다. 따라서 5515번, 501번 이라는 말 자체가 구글 검색에 거의 사용되지 않는 말이기 때문에 이런 문제가 발생하는 것으로 추측할 수 있습니다. 그냥 '501번' 이라고 검색하면 '500 1번' 으로 인식하지만 '501' 이라고 검색하면 그대로 '501'을 인식합니다. 그런데 '437번' 이라고 검색하면 정확히 '437번' 으로 인식합니다. 추측건데 500 이라는 말과 1번 이라는 말은 자주 쓰이는 검색어이기 때문에 저렇게 분리해서 인식하는 것이 아닐까 생각합니다.



2010년 7월 14일 현재 구글 음성검색은 넥서스원과 갤럭시 S에 기본 탑제되어 있습니다. 나머지 안드로이드 폰에는 어플을 설치하면 되는데 이게 폰 기종에 따라서 안될 수도 있나봅니다. 아이폰 역시 구글 어플을 설치하면 되는 것으로 알고 있습니다.

아직은 음성검색이지만 앞으로 트위터도 음성으로 트윗을 날릴 수 있는 세상이 오지 않을까 생각합니다. 쿼티자판이 달린 스마트폰이 아닌 이상 타이핑의 번거로움이 매우 큰데, 이를 음성인식 기능으로 대체할 수 있다면 정말 스마트폰 생활이 한층 더 업그레이드 될 것 같습니다. 구글 음성검색은 바로 이 스마트폰 음성혁명의 시발점이 되지 않을까 생각합니다.