스마트폰에서 귀 역할을 하는 부품으론 마이크가 있다. 하지만 마이크는 항상 켜놓을 수 없다. 모바일 기기는 사용 시간이 중요하고, 배터리 용량은 한정적이기 때문이다. 그렇기에 마이크는 통화나 음성 검색 등 필요할 때만 작동되곤 했다.

2013년 모토로라는 ‘모토 X’라는 스마트폰을 공개한다. 이 제품을 눈여겨봐야 하는 이유는 화면이 꺼진 상태에서도 ‘오케이 구글’이라고 말하면, 화면이 켜지면서 구글 나우가 작동한다는 것이다. 마이크가 항상 켜져 있는 셈이다. 지금은 많은 스마트폰에서 이 기능을 쓸 수 있다.

퀄컴에도 이와 비슷한 기능을 하는 것이 있다. ‘보이스 액티베이션(Voice Activation)’이 바로 그것이다. 마이크를 평소에도 켜놓고 소리를 분석해야 하다 보니 배터리가 사용량이 많을 수밖에 없는데, 퀄컴은 저전력을 염두에 두고 하드웨어 단에서 처리하는 기술을 만든 것. 주목할 부분은 해당 기술이 2011년부터 ‘국내 퀄컴 R&D 센터’에서 만든 것이라는 점이다.

국내 퀄컴 R&D 센터에서 근무하는 김태수 책임 연구원은 “멀티미디어에 강점인 한국의 특성을 고려해 룩(Look)과 리슨(Listen) 분야를 중점으로 연구 개발을 하고 있다”고 설명했다. 한마디로 스마트폰의 눈과 귀를 만들고 있는 것. 보이스 액티베이션은 귀에 해당된다.

그런데 지난 9월 18일, 19일 양일간 미국 샌프란시스코에서 열렸던 퀄컴 개발자 행사인 업링크에서 다소 의아한 시연이 이루어졌다. 음악을 듣고 제목을 찾아내는 기능을 선보인 것. 샤잠(Shazam)의 데이터베이스를 활용해 결과물을 보여줬다.

 

DSC_7220-2

DSC_7221-2

DSC_7223-2

▲ 업링크 2014에서 음악 인식 기능을 시연하고 있다

 

해당 기능은 이미 다양한 앱으로 나와 있다. 많은 사용자가 앱을 통해 거리나 카페에서 흘러나오는 음악의 제목을 찾는다. 본인도 종종 쓰는 기능이다. 앱만으로도 충분해 보이는 이 기능을 왜 퀄컴은 하드웨어 단에서 처리하도록 만들었을까?

시연만 봐선 앱과 동일한 기능으로 보였지만, 사실은 쓰임새가 전혀 다른 기술이다. 앞에서 보이스 액티베이션에 관해 잠깐 언급을 했다. 이 기능은 특정 키워드를 말하면 스마트폰이 동작하도록 해주는 기술이다. 김태수 책임 연구원은 “보이스 액티베이션은 음성인식엔진과 비슷하지만, 배터리 전력을 줄이는 것이 핵심”이라며 “여러 단계에 걸쳐 배터리 사용을 최소화한다”고 말한다.

일단 마이크가 소리를 감지하게 되면, 그것이 음성인지 아닌지를 판단한다. 음성이 아니라면, 마이크는 소리를 그다음 단계로 전달하지 않는다. 만약 음성이라면 다음 단계로 나아간다. 다음 단계에서는 해당 음성이 설정해 놓은 키워드인지 비교한다. 키워드가 맞으면, AP에 전달해 스마트폰을 깨우게 된다. 불필요한 소리를 사전에 차단해 배터리 소모를 줄인 것.

이 때문에 오디오 코덱을 별도로 분리해 기능을 적용해 놓기도 했다. AP에 코덱이 통합되어 있으면, AP 전체가 작동해 배터리 소모가 많을 수밖에 없기 때문이다. 코덱을 분리해 AP는 마지막에 깨우도록 해 배터리 소모를 줄였다.

업링크에 선보인 음악 인식 기능은 보이스 액티베이션 기술을 바탕으로 하고 있다. 마이크는 항시 켜져 있으며, 매번 앱을 실행할 필요없이 스마트폰은 언제 어디서나 주변 음악을 감지해 제목을 찾아 리스트에 추가해 준다. 사용자가 수동적으로 정보를 찾는 것이 아닌, 스마트폰이 능동적으로 정보를 수집하는 셈이다.

 

 

김태수 책임 연구원은 “보통 음악은 시간이 지난 후 생각나는 경우가 많다”며 “이전에 들었던 음악이 갑자기 떠오르면서 제목이 궁금해 지지만 찾을 방도가 없다”고 설명한다. 즉 퀄컴의 음악 인식 기능을 사용하면, 지나간 음악도 스마트폰이 알아서 제목을 찾아 놓기에 쉽게 확인할 수 있다는 뜻이다.

음성 다음으로 시장에서 통할 수 있는 것이 음악이라고 판단했다며, “이용자는 음악을 찾기 위해 매번 앱을 실행할 필요가 없다”고 김태수 책임 연구원은 덧붙였다. 또한 “타사의 기술은 마이크를 켜 놓으면 배터리 소리가 항상 일정하게 이루어지기에 소모가 많다”며 “보이스 액티베이션은 마이크부터 DSP, AP 통합적으로 작동하며, 저전력 상태로 마이크를 켜놓을 수 있다”고 설명했다.

 

불과 몇 년 전만 하더라도 스마트폰 GPS를 켜놓고 쓰는 이는 많지 않았다. 위치 정보의 민감성과 높은 배터리 소모 때문이 주요 원인이다. 하지만 배터리 소모가 줄어들고, 위치 정보를 활용성 서비스의 편리함 덕에 지금은 많은 사람이 이를 활용한다.

스마트폰의 청각 기능은 아직 걸음마 단계다. 하지만 주변 소리를 파악할 수 있게 된다면 스마트폰의 활용도는 한층 더 높아질 것이다. 버스를 탔는데, 스마트폰이 소리를 통해 버스 탑승을 파악하게 되고, 위치 정보와 결합해 버스 노선 정보를 띄워준다면 더욱 정확한 정보를 안내받을 수 있게 된다. 지금과 비교할 수 없을 만큼 더 스마트해질 것은 분명해 보인다.

퀄컴의 음악 인식 기능 상용화는 내년으로 예상된다. 제조사의 의지에 달렸는데, 빠르면 상반기에 만날 수 있을지도 모르겠다.