티스토리 뷰

728x90
반응형
BIG

 

 

 

5G 인공지능-생활 속으로 스며들게 될 얼굴인식

 

더 나아가 가까운 미래에는 경찰들이 스마트폰이 아닌 다른 디바이스를 하나 들고 다닐 것이다. 그것은 경찰청 서버와 직접 연결되는 인공지능 카메라인데, 사람들의 얼굴을 비추게 되면 등록된 범죄자인지 확인하는 카메라이다. 이 카메라를 활용해 경찰은 미아도 쉽게 찾을 것이다. 아이들 잃어버린 엄마는 본인이 보유한 사진을 경찰청의 특정 사이트에 업로드할 것이고, 이 사진을 바탕으로 카메라를 통해 실종 신고된 아이들을 찾아낼 수 있을 것이다. 얼굴인식은 이미 우리 삶 속에 녹아들고 있다. 이는 어려운 기술이 아니라서 더 욱 많은 곳에 응용되고 있다.

 

고성능 CCTV는 움직이는 범인을 식별할 수 있을 만큼 기술이 발달되었다. 결제도 얼굴인식을 통해 가능해질 만큼 우리에게 다가온 이미지 인식을 생활 속으로 녹아들 것이다. 사진뿐이 아니라 동영상도 마찬가지이다. 동영상은 여러 개의 이미지 집합으로 이루어져 있어서 동영상 속의 이미지는 기존에 저장된 사진 이미지와 비교 분석이 가능하다. 이런 동영상 분석은 기존 사진 이미지 매칭과는 파괴력이 다르다.

확인할 사진 이미지와 측정 이미지가 필요한 게 아니라 동영상 속의 특정 이미지도 

쉽게 판독될 수 있기 때문이다.

이미지 매칭 정확도는 95-97%에 도달했을 만큼 이미 기술적으로는 사람 눈의 정확도와 비슷하다. 사람이 직접 보고 판단해야 했던 단순작업 분야들에서 새로운 서비스가 펼쳐질 것이다.

 

 

인공지능 스피커의 춘추전국시대

 

세 번째는 이미 일상으로 파고든 인공지능 스피커이다. 집과 스마트폰 안으로 소리 소문 없이 스며들고 있는 지니, 아리아, 알렉사, 시리, 빅스비, 클로바 등이 그것이다.

잊혀져가던 스피커가 인공지능을 만나 다시 뜨겁게 조명받고 있는데, 인공지능 기술 중 인식기술과  자연어 처리기술을 결합시켰다.

인공지능 스피커는  사용자가 말하는 음성을 문자로 변환하여 변환된 문자에서 사용자의 명령을 인지하고 인지된 내용을 바탕으로 그에 걸맞는 행동을 하게 된다.

결국 첫 부분인 음성인식 부분과 두 번째 단계인 자연어 처리 과정이 모두 뛰어나야 시장에서 인정받을 수 있다.

음성인식 부분은 결국 사용자가 말한 내용이 어떤 단어로 이뤄져 있는지를 찾아야 하며 이는 단어 빈도 및 언어 모델 그리고 확률 등을 통해 개선되는 것이다.

 

이 시장에 가장 먼저 뛰어든 기업은 아마존이다. 아마존은 에코, 에코닷, 아마존탭을 출시하며 알렉사라는 단어를 고유명사로  둔갑시켰다. 구글 역시 구글 어시스턴트를 탑재시킨 구글 홈을 잇따라 출시했다. 이후 애플의 홈팟이 소개되었는데 실제 출시는 2017년 12월로 예정되어 있다. 아이폰에 탑재되었던 시리가 홈팟에 탑재되며 다양한 연동 서비스가 기대되는 상황이다.

중국의 샤오미는 인공지능 스피커를 저렴한 가격에 내놓으며 인공지능 스피커 시장에서 가격 파괴에 나섰다. 누구나 가볍게 구매해서 사용해볼 수 있는 인공지능 스피커의 서막인 것이다. 페이스북은 인공지능을 탑재한 디스플레이를 준비 중이며, 수많은 ICT업체들이 이 시장에 도전장을 내밀고 있다. 흡사 아이폰이 처음 출시되던 그 열광에 비할 수 있는데, 아직 한계는 분명 존재한다.

 

 

국내에서도 KT의 기가지니와 SKT의 누구가 경쟁을 펼치고 있으며, 카카오의 카카오미니와 네이버의 클로바가 이 시장에 참여했다.

KT의 기가지니는 셋톱 박스 형태로 공급되고 있는데 2017년 말까지 50만대를 목표로 뛰고 있고, SKT 누구도 이에 못잖은 인기를 얻고 있다.

네이버 클로바는 초도 물량이 30분 만에 매진되었을 만큼 시장의 관심도가 높은 편이고, 카카오미니는 카카오톡으로 오는 메시지를 스피커를 통해 커뮤니케이션하는 형태라서 파괴력이 있는 상황이다.

 

하지만 우리는 꼭 기억해야 할 사실이 있다. 영화 <허HER>(2013)에서 보았던 인간과 교감 가능한 인공지능은 아직 멀었다는 것이다. 아니 가볍게 대화하는 인공지능 역시 아직 개발이 쉽지 않다. 그들을 아주 한정된 분야로 좁혀야 제대로 된 성능이 발휘된다. 이는 이미 소프트뱅크를 통해 우리는 봐왔다. 그들의 멋진 로봇인 '폐퍼'는 아직은 인간과 간단하면서 자연스러운 의사소통조차 어렵다.

 

 

 

아무리 외관을 인간과 비슷하게 만들지라도 한정된 분야를 벗어나면 소통에 문제가 생기는 것이다. 이는 인공지능 스피커에도 그대로 적용된다.

그들에게 던져진 질문은 이미 칸막이로 정제된 형태이다. 음악 선택과 작동에 연관된 

명령어들, TV와 연동된 명령어들, 그리고 이미 깔린 앱들을 작동하거나 집안 조명, 다양한 전자기기들 작동하는 것으로 한정되는 것이다. 비록 "나 우울해"라는 질문에 그들이 멋진 답변을 내놓는다 하더라도 아직 인간은 그 기술에 감동할 수가 없다.

 

 

 

 

728x90
반응형
LIST
댓글