페이지

2017년 11월 3일 금요일

인공지능과 대화형 플랫폼

Deep Learning and Conversation as a Platform

  최근 세종대학교 소프트웨어학과로 옮기고나서 경희대 테크노경영대학원, 계명대학교 글로벌창업대학원등에 특강을 하게되었다. 그 중 일부를 발췌해본다.



인공지능의 진화


 인공지능은 필자가 LG소프트웨어 연구소에 근무한 1990년도에도 연구가 진행중이던 역사가 오래된 분야이다. 그 당시 small talk, Lisp 등의 언어로 AI 를 연구했던 사람들 중에, 오늘날의 신경만기반의 머신러닝으로 명맥을 이어 온 사람을 찾기는 쉽지않다.
 미국의 경우, 코넬대의 로젠블레트박사가 전자장치로 연결된 인간의 뇌를 모방한 퍼셉트론이라는 기계로 논리연산을 처리하는 시도가 있어 주목을 끌었는데, MIT 의 마빈민스키교수가 XOR 연산이 하나의 함수로 해결되지 않는 문제를 제시하면서 이 퍼셉트론이 내포하는 내재적 한계가 부각되어 전체 학계가 앞으로 나아가지 못하는 1차 AI 침체기가 도래하고 미국 정부에서도 연구예산을 삭감하면서 찬바람이 불게된다. 이후 전문가 시스템등으로 산업계의 일시적 부흥이 일지만 이후, 신경망기반의 역전사(backward propagation) 에서 발생하는 경사소멸(gradient descent)로 오차값 산출이 layer 가 멀어질 수록 sigmoid 함수로 인해 값이 소멸되가는 문제가 해결이 안되어서 또다시 2차 인공지능의 암흑기를 맞게된다.






컴퓨터비전분야에서의 획기적 성능향상



  이러한 인공지능이 2012년에 이르러 특히 컴퓨터비전 분야에서 도달할 수 없다고 생각했던 성능의 진전을 보게된다. 2012년 ImageNet 이라는 대회에서 토론토의 제프리힌튼 교수가 이끄는 팀이 37% 의 에러율 감소라는 획기적인 성능 향상을 보이게되면서 이목을 끌게 하였고, 바야흐로 인간이 판별하는 수백만 이미지중에 고양이 사진같은 특정 사물을 판독하는 분야에서 인간과 경쟁하는 여정에 들어서게된다. 여기에 사용된 머신러닝 기술을 Convolution Neural Network(CNN) 기술로 1980년대 후반 얀리쿤교수가 고양이가 TV를 보면서 image 의 edge 가 변할 때, 뇌의 특정 부위가 활성화되는 것에 착안하여 input 이미지를 조각으로 나누어, 이 조각들을 신경망에 태워서 필터를 이용한 edge 의 강화를 반복하여 조각의 이미지가 전체 이미지의 어느 부위의 특징을 나타내는 지를 강조하는 기술을 발표한다. 이 기술은 이후 90년대에 미국의 대다수의 국민들이 사용하는 개인수표의 숫자로 표시하는 수기를 디지털로 판독하는데 크게 기여한다. 



IBM 왓슨의 상용화


   2011년 미국의 퀴즈쇼 Jeopardy 에 출연하여 최고 상금왕과 최다 승리자와 대결하여 우승한 IBM 왓슨 컴퓨터는 몇 년 전에 IBM 딥블루 컴퓨터로 체스챔피언을 물리친 이후, 우리들에게 노출된 인공지능 기술의 현주소였다. 이후 IBM은 이러한 질의 응답 방식의 퀴즈쇼 해답과 같은 방식의 솔루션에서 확장하여 클라우드 기반의 왓슨 API 라고 하는 알고리즘 세트를 API(Application Programming Interface)방식으로 제공하는 개방형 혁신 정책을 펼친다.  퀴즈쇼 당시의 왓슨 API 가 Q&A 라는 기술이었는데, 이러한 규모의 API 가 2017년말까지 50가지의 API 로 확장될 계획을 가지고 있고, 2017년 11월을 기해 이러한 API 들을 무상으로 공개하는 것으로 발표되었다.


최근 기사에서는 한국의 왓슨 사업을 담당하는 SKC&C 에서 일반인들을 대상으로 왓슨 AI 를 이용한 경진대회를 열었는데, 하루만에 마치 레고블록을 조립하는 것처럼 쉽게 수천장의 운동기구 사진에서 원하는 운동기구 사용법을 알려주는 '픽미'라는 솔루션을 개발하였고, 음성으로 선풍기나 가전제품을 조정하는 것을 시연했다고 한다. 이러한 것들이 가능하게 된 것은, 클라우드기반의 PaaS 즉, 개발을 코딩을 몰라드 직관적 사용자인터페이스를 통해 구현하게 하는 기술이 보편화 됨을 의미하고, 이는 아이디어만 있으면 데이터베이스 접속, 챗봇 구현 그리고 인공지능의 알고리즘에 API 로 연결하여 원하는 기능을 불러 사용할 수 있음을 의미한다.

대화형 플랫폼 시대


  2017년으로 진입하면서, 눈에 띄는 현상은 글로벌 IT 기업의 'AI First' 전략 이었다. 그 중에서도 아마존의 알렉사가 CES 에서 선풍적 바람을 이끌었고 Google 의 Assistant, Facebook 의 M 플랫폼 발표, MS 의 메시지 플랫폼, 아마존의 에코 출시 그리고 삼성의 Viv Labs 인수에 따른 빅스비 출시, 네이버의 AI 챗봇인 Clova 발표등의 일들이 줄을 이었다.


이러한 현상이 가속화된 이면에는, 2015년 후반부터 주요 메세지앱이 주요 SNS 앱(App)을 설치 및 사용면에서 앞지르면서 한동안 앱의 부흥을 이끌었던 동력이 메세지앱으로 이동하는 측면에서 AI와 결합되어 대화형 챗봇이라는 모습으로 대중에게 모습을 보이게 된 것이다.

  여기에 음성인식을 기반으로 한 아마존의 알렉사가 음성기반의 장치라는 시장을 열었고 이러한 대화형 플랫폼이 주는 시사점이 시장에 주는 반향은 많은 기업들로 하여금 이러한 대화형 플랫폼이 과연 차세대 플랫폼에 기폭제가 될 것인가에 주목하게 만든것이다.

  App 은 2016년 11월 한달간 미국 스마트폰 사용자의 50%가 전혀 새로운 App 을 다운로드하지 않았다고 한다. 게다가 애플의 경우 94%의 Appstore 매출이 1% 에서 나온다고 하니, 사용자들이 88% 시간을 5개 정도의 App 에 사용한다고 하는 정보가 틀린 것 같지가 않다.

 그보다 App 을 사용하기위해 다운로드하고 다시 불러오고 하는 시간에 비해, 음성기반의 챗봇은 'OK 구글' 혹은 '알렉사' 한 마디로 wakeup 상태로 불러내고 바로 사용이 가능하다.  그리고 무엇보다도, 즉각적이고 개인화된 응답이 불러오는 이점은, 은행권을 중심으로 짜증나는 고객센터 응답을 대체하는 강력한 수요의 기반이 된다.

AI 기반의 음성 장치가 불러올 혁신 


  미국 최대의 사무기기용품 회사인 Staples 는 이러한 AI 기반의 음성장치로 소비자의 사무기기 구매 패턴을 혁신적으로 바꾸어놓은 회사가 될 것이다. 버튼 하나를 누르고 필요한 물품을 말하는 것 만으로 구매가 만족되고 자동으로 주문이 이루어져서, 경쟁사가 보면 소름이 끼칠 것 같은 공급가치사슬의 혁신을 예시하는 동영상을 위의 'Staples' 글짜를 누르면 볼 수 있다.

  이러한 솔루션을 개발하는 데 앞에서 살펴본 바와 같이, 단 몇 일만의 교육으로 일반인들도 쉽게 개발할 수 있다고 하니, AI 가 이제 우리 곁에 일반화(democratizing AI) 된 다는 것이 남의 얘기만은 아닌 것 같다.

  한편으론, 이러한 음성 우선장치(screenless device) 시장에서 벌어지는 고객경험이라는 측면은 또한 몇가지 주요한 시사점을 우리에게 말하고 있다.  2016년 가을 뉴욕 테크크런치에서 viv labs 의 대표가 시연을 하는 내용은 음성만으로 스마트폰을 통해 꽃을 배달하고 호텔을 예약하는 conversation as a platform 의 미래 모습을 설파하고 있다. 삼성이 인수하여 빅스비라고 출시한 갤럭시S8에서는 아직 삼성페이와 결합되어 이러한 자동 결제와 연결되는 상거래까지는 아직 100% 가동 되고 있지 못하지만, 머지않아 이러한 자동 상거래는 현실이 될 것 같다. 알렉사를 통해 반복적으로 구매하는 어느 가정의 상황을 상상해보자.

  알렉사는 거실에 딱하고 버티고 있어서 24시간 주인님이 하시는 음성을 청취하고 있다. 아울러 이러한 과거 주문내역을 통해 주인님의 persona 즉 성향이나 개성을 알렉사는 차곡차곡 쌓아놓고 분석을 하고 있다. 경쟁사 입장에서는 이것은 마치 문지기와 같아서, 이 가정에 하기스 기저귀보다 좋은 팸퍼스 기저귀를 어떻게 저 알렉사를 뚫고 들어가서 알릴 수 있을까 고민하게 만들게 할 것이다.

  왜냐하면 고객님이 자주 사용하시는 주문 웹사이트가 고객님의 "기저귀 1 세트 주문해 줘" 라는 말과 함께, 늘 주문하는 사이트를 알렉사가 불러내어 자동 주문할 것이기 때문이다. 경쟁사는 어쩔수 없이, 보다 선동적인 문구로 찰나의 고객의 마음을 사로잡을 광고문구를 고민하게 될 것이고, 광고주 입장에서는 고객의 단일 표현(utterance)에 대응하는 개인화된 단일 광고 재고(repository)를 보유하고 있다가 온디맨드로 제공해야 한다는 것을 의미한다. 이것은 광고업자의 입장에서는 상상하기 힘든 수지타산이 맞지않는 고난도 작업임에 틀림없다.

  또 한편으론, 설령 알렉사라는 문지기를 뚫고 들어가 광고에 성공했다 치더라도, 그간의 이력을 꽤뚫고 주인님께 추천하는 알렉사에 비해 전후좌우 문맥에 취약한 경쟁사의 광고는 치기어린 헛소리 처럼 주인님의 관심을 끌기에는 역부족일 가능성이 높아서, 이러한 광고에 신물이 나는 주인님은 어쩌면 둘 중에 하나일 거다 - 짜증나는 시도때도 없는 선전성 광고를 참고 견디던지 아니면 아마존의 광고를 배제한 프리미엄서비스를 신청해서 아마존에 매달 일정 회비(미국의 경우 99$) 를 내고 아마존의 관대한(?) 우산속으로 오히려 내발로 걸어들어가던지 말이다.


  이러한 이유로, 지니, 누구, 빅스비, 클로바 등의 국내 음성우선장치들이 가정에 침투하려고 애를 쓰지만, 전세계적으로 벌어지고 있는 플랫폼전쟁의 진정한 승자가 되기위해 치뤄야할 댓가와 전제조건에는 아직 많이 부족한 면이 보인다.