지능정보시스템학회 기조연설
내일 12월 7일 서울대학교 수펙스 경영관에서 지능정보시스템 추계학회에서 "빅데이터 세상을 바꾸다"라는 주제로 기조연설을 하는 영광을 얻었다. 바로 앞에는 엑센츄어코리아의 박영훈대표께서 "기업가치제고를 위한 빅데이터 활용방안"이라는 기조연설을 한다.
이번에는 IBM 의 Academic Initiative 에 대해서도 얘기하려고 한다. 2011년 5월 맥킨지의 New Global Institute Report 에 의하면 2018년까지 분석전문가가 미국에서만 14~19만명이 모자를 것으로 예상하고 있다. IBM 에서는 분석의 폭넓은 범위를 감안할때, (예컨데 낮은 단계인 서술적 분석부터, 예측적 더 나아가 규범적(prescriptive)인 단계까지) Service Science, Smarter Planet, 분석 및 산업적 지식을 통합할 수 있는 넓고 깊은 T-shaped 소양을 가진 탤런트를 육성하기 위하여 그동안 IBM 채용해오던 학교의 범위를 넘어 200개가 넘는 전세계 대학들과 접촉하여 현재 30개가 넘는 대학들이 계약을 체결하였고 향후 NorthWestern Engineering 대학등 추가적으로 대학들이 계약될 예정이다.
Streaming Computing
아울러 Data at Rest 와 Data in Motion 이 양쪽 영역에서의 분석을 통해 새로운 비즈니스 기회를 찾는 사례들을 공유하려고 한다. 이렇게 소위 Streaming Computing 이라는 기술을 통하여 실시간으로 날라오는 비정형데이터들을 Streaming Processing Language 이라는 언어를 통하여 메모리상에서 여과, 분류, 매팅을 수행하고 조건에 맞는 데이터만 저장함으로써 막대한 데이터를 유지하지 않는 비용절감 대책의 새로운 분석 기술이 등장하고 있다. 즉 전통적 컴퓨팅은 디스크에 저장된 정보 발견 및 분석인데 반해, 스트리밍 컴퓨팅은 움직이는 데이터의 분석으로 저장되기 전에 이루어지는 특징이 있다.Social Media Micro-Segmentation 과 실시간 상관관계
IBM 의 Infosphere Streams 를 통하여 실시간 움직이는 데이터를 분석하고 또한 Infosphere Big Insights 를 통하여 저장된 데이터를 분석하여 Streams 과 BigInsights 의 공통분석 인프라를 통한 진보된 텍스트분석, 실체(entity)통합 과 예측 모델링이 가능하다. 즉 SNS 에서 발생한 어느 event 에 대해 회사내에 저장된 정보와 entity resolution 을 통해 SNS 상의 event 인물과 회사내의 정보의 사람과 동일인 인지등을 찾아낼 수 있다. 즉 IBM 은 움직이는 데이터와 저장된 데이터 양쪽의 정보를 분석할 수 있는 공통 분석 인프라 이 양쪽을 모두 지원할 수 있는 기술적 역량을 갖추고있다.
IBM Machine Learning 기술
IBM 은 항공으로 찍은 사진들로 부터, 예를 들면 스키를 타는 장면을 기계에 훈련시키면, 정확히 스키타는 장면을 분별해 내는 기술을 개발한 바 있다. 아울러 1000 개의 MP3 곡중에서 'zero' 라는 단어가 들어간 음악을 찾아낼 수 있다고 한다. 이러한 기술은 콜센터의 녹취된 내용등에서 어떤 특정 단어가 녹음 된 레코드를 찾아낼 경우에 유용하게 사용될 수 있다.***여기에 포스팅한 내용은 개인 차원의 것이며, IBM의 공식적인 입장, 전략, 의견을 반드시 대표하는 것은 아닙니다