[디지털투데이 이병희 기자] “국내 빅데이터 프로젝트의 95%는 프로젝트 중간 혹은 약 50% 프로젝트가 진행된 이후 외부 데이터를 가져온다. 개인 정보보호 관련 측면 때문에 가져온 데이터를 쓰지 못하는 경우도 있지만 사전 준비를 안했기 때문에 외부 데이터가 많이 빠져나가는 경우가 많다.”

문영상 데이터인큐베이터코리아 CTO는 “프로젝트가 끝날 때쯤에는 외부 데이터가 많이 빠져 나가 점점 내부 데이터와 정형 데이터만 남다보니 볼 수 있는 뷰(view)가 과거와 다르지 않다는 문제가 있다”고 설명했다. 이런 현실 때문에 국내 기업들이 빅데이터를 명확히 완료하지 못하고 있다는 진단이다.

문영상 CTO는 "외부 데이터는 프로젝트가 진행되기 전에 법률자문 뿐만 아니라 다양한 시각을 갖고 데이터를 가져와야 하는데, 그런 사전 준비가 안돼 있고 중간에 외부데이터를 끌어오다보니 많이 소실될 수 밖에 없다"고 설명했다.

그는 이어 “현재 국내 빅데이터 프로젝트의 경우는 빅데이터에 대한 이해가 성숙되지 않은 상황에서 진행되는 경우가 있다”면서 “성과를 내기 위한 급급한 요소 때문에 결과물이 과거 정형화된 분석에서 조금 애드온된 수준”이라고 말했다. 이는 국내의 경우 해외보다 빅데이터를 이해하는 시스템 엔지니어와 데이터를 이해하는 데이터 사이언스트가 부족한데다, 프로젝트를 기획하고 완성시키기 위한 리더나 매니저 그룹의 부족 때문이라는 설명이다. 특히 이러한 이유 때문에 프로젝트가 최초 기획한대로 진행되지 않고, 기존 시스템통합(SI)성으로 진행돼 결과물이 만족할만한 수준이 안되고 있다고 문영상 CTO는 전했다.

문영상 데이터인큐베이터코리아 CTO는 국내 빅데이터 프로젝트의 문제점 중 하나로 외부 데이터와의 융합실패를 사례로 설명했다.

그는 "그러나, 국내의 경우 정형화된 데이터 분석이 해외에 비해 앞서 있다면서 데이터와 관련된 체계화된 학습, 그것을 가치로 인정하는 분위기가 성숙되면 해외보다 앞설 것"이라고 말했다.

문영상 CTO는 "해외에서는 데이터를 학습시켜 데이터가 알고리즘과 모델을 만드는 단계로 진화하고 있다"면서 "다양한 모델과 다양한 함수, 알고리즘이 어울려져 사람이 생각하지 못하는 방향까지 서비스가 획기적으로 개선하는 단계로 진화하고 있다"고 말했다.

그는 테슬라 등 포츈 500대 기업 빅데이터를 컨설팅하는 데이터인큐베이터의 방법론의 경우는 어떤 서비스를 발굴하거나 그 서비스를 통해서 이익을 창출하는 측면에서는 프로젝트에 관한 명확한 기획이 돼 있다면서, 국내에서는 아직 그 부분이 명확하지 않은 것 같다고 진단했다.

예를 들어 자율주행자동차를 한다고 하면 국내의 경우는 자율주행자동차에 관한 다양한 인공지능, 알고리즘 활용한다는 측면에서 접근한다. 그러나 해외 같은 경우는 전기를 공급하는 인프라시스템, 인프라 스트럭처에 대한 다양한 빅데이터에 대한 이해를 먼저 한 뒤 자율주행자동차를 얹게 된다는 것. 그러다보니 다양한 시각에서 접근이 가능하고 새로운 서비스를 창출하기가 용이하다는 설명이다.

한편 문영상 CTO는 이달 16일 데브멘토 주최의 ‘빅데이터 세미나’에서 이론상으로 겪어보지 않았던 다양한 에코시스템, 하둡의 문제, 서비스 문제에 대해 설명할 예정이다. 실패사례 5가지, 성공요인 10가지 등에 대해 소개하는 이번 세미나는 행사페이지(https://goo.gl/BQFWpa)에서 신청 가능하다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지