데이터가 디지털로 변신하고 현대 환경에서 위상을 갖추는데 실로 많은 희생이 뒤따랐다. 손으로 써서 기록되던 데이터가 지금은 자동으로 생성되고 여러 곳에 저장된다. 데이터는 손쉽게 가공되어 파생 데이터를 만들고 관심있는 곳에서 공유된다. 구하기 어려운 데이터라면 가치를 계산해서 사고파는 세상이 요즘이다. 전세계적으로 데이터에 대한 관심이 높아지면서 데이터 거래소, 데이터 전담 정부 기관, 데이터 관련 법 제정 등이 잇따르고 있다.

김동철 티맥스소프트 대표
김동철 유비케어 사외이사

무엇이 데이터인가? 데이터의 범위는 어디서부터 어디까지 인가? 이러한 기본적인 질문이 가능한 이유는 답도 기본적이기 때문이다. 현실과 똑같은 디지털 트윈(Digital Twin)시대에선 모든 것이 데이터이다. 디지털로 표현 가능한 한계가 사라진 지금 슈퍼컴퓨터를 능가하는 양자 컴퓨터가 나와줘야 감당할 만큼 데이터 증가속도는 가히 폭발적이다.

디지털 지문(Digital Fingerprinting), 디지털 족적(Digital Footprint)이란 용어들이 심심치 않게 등장하고 미치 누구나 아는 것처럼 통용되고 있다. 오래전의 수사영화나 드라마에 보면 형사가 돋보기나 붓을 들고 범죄 현장에서 지문을 채취하는 장면이 나온다. 디지털 정보를 주고 받을 때도 지문같은 여러 흔적들이 남는다. 지금도 집에서 사용하고 있는 소프트웨어가 불법 복제물이라면 언젠간 걸릴지 모르는 디지털 지문이 존재한다는 것을 알아야 한다.

디지털 족적은 사람의 실제의 동선을 파악하는 것은 물론 인터넷을 포함한 가상의 공간에서 접속한 동선을 뜻한다. 영화 서치(Search, 2017)에서는 사라진 딸을 찾기 위해 아버지가 딸의 컴퓨터에 남겨진 SNS 등을 보고 추적을 한다. 이글을 읽는 독자들도 디지털 족적을 하나 남기고 있는 중이다. 이러한 개인들의 흔적을 지워주는 유료서비스도 생겼다.

한때 데이터에 관심 있는 이들은 비정형 데이터에 대한 의문이 많았다. 지금은 사정이 달라졌다. 복잡한 문장을 이해해서 데이터로 만드는 기술은 인공지능이 담당한다. 당장은 인공지능이 초보적이어서 수준이 떨어질 지라도 언젠간 해결이 가능할 것이다. 데이터를 구성하고 이해하는 과정에서 실제 데이터보다 많이 생겨나는 것은 데이터를 설명해주는 메타 데이터이다. 데이터의 데이터라고 한다.  이러한 메타 데이터의 데이터 베이스가 풍부하다면 인공지능의 해석 능력은 특정분야에서 인간을 초월하는 단계도 올 수 있을 것이다. 실로 모든 것을 데이터화 할 수 있는 기술적 기반이 마련된 셈이다.     

이미 데이터는 사고 파는 대상이 된 지 오래다. 빅데이터 분석을 위해 포털 SNS 데이터베이스를 사려고 하면 수십억원이 들 수도 있다. 장기간의 기상 데이터도 필요하다면 돈 내고 사야 한다. 해외 논문도 유료로 검색하고, 취직하고 싶은 회사의 정보도 유료다. 궁금한 게 많아질수록 돈이 많이 든다. 거꾸로 그러한 비즈니스를 직접 경영하는 것도 가능하다. 데이터를 모으는데 뛰어난 아이디어와 기술을 가지고 있다면 충분히 승산이 있다. 여러분들은 스마트폰에 있는 앱들 중 몇개에 자신의 정보를 주고 있는가? 그런 정보들이 모여서 새로운 시장에 대한 이해가 생기게 되고, 투자자들이 모여들고, 결국 기업의 가치를 인정 받아 돈으로 환산되게 된다.

디지털과 데이터 관련 기술은 빠르게 진화하고 있지만 관련 법 제정 등의 사회적 규약은 상당한 시차를 두고 그것도 보수적으로 따라가기 마련이다. 그러는 사이에 개인정보 유출, 해킹 그리고 인터넷상에서 각종 범죄 행위가 활개를 치고 있다. 스마트한 젊은이들은 인터넷에서 디지털 지문과 디지털 족적을 남기는데 불편함이 없다. 인터넷상에서 접근 권한에 대한 자유가 보장되므로 범죄 도구, 폭탄제조, 범죄 모의 등의 데이터들이 무방비 상태로 널려 있어 사고의 위험성이 실제 사고로 이어지기도 한다. 데이터가 너무 많아서 생기는 반대급부겠지만, 그럼에도 인류가 발전하는 긍정적인 부분이 더 많다고 생각한다.

개인들은 알지 못하는 사이에 본인의 데이터가 유료로 유통되고 있다는 사실을 알아야 한다. 금융권에서는 개인 신용을 평가하기 위해 정부가 허락한 신용평가 회사에 신용 평가 조회를 한다. 갑자기 실직을 해서 소득이 증명이 되지 않는다면 신용도가 하락하고 신용카드 발급에 문제가 생기며, 은행에서의 대출에도 제약이 생긴다. 재산을 증명할 수 있는 부동산이나 은행의 잔고 증명이 없다면 보증도 설 수 없다. 이런 내용은 본인 보다도 금융권이 제일 먼저 인지해서 채권회수를 하려고 한다. 자신의 신용도와 그에 따른 금융권에서의 한도를 제대로 아는 사람이 얼마나 될까? 자신을 잘 관리한다는 것은 본인 데이터와 그에 따른 부수적인 내용까지도 잘 관리해야 한다는 것이다.

개인 데이터 종합검진 센터라도 차려야 할 것 같다. 과거보다 비교할 수없이 더 큰 데이터 세상에서는 새로운 프로세스들이 많이 생겨난다. 데이터 백업을 받는 동시에 불필요한 데이터 클린징 작업도 해야 한다. 여기저기 흩어져 있는 본인 데이터를 일정하게 관리하는 것도 중요하다.

이런 일들도 조만간 봇들이 처리해주게 될 것이다. 그리고 봇들도 이력 관리를 해주어야 하고, 봇을 위한 봇도 생기게 되는 끊임없는 고리가 생길 것이다. 그러는 사이에 데이터는 무궁무진 하게 불어날 것이며 창조적인 사고를 하는 사람들의 일은 새로운 무대로 옮겨갈 것이다. 데이터의 확장에 필수적인 세계적 표준화같은 문제들은 적극 고민해야 하는 열려 있는 과제이다.         

키워드

#데이터
저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지

관련기사