[디지털투데이 황치규 기자] 오라클이 퍼블릭 클라우드 서비스 시장에서 지분 확대를 위해 최근 데이터 메시라는 개념을 부쩍 강조하고 있다.

오라클에 따르면 데이터 메시는 엔터프라이즈 내에 비효율적으로 저장돼 있는 데이터를 분산된 환경에서 필요할 때 빠르게 그것도 비용 효율적으로 쓸 수 있도록 하는데 초점이 맞춰져 있다. 이를 통해 데이터 재사용과 이동성을 지금보다 크게 강화할 수 있다는게 오라클 설명이다.

제프 폴록 오라클 부사장에게 데이터 메시가 부상하는 배경와 최슨 트렌드, 데이터 메시에 대한 오라클의 전략에 대해 물었다.

제프 폴록 오라클 부사장.
제프 폴록 오라클 부사장.

-많은 이들에게 데이터 메시는 다소 생소하다. 데이터 메시를 어떻게 이해해야 하는가?

"‘메시(mesh, 그물망)’라는 단어는 직물 이미지에서 온 표현이다. 데이터 메시는 엔터프라이즈 기업들이 지금처럼 경직되고 매우 단절된 단일형(monolithic) 데이터 저장소에서 분산형 데이터 아키텍처로 데이터를 방출해 비즈니스 혁신에 유리한 방향으로 빠르고 비용 효율적으로 만드는 것이 골자다.

돈과 같은 자산을 예로 들면 조직내 자산이 유동적일수록 자산을 보다 빠르게 움직일 수 있는 기회를 잡을 수 있다. 데이터도 마찬가지다. 데이터가 보다 자유롭게 이동할 수 있으면 효과적으로 재사용할 수 있어 궁극적으로 조직에 더 많은 가치를 제공한다. 자유롭게 이동하는 데이터는 비즈니스 가치에 승수 효과를 창출한다. 지금 데이터는 명시적이면서도 암시적인 가치를 동시에 지닌 자산이다. 데이터 메시는 이같은 가치를 극대화하기 위해 데이터 이벤트를 가능한 유동적으로 만든다. 이렇게 되면 데이터는 여러 클라우드를 오가며 데이터 이벤트를 멀리서 감지하고, 복제, 변환 및 분석할 수 있다." 

-데이터 메시에 대한 관심이 커지는 배경은 무엇인가?

"최신 멀티 클라우드 IT 아키텍처에서 데이터에 쉽게 접근 할 수 있는 가장 현대적인 방법이기 때문이다. 데이터 메시는 매번 단일 중앙집중식 허브를 통하지 않고도 다양한 경로를 통해 스트리밍 데이터를 라우팅할 수 있는 멀티 클라우드 생태계에서 효율적으로 데이터를 운영하는데 유용하다.

이제 기업들이 데이터를 관리하고 쉽게 사용할 수 있도록 만드는 방법에 대한 인식의 변화가 필요하다고 보고 있다. 데이터 메시 개념을 강조하는 것도 이같은 일환이다. 데이터 통합을 수행하거나 분산된 데이터레이크를 사용하는 오래된 단일형(monolithic) 방식으로는 요즘 기업들 요구 사항을 충족할 수 없다. 데이터는 이제 덜 중앙화되고 더 실시간을 지원해야 한다는 인식이 업계 전반에 걸쳐 확산되고 있다.

모든 엔터프라이즈급 기업들은 대규모 데이터 자산(data estate)을 보유하고 있다. 비즈니스 리더들은 거버넌스 및 보안과 일관성을 기반으로 이들 데이터 자산에 필요할 때 원하는 위치에 원하는 방식으로 접근하고 싶어한다. 지금과 같은 수동적인 데이터 프로세스로는 동일한 데이터를 매일 같은 방식으로 가져오는 것이 매우 어렵다."

-데이터 메시는 구체적으로 기업들이  현재 직면한 데이터 관련 문제들과 관련해 어떤 것들을 해결하는가?

"적합한 사용 사례 관점에서 접근해보자. 예를 들어, 에너지 그리드나 원유 및 가스 광구 운영, 실시간 원격 측정이 필요한 스포츠 경기, 군사 작전을 위한 시그널 기반 인텔리전스 등 데이터 중심 IoT 애플리케이션이 데이터 메시가 적용되는 대표적인 사례들이다. 소규모 기업들도 민첩한 애플리케이션 개발을 지원하기 위해 분산형 데이터 메시를 활용할수 있다. 메시 또는 허브(Hub) 패턴을 수행하는 도구에 투자하는 ‘메시적 사고’를 통해 작은 허브로 시작해 메시로 확대하는 것이 가능하다. 데이터 메시는 기업들이 데이터 결과에 집중하도록 한다. 기업 특정 부서에 국한되지 않는 '비즈니스 도메인'을 강조한다. 이것은 IT 조직이 통상 회사 조직 구조에 맞춰 데이터 관리를 처리하는 방식과는 대조적이다.

수십년 동안 기업들은 데이터  분석 처리와 데이터 저장소를 분리해 왔다. 일반적으로 데이터를 매일, 매주 또는 매월 배치로 이동해야 해야 했다. 그러다 보니 시스템 간 다양한 문제가 발생했다. 데이터 통찰 도출 지연, 일관성 부족, 시스템 복잡성 증가, 데이터를 관리하는 IT 팀과 데이터를 사용하는 비즈니스 부서 간 이해와 공통성 결여 등이 대표적이다. IT 운영과 비즈니스 분석을 분리하는 조직들 대부분은 이러한 불필요한 파편화 현상 때문에 데이터 팀과 연결이 단절되는 상황을 경험하고 있다.

엔터프라이즈 데이터 웨어하우스와 데이터레이크가 완전히 사라지지는 않겠지만, 이것만으로는 부족하다. 데이터 메시는 IT 부서가 데이터를 보다 민첩하게 실험하고 운영중인 많은 비즈니스 단위에서 혁신할 수 있도록 지원한다."

-데이터 메시지를 구현하려면 기업들 입장에서 지금과는 다른 것들이 필요할 것 같다.
 
"데이터가 갖는역동적인 특성을 인식하는 아키텍처가 필요하다. 체스판에 있는 말을 예로 들면, 말의 위치는 단순히 스냅샷에 불과하다. 일련의 동작(예: 데이터 이벤트)이 실제로 체스 경기 흐름을 전달한다. 마찬가지로 엔터프라이즈 데이터 전체 흐름을 완전히 이해하려면 데이터가 갖는 동적 특성에 대한 설명과 함께 모델링을 할 수 있어야 한다. 오라클은 데이터 동적 특성을 인식하고 수용하면서 시계열 데이터 이벤트에 대한 설명을 제공하는 원장 기반 데이터 메시 관점에서 접근하고 있다."

-데이터 메시가 확산되는데 있어 걸림돌들을 꼽는다면?

 "의외라고 생각할 수 있지만 클라우드는 오라클에게 비즈니스 동력이기도 하지만 데이터 메시 도입 측면에선 해결해야 할 과제다.

데이터 관리를 위해 클라우드를 활용할 경우 온프레미스 데이터센터 대비 비용을 절감할 수 있다. 사용자가 데이터 리소스를 하나의 허브로 통합하여 신속한 접근을 가능케 하고, 반복적인 개발 및 데이터 과학 업무를 지원한다는 이점도 있다. 그러나 클라우드 자체가 데이터 플랫폼 현대화를 추진하는 기업에 솔루션이 되지는 못한다. 요즘 대부분 중대형 이상 기업은 둘 이상의 물리적 위치에서 IT를 운영 중이고, 클라우드로 전환되지 않는 기존 애플리케이션도 사용하고 있다.  부서마다 다른 서비스형 소프트웨어(SaaS) 및 클라우드 파트너를 이용하는 경우도 많기 때문에 단순 프로젝트별 기능 이상을 수행하는 데이터 통합과 이를 도구화 하는 것이 필요하다.

한 기업이 단일형(monolithic) 온프레미스 데이터웨어하우스를 클라우드로 이전하더라도, 인프라스트럭처를 운영하는 주체가 바뀔 뿐 단일형 아키텍처라는 인프라는 여전히 존재한다.  단일형 데이터웨어하우스를 클라우드로 이전하는 것은 인프라 비용 절감에 유리한 전략이지만, 엔터프라이즈 데이터 아키텍처 현대화 관점에서는 충분하지 않다."

-단일형 데이터웨어하우스는 멀티 클라우드 환경에 효과적이지 않다는 건가?

"그렇다. 기존 단일형 데이터웨어하우스는 분리돼 있는 인프라스트럭처 전체에서 데이터를 일관적으로 관리하고, 서로 다른 데이터 형식을 사용하면서도 지연 시간을 최소화하도록 연결해야 하는 멀티클라우드 생태계에는 적합하지 않다.  데이터 기록 시스템과 원출처는 데이터웨어하우스와 데이터레이크에서 멀리 떨어져 있는 경우가 많기 때문에, 데이터 메시에 담긴 탈중앙형 아키텍처가 시스템 운영 체제를 분석 데이터 저장소와 연결할 수 있도록 지원하는데 용이하다. 

클라우드 도입 트렌드가 빠른 속도로 변화하는 만큼, 머지 않은 미래 멀티 클라우드는 주류로 부상할 것이다. 중대형 규모 이상 기업의 경우 워크로드를 온프레미스와 여러 퍼블릭 클라우드에 분산시켜 운영할 가능성이 높다. 예를 들어, 특정 비즈니스 애플리케이션이 한 클라우드에서 호스팅되는 동안 두 번째 클라우드에서는 추가 애플리케이션에서 데이터를 수집하는 애널리틱 데이터레이크를 실행하는 식이다. 

대규모 조직이 매우 복잡하게 운영된다는 점을 고려하면 여러 운영 부서마다 다른 클라우드 공급업체를 사용하는 것은 당연한 일이다. 그러나 앞서 논의했듯이 대규모 조직일수록 서로 다른 클라우드 간 데이터 공유를 지원하는 교차 비즈니스 및 데이터 도메인을 필요로 할 것이다."

-멀티 클라우드 시대, 오라클의 데이터 메시 전략을 요약한다면?

"데이터 메시에 대한 오라클은 데이터 트랜잭션 같은 데이터 일관성, 데이터 운영 방식, 데이터 검증 가능성 및 미션 크리티컬 데이터에 대한 대규모 이동과 같은 엔터프라이즈 기업들에서 나오는 요구 사항들을 강조하는 것이 특징이다. 

오라클은 모든 유형 데이터에 적용 가능한 개방형 엔터프라이즈급 솔루션 관점에서 데이터 메시를 지향한다. 기업들이 보유한 가장 중요한 데이터에 사용될 수 있을 만큼 신뢰성을 확보하는 것을 중요하게 보고 있다. 또 오라클은 데이터 메시 전략을 지원하는 제품, 도구 및 클라우드 서비스를 제공하는 데 중점을 두고 있다."

-데이터 메시와 관련해 어떤 제품들을 전진배치했나?

"오라클은 자율운영 데이터베이스(ADB), 로우코드 애플리케이션 개발 서비스인 오라클 에이펙스,  셀프 서비스 애널리틱스 솔루션인 오라클 애널리틱스 클라우드(OAC) 등 데이터 메시를 지원하는 다양한 제품군을 제공하고 있다.  하지만  데이터센터와 클라우드 간 순환 시스템에서 데이터가 이동하는 기본 메시에 기반이 되는 제품은 오라클 골든게이트이다. 오라클 골든게이트는 데이터 메시 접근을 가능케 하는 제품이자 클라우드 서비스다."  

-기업 현장에서 데이터 메시를 적용한 사례들은 어떤 것들이 있나?

"금융소프트웨어 기업 인튜이트(Intuit Inc.)는 데이터 메시 분야에서 적극적으로 목소리를 내는오라클 고객이다.

인튜이트 사례는 데이터 메시가 기업 및 비즈니스 도메인에 미치는 영향력을 설명하는 데 특히 유용하다. 인튜이트는 실시간 데이터 메시 연결에는 오라클 골든게이트를, 데이터 제품으로는 오라클 데이터베이스를 광범위하게 사용하고 있다.

페이팔(PayPal)도 흥미로운 데이터 메시 패턴을 적용하는 사례다. 페이팔은 결제 플랫폼과 모바일 애플리케이션에서 마이크로서비스 디자인 패턴을 광범위하게 활용하고 있다. 데이터 이벤트를 매우 안정적이고 일관적으로 이동시켜야 하는데, 페이팔은 마이크로서비스 중 데이터 이벤트 스트리밍 용도로는 오라클 골든게이트를 활용하고 있다." 

-데이터 메시 확산을 위해 회사 차원에서 준비하고 있는 것들이 있다면?

"데이터 메시로 전환을 도모하는 고객은 초기부터 큰 지출을 할 필요없이 이를 점진적으로 실행해 나갈 수 있다. '빅뱅' 방식으로만 접근할 필요는 없다. 골든게이트 플랫폼은 오라클이 아닌 퍼블릭 클라우드에서도 인증됐다. 이를 통해 기업들은 여러 네트워크를 오가며 스트리밍 데이터 이벤트를 전 세계적으로 연결할 수 있다. 이것은 오라클 멀티 클라우드 및 온프레미스 데이터 전략에서도 중요한 부분이다.  오라클은 데이터 메시 전략에서 핵심 플랫폼인  골든게이트에 대한 투자를 지속해 나갈 것이다."

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지