Ảnh: Kim Young-jin, CTO của NolyUniverse.

Ngày 1/4, tại hội nghị “AI Days Seoul” do Databricks tổ chức, Kim Young-jin, Giám đốc Công nghệ (CTO) của NolyUniverse, đã công bố chiến lược khai thác dữ liệu quy mô lớn của công ty, đồng thời nêu kế hoạch xây dựng nền tảng dữ liệu toàn cầu cho Yanolja Group.

Theo ông Kim Young-jin, NolyUniverse đang phát triển Lynx trên Databricks để hợp nhất dữ liệu phân tán giữa các mảng lưu trú, hàng không và giải trí. Mục tiêu là rút ngắn thời gian truy cập dữ liệu, đẩy nhanh phân tích và mở rộng hạ tầng này ra toàn bộ tập đoàn.

NolyUniverse hiện tích lũy lượng dữ liệu lớn từ 13 triệu thành viên, trải rộng trên nhiều lĩnh vực dịch vụ. Tuy nhiên, dù ban lãnh đạo đặt trọng tâm vào ra quyết định dựa trên dữ liệu, việc truy cập nhanh vào dữ liệu cần thiết và xử lý tình trạng dữ liệu bị chia cắt giữa các hệ thống vẫn là thách thức lớn.

Kết quả đánh giá thực hiện cùng Databricks cho thấy công ty đối mặt với ba vấn đề chính. Thứ nhất, rất khó tìm đúng dữ liệu cần thiết trong khối dữ liệu khổng lồ. Thứ hai, ngay cả khi đã tìm thấy dữ liệu, việc bảo đảm độ tin cậy để đưa vào sử dụng vẫn không đơn giản. Thứ ba, dữ liệu từ nhiều mảng như lưu trú, hàng không và giải trí chưa thể được nhìn nhận một cách tổng thể trong cùng một hệ thống.

Vì vậy, các bộ phận có nhu cầu khai thác dữ liệu trước đây phải gửi yêu cầu cho đội ngũ chuyên trách và chờ nhiều ngày mới nhận được kết quả.

Để giải quyết bài toán này, NolyUniverse đã xây dựng một Feature Store tập trung mang tên Lynx. Theo Kim Young-jin, dự án này được triển khai với bốn mục tiêu: cho phép mọi nhân sự có thể tạo và đóng góp dữ liệu; kiểm soát toàn bộ hoạt động phát triển thông qua quy trình rà soát mã nguồn; xây dựng một trung tâm tìm kiếm tập trung; và tự động hóa toàn bộ quy trình từ tạo feature đến triển khai và vận hành.

Ông cho biết công ty không xem Databricks đơn thuần là công cụ phân tích, mà là một nền tảng dữ liệu hoàn chỉnh.

Trước khi Lynx đi vào vận hành, các thành phần như data lake, công cụ truy vấn dựa trên Presto, bộ lập lịch dựa trên Airflow, danh mục dữ liệu dựa trên DataHub và notebook dựa trên Jupyter được vận hành riêng rẽ. Điều này khiến việc kết nối giữa các hệ thống trở nên khó khăn, đồng thời làm tăng độ phức tạp trong quản trị.

Sau khi hợp nhất các chức năng này trên Databricks, tốc độ phát triển đã được cải thiện đáng kể, theo chia sẻ của ông Kim.

Lynx hiện không chỉ phục vụ hạ tầng dữ liệu mà còn được đưa vào các bài toán kinh doanh. Kim Young-jin cho biết nền tảng phân khúc người dùng dựa trên các feature của Lynx đã được ứng dụng vào marketing và dịch vụ cá nhân hóa.

Những tác vụ nhắm mục tiêu vốn trước đây phải chuyển cho các nhà phân tích dữ liệu và chờ nhiều ngày, nay có thể thực hiện chỉ với vài cú nhấp chuột.

Về chiến lược sắp tới, Kim Young-jin nhấn mạnh kế hoạch xây dựng một nền tảng dữ liệu toàn cầu bao phủ toàn bộ Yanolja Group.

Theo ông, đây là dự án kết nối dữ liệu của các công ty thành viên đang phân tán trên toàn cầu, từ Tel Aviv của Israel tới Ấn Độ, Mỹ và Brazil. Hiện NolyUniverse đang triển khai dự án hiện thực hóa mô hình “global data mesh” dựa trên Databricks.

Ông cho biết công ty sẽ tận dụng dữ liệu và trí tuệ nhân tạo (AI) để tạo ra một môi trường giúp các hoạt động du lịch và trải nghiệm trở nên dễ dàng, thuận tiện và thú vị hơn, bất kể người dùng ở đâu.

Từ khóa

#NolyUniverse #Databricks #Lynx #Feature Store #nền tảng dữ liệu #global data mesh #trí tuệ nhân tạo
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.