Tại hội nghị thường niên Snowflake Summit diễn ra ở San Francisco, Mỹ, Snowflake công bố loạt tính năng tự động hóa và hợp tác dữ liệu mới, với mục tiêu giảm rào cản triển khai quản trị AI trong doanh nghiệp.
Khi doanh nghiệp tăng tốc ứng dụng AI, yêu cầu về kiểm soát và quản trị cũng trở nên cấp thiết hơn. Theo Snowflake, nếu thiếu cơ chế kiểm soát phù hợp, AI sẽ khó được triển khai ở quy mô lớn. Ngược lại, việc siết quản trị quá mức cũng có thể làm giảm trải nghiệm người dùng và cản trở khả năng khai thác AI trong thực tế.
Phát biểu bên lề sự kiện, Prasanna Krishnan, lãnh đạo mảng Collaboration và giải pháp quản trị Horizon của Snowflake, cho rằng bài toán cốt lõi là cân bằng giữa khai thác và kiểm soát. Theo ông, để đạt được điều này, doanh nghiệp cần khả năng kiểm soát chi tiết đi kèm cơ chế thiết lập tự động.
Tại Snowflake Summit, hãng giới thiệu các tính năng mới hỗ trợ hợp tác dữ liệu và AI trong khuôn khổ quản trị, nổi bật là zero copy sharing và open sharing. Trong đó, zero copy sharing cho phép truy cập dữ liệu trực tiếp mà không cần sao chép hay di chuyển dữ liệu, còn open sharing mở rộng khả năng chia sẻ tới cả các đối tác không có tài khoản Snowflake.
Theo ông Krishnan, zero copy sharing giúp giảm gánh nặng quản trị nhờ tránh phát sinh các bản sao dữ liệu, đồng thời cho phép truy cập gần như tức thời. Ông cho biết Fidelity hiện yêu cầu toàn bộ dữ liệu nhận từ bên ngoài phải được tiếp nhận theo hình thức zero copy.
Với open sharing, Snowflake muốn mở rộng phạm vi cộng tác ra ngoài hệ sinh thái hiện có của mình. Ông Krishnan cho biết cả zero copy sharing và open sharing đều hướng tới cùng một mục tiêu: mở rộng hợp tác dữ liệu mà không cần di chuyển dữ liệu.
Cũng tại sự kiện, Snowflake công bố bản cập nhật mới cho Horizon Catalog, tập trung vào ba mảng: kết nối toàn bộ tài sản dữ liệu trong doanh nghiệp, bổ sung ngữ cảnh cho dữ liệu thông qua Horizon Context và tăng cường quản trị AI.
Theo Snowflake, bản cập nhật mới cho phép kết nối toàn bộ dữ liệu doanh nghiệp vào Horizon. Ngay cả với dữ liệu nằm ngoài nền tảng Snowflake, hệ thống vẫn có thể thu thập metadata để áp dụng ngữ cảnh và chính sách quản trị thống nhất.
Ông Krishnan cho biết với các bảng Iceberg nằm trong catalog bên ngoài, Snowflake vẫn có thể áp dụng cơ chế masking và quản trị thông qua Polaris và API Iceberg. Dữ liệu lưu trữ trên AWS Redshift cũng có thể được truy vấn bằng Cortex.
Horizon Context được thiết kế để giúp AI hiểu bối cảnh kinh doanh của doanh nghiệp tốt hơn. Cách tiếp cận của Snowflake là thu thập metadata trên toàn bộ tài sản dữ liệu, làm giàu metadata bằng lineage, sau đó tự động kích hoạt lớp ngữ cảnh này khi chạy truy vấn AI hoặc truy vấn BI.
Ông Krishnan cho biết Snowflake hiện có khả năng tự động tạo semantic view. Hệ thống có thể thu thập metadata sẵn có và các định nghĩa nghiệp vụ từ công cụ BI để tạo bản nháp semantic view, sau đó người dùng chỉ cần phê duyệt hoặc chỉnh sửa một phần. Trong khi đó, Cortex Sense phân tích lịch sử truy vấn trong Snowflake để xác định mối quan hệ giữa các tập dữ liệu; mức sử dụng càng cao, độ chính xác càng được cải thiện.
Ở khía cạnh quản trị, ông Krishnan nhận định nếu không có governance phù hợp, doanh nghiệp sẽ chần chừ trong việc triển khai AI, còn quy trình thiết lập quá phức tạp lại trở thành rào cản kéo dài. Để giải quyết vấn đề này, Snowflake đưa ra cách tiếp cận “intent-driven governance”.
Theo mô tả của hãng, với intent-driven governance, người dùng chỉ cần diễn đạt bằng ngôn ngữ tự nhiên loại chính sách quản trị mong muốn. Snowflake sẽ tự động xác định đặc tả phù hợp và tạo SQL liên quan. Hệ thống cũng tiếp tục giám sát và gửi cảnh báo nếu phát sinh tình huống đi chệch khỏi “ý định” ban đầu.
Ông Krishnan cho biết mô hình governance của Snowflake gồm ba bước: nhận diện, bảo vệ và kiểm toán. Doanh nghiệp trước tiên xác định vị trí dữ liệu nhạy cảm, sau đó áp dụng các biện pháp kiểm soát truy cập chi tiết như masking theo cột. Khi các agent truy vấn dữ liệu, hệ thống cũng có thể áp dụng các mức masking khác nhau tùy theo vai trò. Ở bước kiểm toán, doanh nghiệp có thể phân biệt và kiểm tra các truy cập do con người hay agent thực hiện.
Theo ông, để mọi thành viên trong doanh nghiệp có thể rút ra insight từ dữ liệu và chuyển thành hành động, chỉ riêng mô hình AI là chưa đủ. Doanh nghiệp còn cần một nền tảng dữ liệu được quản trị tốt, năng lực gọi công cụ và ứng dụng, cùng một lớp điều phối để kết nối và vận hành đồng bộ các thành phần này.