SanDisk giới thiệu thuật toán SP Random. Ảnh: SanDisk

SanDisk đã mở mã nguồn thuật toán giả ngẫu nhiên SP Random, qua đó rút ngắn thời gian tiền xử lý SSD doanh nghiệp từ gần một tuần xuống còn 6,5 giờ. Động thái này được kỳ vọng giúp các trung tâm dữ liệu và nhà vận hành hạ tầng AI đẩy nhanh tiến độ đưa ổ dung lượng lớn vào khai thác.

Theo TechRadar ngày 12/5 (giờ địa phương), SanDisk gần đây đã phát hành SP Random (SanDisk Pseudo Random) dưới dạng tiện ích mở rộng cho công cụ kiểm thử lưu trữ FIO (Flexible IO Tester), cho phép toàn ngành sử dụng tự do.

Trước khi được đưa vào vận hành, SSD doanh nghiệp mới thường phải trải qua bước tiền xử lý để ổn định hiệu năng. Ở giai đoạn này, bộ điều khiển của ổ sẽ ghi dữ liệu và thực hiện các tác vụ quản lý nội bộ phức tạp như thu gom rác (garbage collection) và cân bằng hao mòn (wear leveling).

Chỉ khi các hoạt động này đạt trạng thái ổn định, hiệu năng vào/ra (IO) của SSD mới đủ nhất quán để sử dụng tin cậy trong môi trường sản xuất.

Với phương pháp truyền thống, hệ thống phải ghi lượng dữ liệu lớn hơn gấp đôi dung lượng của ổ. Vì vậy, một SSD 128TB có thể mất khoảng 160 giờ để hoàn tất bước tiền xử lý, tương đương gần một tuần. Khi áp dụng SP Random, thời gian này giảm xuống còn 6,5 giờ.

Với SSD 256TB, quy trình vốn kéo dài 250 giờ cũng được rút xuống 6,5 giờ, tương đương mức tiết kiệm thời gian tối đa hơn 97%.

SanDisk cho biết cốt lõi của SP Random nằm ở cách thuật toán tính toán trước phương thức phân bổ over-provisioning, thay vì phải ghi dữ liệu lặp đi lặp lại nhiều lần. Nhờ đó, quá trình tiền xử lý có thể hoàn tất chỉ với một lần ghi vật lý.

Theo hãng, thiết kế toán học của công nghệ này chia các vùng trên ổ theo cấu trúc chồng lấn và điều chỉnh mức phân bổ theo địa chỉ, từ đó giảm lượng tài nguyên cần thiết để đưa hiệu năng về trạng thái ổn định.

SanDisk mở mã nguồn công nghệ này nhằm giúp ngành lưu trữ có thể triển khai ngay trên thực tế. Theo TechRadar, giải pháp có thể mang lại lợi ích rõ rệt cho các trung tâm dữ liệu hyperscale và các nhà vận hành hạ tầng AI cần nhanh chóng đưa SSD dung lượng lớn vào sử dụng.

Việc rút ngắn hơn 150 giờ chuẩn bị cho mỗi ổ có thể tác động trực tiếp đến tốc độ triển khai cũng như chi phí vận hành của các nhà cung cấp dịch vụ đám mây.

Đặc biệt, các tác vụ AI vận hành trên hàng nghìn ổ song song thường rất nhạy với những dao động nhỏ về hiệu năng. Trong môi trường huấn luyện và suy luận AI đòi hỏi mức độ nhất quán cao, SP Random được kỳ vọng sẽ trở thành công nghệ quan trọng để nâng hiệu quả hạ tầng.

Tuy vậy, với PC phổ thông chỉ sử dụng một ổ, tác động thực tế từ việc rút ngắn thời gian tiền xử lý được đánh giá là không quá lớn.

TechRadar cho rằng quyết định lần này của SanDisk là một bước đi thực tiễn dành cho các doanh nghiệp đang quản lý cụm lưu trữ quy mô lớn. Khi hiệu quả tiết kiệm thời gian đã được chứng minh bằng thiết kế toán học, công nghệ này có thể tạo ra thay đổi đáng kể đối với tốc độ xây dựng hạ tầng AI và hiệu quả vận hành trung tâm dữ liệu toàn cầu trong thời gian tới.

Từ khóa

#SanDisk #SSD #SP Random #FIO #trung tâm dữ liệu #hạ tầng AI
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.