Kioxia và Nvidia vừa công bố dự án chung nhằm nâng tầm hiệu suất lưu trữ cho hạ tầng trung tâm dữ liệu AI. Mục tiêu của họ là tạo ra SSD có khả năng đạt tới 100 triệu IOPS, cao gấp khoảng 30–35 lần so với những mẫu ổ cao cấp hiện nay vốn chỉ đạt mức 3 triệu IOPS. Nếu thành công, bước đột phá này không chỉ rút ngắn thời gian huấn luyện và triển khai các mô hình AI khổng lồ mà còn có thể định hình lại cách thiết kế trung tâm dữ liệu, thay đổi cục diện cạnh tranh trong lĩnh vực lưu trữ đám mây và doanh nghiệp.
Dự án SSD thế hệ mới cho kỷ nguyên AI
Kioxia, nhà sản xuất bộ nhớ bán dẫn hàng đầu, đang phát triển công nghệ SSD mới với tốc độ đọc ngẫu nhiên siêu nhanh để đáp ứng khối lượng công việc AI khắt khe. Công ty đặt mục tiêu thương mại hóa dòng SSD đạt mốc 100 triệu IOPS vào năm 2027, hợp tác trực tiếp với Nvidia trong dự án này.
Trong buổi giới thiệu tại Tokyo, Kioxia cho biết ổ SSD mới sẽ kết nối trực tiếp với GPU của Nvidia thay vì thông qua bộ xử lý trung tâm (CPU). Kiểu kết nối ngang hàng này cho phép truyền dữ liệu nhanh hơn đáng kể giữa bộ nhớ và tài nguyên tính toán – một yếu tố then chốt với các mô hình AI lớn vốn đòi hỏi truy xuất dữ liệu ngẫu nhiên liên tục. Các tác vụ như gọi embeddings hay tham số mô hình sẽ được tối ưu hóa nhờ cơ chế mới này.
Nvidia thậm chí còn đặt mục tiêu cao hơn: hệ thống gồm hai SSD có thể đạt 200 triệu IOPS khi sử dụng chuẩn PCI Express 7.0, vốn hỗ trợ giao tiếp tốc độ cao giữa GPU. Để dễ hình dung, các SSD hiệu suất cao hiện nay chỉ đạt khoảng 3 triệu IOPS với khối dữ liệu 4K. Vì vậy, việc nhảy vọt lên 100 triệu IOPS sẽ đòi hỏi cải tiến lớn cả về công nghệ NAND flash lẫn kiến trúc giao tiếp.
XL-Flash và hướng đi công nghệ mới
Một trong những công nghệ được kỳ vọng là nền tảng cho SSD của Kioxia chính là XL-Flash – loại bộ nhớ NAND SLC độc quyền, nổi bật nhờ độ bền cao, độ trễ thấp và khả năng xử lý vượt trội. XL-Flash cho phép tới 16 plane trong một die NAND, trong khi NAND 3D thông thường chỉ có 3 đến 6 plane.
Dù Kioxia chưa công bố chi tiết thông số, dữ liệu thử nghiệm cho thấy thách thức không nhỏ. Một SSD XL-Flash dung lượng 400GB với 32 die NAND và giao diện PCIe 5.0 từng đạt khoảng 3,5 triệu IOPS đọc ngẫu nhiên. Nếu khả năng mở rộng hoàn hảo, ổ gồm 915 die có thể chạm mốc 100 triệu IOPS. Nhưng trên thực tế, yếu tố như băng thông bộ điều khiển, độ trễ firmware hay giới hạn kiến trúc khiến hiệu năng khó đạt mức lý tưởng. Điều này có thể buộc các hãng phải áp dụng thiết kế đa bộ điều khiển hoặc SSD dạng module.
Song song với XL-Flash, Kioxia cũng nghiên cứu High-Bandwidth Flash (HBF) – công nghệ bộ nhớ mới kết hợp tốc độ và khả năng mở rộng của HBM với dung lượng lưu trữ lớn hơn nhiều. HBF có thể tích hợp tới 16 chip NAND cùng một die logic trong cấu trúc xếp chồng, sử dụng kỹ thuật đóng gói tiên tiến để tối đa hóa băng thông và khả năng xử lý song song. Dù chưa rõ HBF có xuất hiện trong sản phẩm thương mại cuối cùng hay không, đây là dấu hiệu cho thấy Kioxia đang mở rộng chiến lược, hướng đến giải pháp lưu trữ hiệu năng siêu cao cho kỷ nguyên AI.