DeepSeek, công ty AI đến từ Trung Quốc, vừa công bố mã nguồn mở hệ thống tập tin Fire-Flyer File System (3FS) – một công nghệ giúp chạy mô hình AI nhanh hơn và tiết kiệm tài nguyên. Động thái này diễn ra trong bối cảnh các tổ chức phương Tây bày tỏ sự nghi ngờ về tính minh bạch của công ty. Sự kiện “Open Source Week” của DeepSeek đã thu hút sự chú ý của cộng đồng AI quốc tế, với nhiều chuyên gia đánh giá cao công nghệ mà công ty này công bố.
DeepSeek Mở Mã Nguồn 3FS – Hệ Thống Tập Tin Tăng Tốc AI
Trong sự kiện “Open Source Week”, DeepSeek đã mở mã nguồn 5 dự án phần mềm quan trọng, trong đó đáng chú ý nhất là hệ thống tập tin Fire-Flyer File System (3FS). Đây là công nghệ tối ưu hóa khả năng xử lý AI, được DeepSeek sử dụng nội bộ để huấn luyện và triển khai mô hình AI.
3FS được thiết kế để tận dụng hiệu suất của bộ nhớ SSD hiện đại và mạng RDMA, giúp tối ưu hóa các tác vụ AI yêu cầu xử lý lượng dữ liệu khổng lồ. Hệ thống tập tin này hoạt động mà không cần bộ nhớ đệm đọc (read caching) và ưu tiên các yêu cầu đọc ngẫu nhiên – một tính năng quan trọng khi các GPU liên tục truy cập dữ liệu từ nhiều máy chủ khác nhau.
🚀 Day 5 of #OpenSourceWeek: 3FS, Thruster for All DeepSeek Data Access
Fire-Flyer File System (3FS) – a parallel file system that utilizes the full bandwidth of modern SSDs and RDMA networks.
⚡ 6.6 TiB/s aggregate read throughput in a 180-node cluster
⚡ 3.66 TiB/min…— DeepSeek (@deepseek_ai) February 28, 2025
Theo Tom’s Hardware, 3FS có khả năng kết hợp băng thông của hàng nghìn SSD và mạng của hàng trăm node lưu trữ, giúp đơn giản hóa mã ứng dụng và tận dụng các API lưu trữ tiêu chuẩn. Khi chạy trên cụm máy chủ 180 node, hệ thống có thể đạt tốc độ đọc lên tới 6.6 TiB/s, trong khi ở bài kiểm tra GraySort benchmark, nó đạt 3.66 TiB/phút trên 25 node.
Công ty AI Perspective AI đã gọi các thông số này là một “cột mốc mới” và nhận định 3FS có thể là cuộc cách mạng trong xử lý dữ liệu lớn, đặc biệt với các lĩnh vực AI, nghiên cứu và khoa học dữ liệu.
DeepSeek Tăng Minh Bạch, Đối Đầu Cạnh Tranh Toàn Cầu
Năm ngoái, DeepSeek đã công bố Fire-Flyer 2, một kiến trúc AI hiệu suất cao. Nhờ sự kết hợp của 3FS, HaiScale và các công nghệ phần mềm khác, DeepSeek tuyên bố đạt được 80% hiệu suất của các máy chủ Nvidia DGX-A100 nhưng với chỉ 50% chi phí và tiêu tốn ít hơn 40% năng lượng.
Hệ thống Fire-Flyer 2 bao gồm:
- 180 node lưu trữ, mỗi node có 16 SSD 16TB
- 2 NUC 200Gbps
- 10.000 GPU Nvidia A100 kết nối qua PCIe
Sự kiện “Open Source Week” được DeepSeek tổ chức nhằm tăng tính minh bạch sau những chỉ trích từ phương Tây về việc công ty thiếu sự cởi mở và đáng tin cậy. DeepSeek đã công bố mã nguồn của nhiều sản phẩm phần mềm quan trọng như FlashMLA, DeepEP, DeepGEMM, nhằm thúc đẩy đổi mới cộng đồng và cạnh tranh với các công ty AI lớn trên thế giới.
Bước đi này không chỉ giúp DeepSeek chứng minh khả năng của mình mà còn đưa công ty trở thành một trong những người chơi quan trọng trên thị trường AI mã nguồn mở. Với việc tối ưu hóa chi phí và tài nguyên trong đào tạo AI, DeepSeek có thể trở thành đối thủ cạnh tranh đáng gờm với các tập đoàn lớn như OpenAI, Nvidia và Google DeepMind.