DeepSeek, một startup AI nổi bật nhờ vào công nghệ tiên tiến, đang tận dụng sức sáng tạo của những tài năng trẻ để so tài với các tập đoàn lớn tại Mỹ.

Vào ngày 26 tháng 12, startup AI DeepSeek của Trung Quốc vừa giới thiệu mô hình ngôn ngữ lớn DeepSeek V3. Mặc dù có nguồn lực đào tạo hạn chế, nhưng mô hình này vẫn cho thấy hiệu suất tương đương và thậm chí vượt trội hơn một số đối thủ lớn từ Mỹ như Meta và OpenAI.

Đây được xem là một bước tiến quan trọng, mở ra cơ hội cho Trung Quốc trong việc phát triển khả năng AI, bất chấp các khó khăn về việc tiếp cận chip hiện đại và nguồn tài chính. Theo thông tin từ báo cáo kỹ thuật, trang tuyển dụng, phỏng vấn với cựu nhân viên và các bài viết địa phương, sự đột phá này là kết quả của một nhà sáng lập khiêm tốn cùng với đội ngũ nghiên cứu trẻ trung.

Năm 2023, DeepSeek đã tách ra từ quỹ đầu tư High Flyer-Quant. Nhà sáng lập của High-Flyer Quant, Liang Wenfeng, cũng là người đứng sau DeepSeek và ông từng học về AI tại Đại học Chiết Giang.

Chính Sách Trọng Dụng Nhân Tài Trẻ Của Deepseek Đã Tỏ Ra Hiệu Quả Khi Gặt Hái Được Thành Công Với Nguồn Vốn Hạn Chế. Ảnh: Shutterstock.
Chính sách trọng dụng nhân tài trẻ của DeepSeek đã tỏ ra hiệu quả khi gặt hái được thành công với nguồn vốn hạn chế. Ảnh: ShutterStock.

Trong một cuộc phỏng vấn với trang tin 36Kr hồi tháng 5/2023, ông Liang đã tiết lộ rằng DeepSeek ưu tiên tuyển dụng những nhân viên trẻ trong lĩnh vực AI, từ sinh viên mới ra trường cho đến những người đang bắt đầu sự nghiệp. Chính sách này thể hiện rõ ràng quan điểm của công ty là đánh giá năng lực hơn kinh nghiệm.

Ông Liang cho biết: “Các vị trí kỹ thuật chủ chốt của chúng tôi chủ yếu do sinh viên vừa tốt nghiệp hoặc những người có chỉ một hoặc hai năm kinh nghiệm đảm nhiệm.”

Trong số những tài năng tại DeepSeek, Gao Huazuo và Zeng Wangding được công nhận đặc biệt vì những đóng góp quan trọng trong việc nghiên cứu và phát triển kiến trúc MLA. Gao đã tốt nghiệp Đại học Bắc Kinh (PKU) vào năm 2017 với bằng vật lý, trong khi Zeng bắt đầu học thạc sĩ tại Viện AI thuộc Đại học Bưu chính Viễn thông Bắc Kinh từ năm 2021.

Hồ sơ của cả hai đều phản ánh cách tiếp cận khác biệt của DeepSeek so với các công ty khởi nghiệp AI khác, khi mà hầu hết đều ưu tiên thuê những nhà nghiên cứu có nhiều kinh nghiệm hơn hoặc những tiến sĩ được đào tạo ở nước ngoài chuyên về khoa học máy tính.

Ngoài ra, đội ngũ chủ chốt của DeepSeek còn có Guo Daya, một tiến sĩ vừa tốt nghiệp Đại học Tôn Trung Sơn năm 2023, cùng với hai tiến sĩ trẻ khác là Zhu Qihao và Dai Damai, đều đến từ Đại học Bắc Kinh (PKU).

Cựu Nhân Tài Trẻ Tuổi Của Deepseek, Luo Fuli. Ảnh: Luo Fuli.
Cựu nhân tài trẻ tuổi của DeepSeek, Luo Fuli. Ảnh: Luo Fuli.

Ngoài ra, có cựu nhân viên Luo Fuli, một trong những tài năng nổi bật nhất của DeepSeek. Với tấm bằng thạc sĩ từ Đại học Bắc Kinh (PKU), cô được truyền thông Trung Quốc ca ngợi là “thần đồng AI”.

Cô đã thu hút sự chú ý của dư luận khi có tin tức rằng nhà sáng lập Xiaomi, Lei Jun, đã đề xuất mức lương 1,4 triệu USD/năm để mời cô về làm việc. Mô hình V3 của DeepSeek đã được đào tạo trong hai tháng, sử dụng khoảng 2.000 chip Nvidia H800 với tổng chi phí chỉ 6 triệu USD. Andrej Karpathy, một trong những người sáng lập OpenAI, đã nhận xét đây là một “ngân sách đùa”, ám chỉ rằng chi phí này quá thấp so với quy mô dự án.

Hai tuần trước, nhiều người dùng đã phản hồi rằng DeepSeek V3 đã nhầm lẫn mình là . Tuy nhiên, các chuyên gia cho rằng việc một mô hình AI tự xưng là không phải là điều lạ lẫm trong lĩnh vực trí tuệ nhân tạo, vì hầu hết các công cụ chatbot hiện nay đều được huấn luyện từ nguồn dữ liệu chung.

Theo ZNews

Bình luận (0 bình luận)