Google vừa chính thức giới thiệu ba mô hình LLM mã nguồn mở, được thiết kế để đáp ứng các nhu cầu khác nhau, từ mô hình nhỏ gọn có thể chạy trên máy cá nhân mà không yêu cầu phần cứng cao, cho đến các mô hình với nhiều tham số phục vụ cho những yêu cầu phức tạp hơn.
Hiện tại, người dùng đã có thể tải về những mô hình này để thử nghiệm. Ngoài ra, các nhà phát triển còn có cơ hội tiếp cận thông tin về mã nguồn của các mô hình và theo dõi những tiến bộ mới nhất của Google trong lĩnh vực phát triển mô hình.
Ba mô hình mã nguồn mở mới mà Google công bố gồm có Gemma 2 2B, ShieldGemma và Gemma Scope. Mỗi mô hình đều được thiết kế với những chức năng cụ thể riêng biệt.
Đầu tiên, Gemma 2 2B được phát triển với mục tiêu phân tích và tạo ra văn bản. Từ tên gọi, có thể nhận thấy rằng Gemma 2 2B sở hữu 2 tỷ tham số, và theo thông tin từ Google, nó đủ nhẹ để có thể hoạt động trên bất kỳ phần cứng nào mà không cần yêu cầu cao về cấu hình. Mặc dù vậy, Google khẳng định rằng hiệu suất của Gemma 2 2B vượt trội hơn so với GPT-3.5 của OpenAI. So với các mô hình hiện tại, Gemini của Google có tới hơn 1.000 tỷ tham số. Gemma 2 2B có khả năng phục vụ cho cả nghiên cứu lẫn ứng dụng thương mại.
Tiếp theo là ShieldGemma, một mô hình phân loại được thiết kế nhằm phát hiện và lọc những đầu ra không mong muốn từ mô hình LLM, đảm bảo an toàn cho người dùng. Google cho biết ShieldGemma được phát triển để nhận diện ngôn ngữ thù địch, nội dung ngược đãi, khiêu dâm và những mối nguy hiểm tiềm ẩn đối với con người, vốn là rủi ro xuất phát từ khả năng của mô hình AI. ShieldGemma được xây dựng dựa trên nền tảng của Gemma 2 với các tham số đã được điều chỉnh. Số lượng tham số của ShieldGemma dao động từ 2 tỷ đến 27 tỷ và cũng có khả năng hoạt động offline.
Cuối cùng, chúng ta có model Gemma Scope – một trong ba mô hình mã nguồn mở quan trọng vừa được giới thiệu. Mục tiêu của Gemma Scope là cung cấp sự hiểu biết đơn giản về cách thức hoạt động của Gemma 2. Để nói thêm về vấn đề này, từ trước đến nay, việc hiểu rõ về hoạt động bên trong của các LLM thương mại (như GPT, Gemini, Claude…) vẫn gặp nhiều khó khăn, và rất ít người có thể nắm bắt một cách sâu sắc và chính xác. Gemma Scope được phát triển nhằm giải quyết vấn đề đó. Google đã công bố rằng nó sử dụng bộ mã hóa tự động rời rạc, cho phép các nhà phát triển “tiến sát vào từng điểm cụ thể trong mô hình, giúp làm rõ hơn các hoạt động nội tại của nó.”
Hiện tại, tất cả các mô hình đều có thể tải xuống. Người dùng có thể tải Gemma 2, 2B và ShieldGemma trực tiếp từ trang Google, trong khi Gemma Scope có thể được kiểm tra qua nền tảng Neuronpedia nhằm hỗ trợ cho nghiên cứu.
Trên thực tế, Gemini hiện là mô hình AI tiên tiến nhất của Google, và người dùng chỉ có thể truy cập thông qua chatbot được cung cấp bởi Google, tương tự như cách mà các nhà phát triển LLM thương mại như OpenAI hay Anthropic hoạt động. Tuy nhiên, Gemini cũng được tích hợp vào các sản phẩm của Google như Gmail, Google Drive, Workspace,… theo cách tương tự mà Microsoft đã làm sau khi đầu tư vào OpenAI để phát triển Copilot.
Dù Google không công bố mã nguồn của Gemini, nhưng thực tế là họ đã phát hành nhiều mô hình và công nghệ liên quan đến AI phục vụ cho nghiên cứu. Thậm chí, Google là đơn vị đầu tiên phát hành thuật toán transformer – cơ sở cho sự phát triển của hầu hết các LLM hiện tại như GPT của OpenAI hay Llama của Meta sau này. Do đó, việc phân chia nhiệm vụ của ba mô hình mã nguồn mở mà công ty vừa phát hành lần này cũng không quá khó hiểu.