Mẫu ngôn ngữ mới của OpenAI, được đặt tên là o3, đã thể hiện khả năng tương đương với con người trong một bài đánh giá toàn diện về trí tuệ tổng hợp

Tuần trước, OpenAI ra mắt mô hình trí tuệ nhân tạo o3, đánh dấu bước đột phá quan trọng trong lĩnh vực này khi đạt 85% điểm chuẩn trong bài kiểm tra ARC-AGI. Thành tích này vượt trội so với kỷ lục trước đó của AI, chỉ đạt 55%, và đáng chú ý là tương đương với kết quả trung bình của con người. Việc phát triển trí tuệ nhân tạo tổng quát (AGI) là mục tiêu hàng đầu của các viện nghiên cứu AI, và OpenAI dường như đã đạt được một bước tiến đáng kể trên con đường này.

Bài kiểm tra IQ của OpenAI o3

Để đánh giá ý nghĩa kết quả O3, cần nắm rõ bản chất bài kiểm tra ARC-AGI. Bài kiểm tra này, xét về mặt kỹ thuật, đo lường hiệu quả thích ứng của hệ thống AI với các tình huống chưa từng gặp. Cụ thể, bài kiểm tra xác định số lượng ví dụ cần thiết để hệ thống AI tìm ra quy luật hoạt động của tình huống mới.

Các hệ thống AI như , dựa trên mô hình ngôn ngữ lớn GPT-4, thể hiện hiệu quả hạn chế trong khía cạnh này. Nguyên nhân là do LLM được huấn luyện trên một lượng khổng lồ dữ liệu văn bản, từ đó xây dựng các quy tắc xác suất cho các chuỗi từ có khả năng xuất hiện cao.

Điều này giúp chatbot hoạt động hiệu quả với các nhiệm vụ thông thường, nhưng lại gặp khó khăn với các nhiệm vụ ít phổ biến do thiếu dữ liệu huấn luyện tương ứng.

Openai O3: Suy Nghĩ Gần Giống Con Người Có Ý Nghĩa Gì?
Một ví dụ về bài kiểm tra ARC-AGI. Mỗi câu hỏi sẽ đưa ra 3 ví dụ để AI học hỏi. Sau đó, hệ thống AI cần tìm ra các quy tắc “tổng quát hóa” từ 3 ví dụ đã cho để giải được câu đố. Ảnh: ARC Prize

Hiện nay, ứng dụng thực tiễn của hệ thống AI còn bị hạn chế bởi khả năng học tập từ dữ liệu nhỏ và khả năng thích ứng với các mẫu phức tạp. Do đó, AI chỉ phù hợp với những nhiệm vụ mang tính lặp lại hoặc chấp nhận được tỷ lệ lỗi nhất định.

Khả năng tổng quát hóa, hay nói cách khác là khả năng giải quyết các vấn đề chưa từng gặp trước đây dựa trên dữ liệu hạn chế, được xem là yếu tố cốt lõi của trí tuệ.

Bài kiểm tra ARC-AGI đánh giá khả năng tổng quát hóa của AI thông qua các bài toán biến đổi lưới điểm đơn giản. Hệ thống AI cần xác định quy luật chuyển đổi từ lưới điểm đầu vào sang lưới điểm đầu ra.

Cụ thể, AI sẽ được cung cấp ba ví dụ để học hỏi và từ đó, phải tự suy luận ra quy tắc chung để giải quyết các bài toán tương tự. Theo The Conversation, bài kiểm tra này tương tự như các bài kiểm tra chỉ số IQ ở người.

Dấu hỏi về bước tiến thật sự

Cơ chế hoạt động cụ thể của mô hình o3 do OpenAI phát triển vẫn chưa được làm rõ, tuy nhiên, hiệu quả đạt được cho thấy khả năng tổng quát hóa ấn tượng của mô hình này. Chỉ cần một vài minh họa, mô hình đã tự động rút ra các quy tắc có tính ứng dụng rộng rãi.

Chuyên gia trí tuệ nhân tạo người Pháp, Francois Chollet, đưa ra giả thuyết rằng o3 vận hành bằng cách khám phá nhiều “chuỗi tư duy” khác nhau nhằm tìm ra giải pháp cho bài toán. Tiếp theo, mô hình sẽ lựa chọn phương án tối ưu dựa trên các tiêu chí chưa được định nghĩa một cách chính xác, hay nói cách khác là một “thuật toán tìm kiếm”.

Openai O3: Suy Nghĩ Gần Giống Con Người Có Ý Nghĩa Gì?
Mô hình O3 đã đạt điểm số lý luận và giải quyết vấn đề tương đương một người trung bình. Ảnh: 123RF.

Phương pháp hoạt động của hệ thống này tương tự như AlphaGo của Google DeepMind, nơi tìm kiếm tối ưu các chuỗi hành động để đạt được chiến thắng. Tuy nhiên, hiệu quả của phương pháp này trong việc thúc đẩy tiến trình đến trí tuệ nhân tạo tổng quát (AGI) vẫn còn bỏ ngỏ. Nếu cơ chế hoạt động của mô hình chỉ dựa trên việc tìm kiếm như vậy, khả năng vượt trội so với các mô hình tiền nhiệm sẽ bị hạn chế.

Các chuyên gia trong lĩnh vực trí tuệ nhân tạo cho rằng khả năng lập luận và lập kế hoạch là yếu tố then chốt để đạt được AGI, tức là khả năng nhận thức của máy móc tương đương với con người. Khả năng tự lập luận của hệ thống AI sẽ góp phần tăng cường tính nhất quán trong việc trả lời câu hỏi và mở rộng khả năng giải quyết các vấn đề thực tế.

Từ mô hình o1, OpenAI đã áp dụng học tăng cường để cho phép hệ thống khám phá nhiều chiến lược khác nhau khi xử lý yêu cầu. Mặc dù tốn kém và phức tạp hơn so với các mô hình GPT trước, phương pháp này đã mang lại kết quả là tính nhất quán cao hơn và khả năng xử lý các nhiệm vụ phức tạp tốt hơn.

Openai O3: Suy Nghĩ Gần Giống Con Người Có Ý Nghĩa Gì?
Việc dạy các mô hình AI biết cách lý luận và lập kế hoạch là một bước tiến quan trọng hướng tới trí tuệ nhân tạo tổng quát (AGI). Thuật ngữ này nói về việc máy móc thể hiện khả năng nhận thức tương tự như con người. Ảnh: The Conversation

Việc đánh giá đầy đủ tiềm năng của o3 đòi hỏi nỗ lực nghiên cứu đáng kể, bao gồm phân tích kỹ lưỡng về khả năng, tần suất thành công và thất bại của hệ thống.

Khả năng thích ứng của o3, tương đương với con người bình thường, chỉ có thể được xác định một cách chính xác sau khi hệ thống được chính thức ra mắt.

Chiến thắng của AlphaGo trước kỳ thủ cờ vây hàng đầu Lee Sedol năm 2016 đã đánh dấu một cột mốc quan trọng trong lĩnh vực khoa học máy tính, thể hiện khả năng tự học chiến lược trừu tượng phức tạp để chinh phục trò chơi cờ vây – một trong những trò chơi khó nhất thế giới.

Nếu o3 có thể đạt được thành tựu tương tự trong vòng chưa đầy 10 năm, điều này sẽ là một bước tiến đột phá của trí tuệ nhân tạo, tạo ra tác động kinh tế to lớn, mang tính cách mạng và khởi đầu cho kỷ nguyên trí tuệ nhân tạo tự cải thiện với tốc độ tăng trưởng nhanh chóng.

Theo ZNews

Bình luận (0 bình luận)