GPT-5.6 Sol: OpenAI hé lộ mô hình mới mạnh hơn về coding và bảo mật

Gpt 5 6 Sol Featured V2

Rạng sáng 26/6/2026, OpenAI mở bản xem trước GPT-5.6 Sol cùng hai người anh em Terra và Luna. Lần này hãng không tung đại trà. Họ cho chạy thử giới hạn qua API và Codex cho một nhóm đối tác tin cậy, sau khi đã trình bày năng lực mô hình cho chính phủ Mỹ. Một bản preview mà phải dè dặt tới mức đó thì hẳn có chuyện đáng nói. Với dân lập trình hay dùng AI để code, đây là tin nên theo dõi. Hưng Phát mổ xẻ nhanh những gì bạn cần biết.

Bộ ba GPT-5.6 Sol, Terra và Luna: ba bậc năng lực và lối đặt tên mới

OpenAI tung cùng lúc ba mô hình trong dòng GPT-5.6. Sol là bản đầu bảng, gánh những tác vụ khó nhất. Terra là bản cân bằng cho công việc hằng ngày, hãng nói nó có hiệu năng cạnh tranh với GPT-5.5 mà giá chỉ bằng một nửa. Luna là bản nhanh và rẻ nhất, dành cho ai cần xử lý khối lượng lớn với chi phí thấp.

Cách chia ba bản gắn rất sát với mục đích dùng. Cần một trợ lý lập kế hoạch dài hơi, gỡ lỗi rối rắm hay xử lý bài toán nặng thì chọn Sol. Việc thường ngày như viết tài liệu, tóm tắt, sửa đoạn code ngắn thì Terra vừa đủ mà tiết kiệm. Khi bạn chạy hàng nghìn yêu cầu lặp lại, Luna giữ hóa đơn nhẹ nhất. Ba bản cùng một thế hệ nên chất lượng nền tảng tương đồng, chỉ khác ở mức năng lực và giá.

Đồ Họa Gpt-5.6 Với Ba Bản Sol, Terra Và Luna Của Openai

GPT-5.6 cũng đổi cách đặt tên. Con số chỉ thế hệ, còn Sol, Terra và Luna là ba bậc năng lực bền vững, có thể tiến hóa theo nhịp riêng. Nói cách khác, sau này có thể có một Sol mới mạnh hơn mà vẫn giữ tên Sol, thay vì đẻ ra chuỗi số khó nhớ. Với người dùng, bạn cân ba trục là trí thông minh, tốc độ và chi phí rồi gắn vào một cái tên, đỡ phải tra bảng thông số.

Đi kèm là hai chế độ mới. Mức suy luận max cho Sol nhiều thời gian nghĩ sâu hơn trước khi trả lời, hợp với bài toán nhiều bước. Chế độ ultra thì vượt khỏi giới hạn của một tác tử đơn lẻ, huy động các subagent chạy song song để đẩy nhanh việc phức tạp. Đây là dấu hiệu OpenAI muốn biến mô hình thành một bộ máy biết tự chia việc, chứ không chỉ trả lời nhanh hơn.

Bạn có thể đọc thông báo gốc trong bản xem trước GPT-5.6 từ OpenAI. Với các luồng dài như dựng một dự án phần mềm từ đầu, cách chạy nhiều tác tử thường rút ngắn thời gian đáng kể so với làm tuần tự.

GPT-5.6 Sol mạnh tới đâu: coding, sinh học và an ninh mạng

Về lập trình, OpenAI nói Sol lập kỷ lục mới trên Terminal-Bench 2.1, bài kiểm tra các thao tác dòng lệnh đòi hỏi lập kế hoạch, lặp lại và phối hợp công cụ. Đây đúng là kiểu việc mà một trợ lý code thực thụ phải làm tốt, không chỉ sinh ra vài đoạn mã rời rạc.

Nhìn vào điểm số thì khoảng cách khá rõ. Bản GPT-5.6 Sol Ultra đạt 91,9%, GPT-5.6 Sol đạt 88,8%, nhỉnh hơn Claude Mythos 5 ở mức 88,0%. Trong khi đó GPT-5.5 đời trước được 83,4%, Claude Opus 4.8 là 78,9% còn Gemini 3.1 Pro Preview là 70,7%. Biểu đồ dưới đây xếp đủ chín cái tên để bạn dễ hình dung.

Biểu Đồ Điểm Terminal-Bench 2.1 Của Các Mô Hình Ai, Dòng Gpt-5.6 Dẫn Đầu

Ở mảng sinh học, Sol đạt kết quả tốt hơn GPT-5.5 trên GeneBench v1, bộ đánh giá các phân tích gen và sinh học định lượng dài hơi, mà lại tiêu ít token hơn. Tốn ít token nghĩa là vừa nhanh vừa rẻ cho cùng một bài toán, một điểm cộng thực tế với nhóm nghiên cứu.

Về an ninh mạng, hãng nói đây là mô hình mạnh nhất của họ cho việc tìm và vá lỗ hổng. Trên ExploitBench, GPT-5.6 Sol cạnh tranh được với bản Mythos Preview mà chỉ dùng khoảng một phần ba số token đầu ra. Trên ExploitGym, một benchmark do nhóm UC Berkeley dựng cùng OpenAI và vài phòng nghiên cứu tiên phong khác, cả Sol, Terra lẫn Luna đều mạnh lên rõ khi được tăng mức suy luận.

Gộp lại, bức tranh năng lực là một bước nhảy thật sự, nhất là ở coding và bảo mật. Nhưng chính bước nhảy đó lại là lý do OpenAI không vội mở cho tất cả, như phần tiếp theo sẽ nói rõ.

Vì sao OpenAI mở dần: ngưỡng Cyber Critical, an toàn nhiều lớp và red-teaming

Điểm lạ nhất của lần ra mắt này nằm ở chữ giới hạn. Thay vì mở cho mọi người, OpenAI chỉ cho một nhóm đối tác tin cậy dùng trước, và danh sách này đã được chia sẻ với chính phủ Mỹ. Hãng nói đây là bước ngắn hạn trong lúc cùng chính quyền xây khung sắc lệnh về an ninh mạng và một quy trình lặp lại được cho các lần phát hành sau.

Lý do nằm ở năng lực an ninh mạng tăng vọt. Trong các bài thử trên Chromium và Firefox, Sol tìm ra lỗi và những mảnh ghép để khai thác, nhưng chưa tự dựng được một chuỗi tấn công hoàn chỉnh trong điều kiện kiểm thử. OpenAI khẳng định mô hình chưa chạm ngưỡng Cyber Critical trong khung Preparedness của họ, song vẫn chọn mở dần vì mức năng lực đã khác hẳn trước.

Sơ Đồ Sáu Lớp An Toàn Xếp Chồng Của Mô Hình Gpt-5.6 Theo Mô Tả Của Openai

Đáng chú ý, chính OpenAI cũng nói họ không muốn kiểu phải xin phép chính phủ trước mỗi lần phát hành trở thành mặc định lâu dài, vì điều đó giữ công cụ tốt khỏi tay người dùng, lập trình viên và đội phòng thủ mạng cần nó. Đây là một cân bằng khó giữa mở rộng tiếp cận và kiểm soát rủi ro.

Về phần bảo vệ, hãng xếp chồng nhiều lớp như sơ đồ trên. Lớp nền là huấn luyện cho mô hình từ chối yêu cầu cấm, kể cả khi người dùng ngụy trang ý đồ hay tìm cách bẻ khóa. Trên đó là bộ lọc thời gian thực cho cả an ninh mạng lẫn sinh học, soi nội dung ngay khi đang sinh ra. Khi nghi vi phạm ở ca rủi ro cao, phần trả lời có thể bị tạm dừng để một mô hình suy luận lớn hơn xem lại ngữ cảnh, và bị giữ lại nếu không được phép.

Cao hơn nữa là lớp xét ở cấp tài khoản, nhìn xuyên nhiều cuộc trò chuyện để tách hành vi xấu lặp lại khỏi công việc bảo mật chính đáng. OpenAI thừa nhận trong giai đoạn preview, đôi khi bộ lọc sẽ chặn nhầm cả việc hợp lệ, và họ dùng phản hồi người dùng để giảm dần các chặn thừa. Để bộ an toàn không gãy trước chiêu mới, hãng dồn hơn 700.000 giờ GPU quy đổi A100 cho red-teaming tự động săn universal jailbreak, kết hợp thêm các nhóm chuyên gia bên ngoài và một quy trình phản ứng nhanh để vá lỗ hổng mới.

Giá API GPT-5.6, prompt caching, tốc độ Cerebras và khi nào dùng được

GPT-5.6 tính tiền theo mỗi một triệu token và chia ba mức theo bản máy. Mức giá này áp cho cả token đầu vào lẫn đầu ra, nên chi phí thực tế phụ thuộc nhiều vào độ dài câu trả lời bạn yêu cầu.

Nhìn vào biểu đồ giá, khoảng cách giữa ba bản khá lớn, nhất là ở token đầu ra. Sol đắt nhất, Luna rẻ nhất, Terra nằm giữa và là cái tên đáng để ý nhất: ngang GPT-5.5 nhưng rẻ hơn gấp đôi, nên nhiều khả năng đây mới là bản đông người dùng khi mở rộng.

Biểu Đồ Cột So Sánh Giá Api Đầu Vào Và Đầu Ra Của Gpt-5.6 Sol, Terra Và Luna

Bảng dưới ghi rõ vai trò và giá từng bản để bạn tiện đối chiếu.

Bản Vai trò Giá input (1 triệu token) Giá output (1 triệu token)
Sol Bản đầu bảng, việc khó 5 USD 30 USD
Terra Cân bằng, việc hằng ngày 2,50 USD 15 USD
Luna Nhanh, chi phí thấp 1 USD 6 USD

GPT-5.6 còn bổ sung cách lưu đệm ngữ cảnh dễ đoán hơn, cho phép đặt điểm cắt cache rõ ràng và giữ cache tối thiểu 30 phút. Ghi cache bị tính bằng 1,25 lần giá đầu vào thường, nhưng đọc lại từ cache vẫn được giảm 90%, rất lợi khi bạn lặp đi lặp lại cùng một ngữ cảnh.

Về tốc độ, OpenAI cho biết sẽ chạy GPT-5.6 Sol trên phần cứng Cerebras với tốc độ tới 750 token mỗi giây trong tháng 7, ban đầu giới hạn cho một số khách hàng. Còn về thời điểm dùng được, các bản này trước hết đến qua API và Codex cho nhóm được chọn, rồi sẽ mở cho người dùng ChatGPT, Codex và API trong vài tuần tới. Với doanh nghiệp, hãng đang làm thêm các hướng như phát hiện vi phạm theo cách bảo toàn quyền riêng tư và cấp quyền truy cập tùy mức rủi ro.

Người dùng laptop được gì từ GPT-5.6

Cần nói rõ một điều cho đỡ hiểu lầm. GPT-5.6 chạy trên đám mây. Bạn gọi nó qua API hoặc dùng trong Codex và ChatGPT, chứ không tải mô hình về chạy thẳng trên máy. Nghĩa là bạn không cần một cỗ máy khủng chỉ để dùng GPT-5.6.

Nhưng cái khiến công việc mượt hay vấp lại nằm ở chiếc máy bạn ngồi gõ. Khi mở ChatGPT hay Codex trong trình duyệt và bắt nó làm việc thật, trải nghiệm phụ thuộc nhiều vào cấu hình máy bạn.

Người Dùng Gõ Phím Trên Laptop, Màn Hình Hiển Thị Giao Diện Chat Chatgpt Có Đoạn Code

Cụ thể, khi để Codex bung subagent ở chế độ ultra, mở nhiều terminal, build dự án và chạy container song song, thứ ngốn tài nguyên là RAM, CPU đa nhân và ổ SSD tốc độ cao của máy bạn. Một laptop 16GB RAM trở lên, CPU nhiều nhân và ổ NVMe nhanh sẽ giúp vòng lặp viết code rồi chạy thử đỡ khựng. Màn hình rộng và pin tốt cũng giúp những phiên code dài dễ thở hơn.

Nếu bạn đang tính sắm máy để làm việc với AI và Codex cho ngon, Hưng Phát có thể tư vấn cấu hình hợp túi tiền và đúng nhu cầu lập trình của bạn. Ghé xem các mẫu workstation di động và laptop cấu hình cao đang có sẵn để chọn được chiếc bám sát kiểu công việc của mình.

Khi nào dùng được GPT-5.6 Sol?

Hiện Sol, Terra và Luna mới chạy thử giới hạn qua API và Codex cho một nhóm đối tác tin cậy. OpenAI nói sẽ mở rộng cho người dùng ChatGPT, Codex và API trong vài tuần tới.

GPT-5.6 có chạy offline trên laptop không?

Không. Đây là mô hình đám mây, bạn truy cập qua API hoặc qua Codex và ChatGPT. Máy tính chỉ cần đủ khỏe để code và chạy các công cụ đi kèm, không cần chạy mô hình tại chỗ.

Sol, Terra và Luna nên chọn bản nào?

Chọn Sol cho việc khó cần suy luận sâu, Terra cho công việc hằng ngày vì cân bằng giá và sức mạnh, Luna khi cần xử lý khối lượng lớn với chi phí thấp. Cùng một thế hệ nên nền tảng tương đồng, khác ở mức năng lực và giá.

Giá GPT-5.6 tính thế nào?

Tính theo mỗi một triệu token. Sol là 5 USD đầu vào và 30 USD đầu ra, Terra là 2,50 và 15 USD, Luna là 1 và 6 USD. Ngoài ra còn cơ chế cache giúp giảm chi phí khi lặp lại cùng ngữ cảnh.

Bình luận (0 bình luận)

Hotline Messenger Telegram Zalo OA Email
Hotline Zalo OA Telegram Messenger Email