Claude Sonnet 5: Anthropic ra mắt bản Sonnet giỏi agentic, áp sát Opus 4.8

Claude Sonnet 5 Featured V2

Ngày 30/6/2026, Anthropic ra mắt Claude Sonnet 5, bản Sonnet mà hãng nói là làm việc kiểu agentic giỏi nhất của dòng này tính tới nay. Nó tự lập kế hoạch, dùng được trình duyệt và terminal, chạy tự động ở mức mà vài tháng trước phải nhờ các mô hình to và đắt hơn. Theo Anthropic, Sonnet 5 áp sát Opus 4.8 mà giá lại mềm hơn nhiều. Với dân code và ai hay giao việc cho AI, đây là bản đáng thử. Hưng Phát tóm tắt nhanh những gì bạn cần biết.

Claude Sonnet 5 là gì và mạnh lên ra sao so với Sonnet 4.6

Anthropic định vị Sonnet 5 là bản agentic rõ rệt nhất của dòng Sonnet: biết lập kế hoạch, gọi công cụ như trình duyệt và terminal, rồi chạy trọn nhiều bước mà không cần cầm tay chỉ việc. Dòng Sonnet từng mở màn kỷ nguyên agentic với 3.5, 3.6 và 3.7. Giai đoạn gần đây, các bước tiến rõ nhất lại đến từ dòng Opus, nên việc một bản Sonnet kéo khoảng cách lại gần Opus 4.8 là điều khiến giới phát triển để mắt.

So với người tiền nhiệm Sonnet 4.6, Sonnet 5 nhỉnh hơn ở gần như mọi mặt agentic quan trọng: suy luận, dùng công cụ, lập trình và xử lý tri thức. Bảng điểm Anthropic công bố cho thấy mức cải thiện cụ thể, đặt cạnh cả Opus 4.8 để dễ so.

Biểu Đồ Cột So Điểm Claude Sonnet 5, Sonnet 4.6 Và Opus 4.8 Trên Các Benchmark Agentic

Vài con số đáng nhớ. Ở Terminal-Bench 2.1 (lập trình theo dòng lệnh), Sonnet 5 đạt 80,4% so với 67,0% của Sonnet 4.6, gần chạm mức 82,7% của Opus 4.8. Ở SWE-bench Pro là 63,2% so với 58,1%. Bài computer use OSWorld-Verified đạt 81,2% so với 78,5%, sát nút Opus 4.8 ở 83,4%. Humanity’s Last Exam khi có công cụ là 57,4% so với 46,8%, gần như ngang Opus 4.8 (57,9%). Riêng phần tri thức GDPval-AA v2 dùng thang điểm khác, Sonnet 5 được 1618 điểm, trên cả mức 1615 của Opus 4.8.

Tinh thần chung là bạn có chất lượng gần Opus mà trả theo giá Sonnet. Bạn xem công bố đầy đủ trong bài giới thiệu Claude Sonnet 5 của Anthropic, kèm bản System Card chi tiết hơn.

Làm việc với Sonnet 5: tự lập kế hoạch, dùng tool và chạy autonomous

Điểm bán hàng lớn nhất của bản này là sức làm việc tự chủ. Anthropic đo trên hai bài quen thuộc: BrowseComp cho tác vụ tìm kiếm kiểu agentic, và OSWorld-Verified cho thao tác máy tính. Sonnet 5 cải thiện chắc tay so với Sonnet 4.6, còn Opus 4.8 vẫn dẫn khi bạn cần độ chính xác cao nhất.

Mô hình còn cho chỉnh mức nỗ lực, gồm cả mức rất cao gọi là xhigh. Cùng một việc, bạn hạ mức nỗ lực để tiết kiệm, hoặc đẩy lên để đổi lấy độ chính xác. Cách này giúp cân chi phí và chất lượng theo từng dự án, không bị kẹt vào một mức cố định.

Laptop Trên Bàn Làm Việc Hiển Thị Trình Soạn Mã Và Terminal Đang Chạy Tác Tử Ai

Phản hồi từ nhóm dùng sớm khá nhất quán: Sonnet 5 theo việc tới cùng ở những tác vụ mà bản Sonnet cũ hay bỏ dở, và tự kiểm tra lại kết quả mà không cần nhắc. Một đối tác giao việc hai phần là cập nhật bậc tài khoản trên Salesforce rồi gửi thông báo ra mắt cho khách doanh nghiệp, Sonnet 5 làm trọn từ đầu tới cuối. Một kỹ sư khác nhờ điều tra một lỗi, mô hình tự viết bài test tái hiện, sửa lỗi, rồi gỡ bản sửa ra để xác nhận lỗi quay lại, tất cả trong một lượt.

Các nhóm khác nhắc tới việc gỡ rối trên mã cũ nhiều rác (race condition, test ẩn), nghiên cứu và phân tích pháp lý, hay chạy quy trình bảo hiểm bằng thao tác máy tính. Mẫu số chung là làm xong việc nhiều bước với chi phí dễ chịu, đúng thứ một tác tử thực thụ cần làm được.

Đánh giá an toàn và năng lực an ninh mạng của Claude Sonnet 5

Về an toàn, Anthropic nói Sonnet 5 nhìn chung khá hơn Sonnet 4.6. Mô hình từ chối yêu cầu độc hại tốt hơn, chống lại đòn chèn lệnh trong tấn công prompt injection tốt hơn, đồng thời ít bịa và ít nịnh người dùng hơn bản cũ.

Trên bài kiểm hành vi tự động, vốn quét rất nhiều kiểu hành vi lệch chuẩn, Sonnet 5 đạt điểm thấp hơn 4.6, tức an toàn hơn. Dù vậy mức này vẫn cao hơn hai bản mạnh hơn là Opus 4.8 và Mythos Preview, nên Anthropic không giấu giới hạn đó.

Đồ Họa Nhấn Mạnh Claude Sonnet 5 An Toàn Hơn 4.6 Với Safeguard Mặc Định

Phần an ninh mạng có một điểm cần nói rõ. Anthropic không huấn luyện riêng Sonnet 5 cho mảng này. Trên bài thử dựng mã khai thác cho lỗ hổng trình duyệt Firefox 147 (làm cùng Mozilla, các lỗi đã vá ở Firefox 148), cả Sonnet 5 lẫn 4.6 đều 0,0% dựng được mã khai thác hoàn chỉnh. Sonnet 5 chỉ nhích hơn chút ở phần thành công một phần, nhiều khả năng nhờ trí thông minh chung tăng lên chứ không do luyện riêng. Năng lực mạng của nó kém hẳn Opus 4.8 và Mythos 5.

Vì nhỉnh hơn 4.6 đôi chút, Sonnet 5 được bật sẵn lớp bảo vệ mạng theo thời gian thực, cùng cơ chế như Opus 4.7 và 4.8, chặn các kiểu dùng nguy hiểm ngay khi phát hiện. Với công việc bảo mật cần nới guardrail, Anthropic khuyên chọn Opus 4.8 cho phần việc đó.

Giá, gói và người dùng laptop nên quan tâm gì

Về giá, Anthropic mở bán Sonnet 5 với mức ưu đãi tới hết 31/8/2026: 2 USD cho mỗi 1 triệu token đầu vào và 10 USD cho 1 triệu token đầu ra. Sau mốc đó giá về chuẩn là 3 USD và 15 USD. Để dễ so, Opus 4.8 đang ở mức 5 USD và 25 USD.

Nhìn biểu đồ là thấy rõ Sonnet 5 rẻ hơn Opus 4.8 một quãng đáng kể ở cả hai chiều token. Có một lưu ý kỹ thuật: Sonnet 5 đổi sang bộ tách token mới, khiến cùng một nội dung có thể bị đếm nhiều token hơn, khoảng 1,0 đến 1,35 lần tùy loại nội dung. Anthropic đặt giá ưu đãi để giai đoạn chuyển đổi gần như không đội chi phí.

Biểu Đồ Cột So Giá Api Đầu Vào Và Đầu Ra Của Claude Sonnet 5 Ưu Đãi, Giá Chuẩn Và Opus 4.8

Sonnet 5 có mặt ở mọi gói ngay trong ngày ra mắt. Nó là mô hình mặc định cho gói Free và Pro, có cho người dùng Max, Team và Enterprise, chạy trong Claude Code và trên Claude Platform với tên gọi claude-sonnet-5, đồng thời dùng được trong Cowork. Anthropic cũng nâng giới hạn dùng để hợp với mức token cao hơn khi bạn đẩy mức nỗ lực lên.

Còn với người ngồi gõ máy thì sao? Sonnet 5 chạy trên đám mây, bạn không cần máy khủng chỉ để gọi nó. Nhưng khi để nó làm việc agentic qua Claude Code, mở terminal, chạy test, build dự án và thao tác nhiều bước, chính chiếc laptop của bạn mới quyết định mọi thứ trơn tru hay khựng lại. Một máy RAM 16GB trở lên, CPU nhiều nhân và ổ NVMe nhanh sẽ giúp vòng lặp viết rồi chạy thử mượt hơn hẳn. Nếu bạn đang tính sắm máy để làm việc với AI và Claude Code cho ngon, Hưng Phát có thể tư vấn cấu hình hợp túi tiền và đúng nhu cầu lập trình, mời bạn xem các mẫu laptop cấu hình cao đang có sẵn.

Claude Sonnet 5 mạnh hơn Sonnet 4.6 ở đâu?

Sonnet 5 hơn 4.6 ở suy luận, dùng công cụ, lập trình và xử lý tri thức. Ví dụ Terminal-Bench 2.1 là 80,4% so với 67,0%, OSWorld-Verified 81,2% so với 78,5%, và Humanity’s Last Exam có công cụ 57,4% so với 46,8%.

Claude Sonnet 5 giá bao nhiêu?

Giá ưu đãi tới 31/8/2026 là 2 USD đầu vào và 10 USD đầu ra cho mỗi 1 triệu token, sau đó về chuẩn 3 USD và 15 USD. Opus 4.8 đắt hơn, ở mức 5 USD và 25 USD.

Dùng Claude Sonnet 5 có cần laptop cấu hình cao không?

Bản thân mô hình chạy trên đám mây nên không cần máy mạnh để gọi. Nhưng khi chạy agentic qua Claude Code (terminal, test, build), laptop RAM 16GB trở lên, CPU nhiều nhân và ổ NVMe nhanh sẽ giúp công việc mượt hơn.

Sonnet 5 có an toàn cho việc agentic không?

Anthropic đánh giá Sonnet 5 an toàn hơn 4.6: từ chối yêu cầu xấu tốt hơn, chống prompt injection tốt hơn, ít bịa và ít nịnh hơn. Năng lực an ninh mạng của nó thấp, và hãng bật sẵn lớp bảo vệ mạng theo thời gian thực.

Bình luận (0 bình luận)

Hotline Messenger Telegram Zalo OA Email
Hotline Zalo OA Telegram Messenger Email