Có gì mới trong Claude Opus 4.7: Mô hình AI mới nhất của Anthropic?

Claude Opus 4.7, phiên bản mới nhất từ Anthropic đánh dấu một bước tiến đáng kể trong khả năng trí tuệ nhân tạo, đặc biệt là trong lĩnh vực lập trình và các quy trình tự động phức tạp

Apr 17, 2026

Claude Opus 4.7 là gì? Đánh giá chi tiết Model AI mới nhất từ Anthropic

Claude Opus 4.7, phiên bản mới nhất từ Anthropic, đã chính thức ra mắt vào ngày 16/4/2026, đánh dấu một bước tiến đáng kể trong khả năng trí tuệ nhân tạo, đặc biệt là trong lĩnh vực lập trình và các quy trình tự động phức tạp.

Mô hình này không chỉ là một bản cập nhật đơn giản từ phiên bản Opus 4.6 trước đó mà còn là một sự nhảy vọt về chất lượng và hiệu suất, với những cải tiến rõ rệt trong nhiều lĩnh vực quan trọng.

Bài viết này sẽ phân tích toàn diện về Claude Opus 4.7, từ những cải tiến chính, các chỉ số hiệu năng quan trọng, đến phản hồi từ cộng đồng công nghệ và các trường hợp ứng dụng thực tế.

Claude Opus 4.7 benchmark comparison versus GPT-5.4 and Gemini 3.1 Pro

Những cải tiến chính trong Claude Opus 4.7

1. Hiệu suất lập trình vượt trội

Claude Opus 4.7 đã thể hiện sự cải thiện đáng kể trong lĩnh vực kỹ thuật phần mềm nâng cao. Đặc biệt:

SWE-bench Pro: Đạt 64.3%, tăng đáng kể so với 53.4% của Opus 4.6 và vượt qua GPT-5.4 (57.7%) và Gemini 3.1 Pro (54.2%)
CursorBench: Tăng từ 58% lên 70%, thể hiện khả năng tự chủ và tư duy sáng tạo hơn trong lập trình
Rakuten-SWE-Bench: Giải quyết được số lượng tác vụ sản xuất nhiều gấp 3 lần so với Opus 4.6

Theo Michael Truell, CEO của Cursor: “Claude Opus 4.7 là một mô hình lập trình ấn tượng, đặc biệt về tính tự chủ và khả năng tư duy sáng tạo. Trên CursorBench, Opus 4.7 là một bước nhảy vọt về khả năng, đạt 70% so với 58% của Opus 4.6.”

2. Khả năng xử lý hình ảnh nâng cao

Một trong những cải tiến đáng chú ý nhất là khả năng xử lý hình ảnh độ phân giải cao:

Hỗ trợ hình ảnh lên đến 2,576 pixel ở cạnh dài (~3.75 megapixel)
Tăng hơn 3 lần so với giới hạn trước đây của các mô hình Claude
Đạt 98.5% trên XBOW visual-acuity benchmark, tăng vọt từ 54.5% của phiên bản trước

Cải thiện này đặc biệt có giá trị cho việc phân tích các ảnh chụp màn hình chi tiết, sơ đồ phức tạp, và công việc cần độ chính xác pixel hoàn hảo.

ScreenSpot-Pro visual navigation results

3. Khả năng tự kiểm chứng và tư duy nâng cao

Claude Opus 4.7 thể hiện một đặc điểm mới quan trọng: khả năng tự kiểm chứng kết quả của mình trước khi trả lời:

Tự động xác minh các giả định trước khi hành động
Phát hiện và báo cáo khi dữ liệu bị thiếu thay vì cung cấp thông tin sai lệch
Thực hiện các bằng chứng trên mã nguồn hệ thống trước khi bắt đầu làm việc

Theo Hex: “Claude Opus 4.7 là mô hình mạnh mẽ nhất mà Hex đã đánh giá. Nó báo cáo chính xác khi dữ liệu bị thiếu thay vì cung cấp các giải pháp thay thế có vẻ hợp lý nhưng không chính xác, và nó chống lại các bẫy dữ liệu không thống nhất mà ngay cả Opus 4.6 cũng mắc phải.”

4. Mức nỗ lực mới “xhigh”

Opus 4.7 giới thiệu một cấp độ nỗ lực mới gọi là xhigh (”extra high”), nằm giữa các cấp độ high và max hiện có:

Cho phép kiểm soát tốt hơn sự đánh đổi giữa khả năng lập luận và độ trễ trên các vấn đề khó
Trở thành mức nỗ lực mặc định trong Claude Code cho tất cả các gói dịch vụ
Giúp cân bằng giữa chất lượng và chi phí token

5. Cải thiện về bộ nhớ dựa trên hệ thống tệp

Opus 4.7 nổi bật với khả năng sử dụng bộ nhớ dựa trên hệ thống tệp tốt hơn:

Ghi nhớ các ghi chú quan trọng qua các phiên làm việc dài, đa phiên
Tận dụng ghi chú để chuyển sang các tác vụ mới mà không cần nhiều ngữ cảnh ban đầu
Giảm đáng kể nhu cầu tái tạo ngữ cảnh ở mỗi phiên

GraphWalks long-context reasoning at 1M tokens

Chỉ số hiệu năng quan trọng

Dưới đây là tổng hợp các chỉ số hiệu năng chính của Claude Opus 4.7 so với các phiên bản trước và các đối thủ cạnh tranh

Tính năng mới nổi bật

Ngoài các cải tiến về hiệu suất, Claude Opus 4.7 còn giới thiệu một số tính năng mới quan trọng:

1. Lệnh `/ultrareview` trong Claude Code

Lệnh mới này trong Claude Code tạo ra một phiên đánh giá chuyên dụng để phát hiện lỗi và vấn đề thiết kế mà một người đánh giá cẩn thận có thể phát hiện. Tính năng này đặc biệt hữu ích cho:

Các nhà phát triển độc lập cần đánh giá mã nguồn
Các nhóm muốn sàng lọc PR trước khi đánh giá bởi con người

2. Task Budgets (Beta)

Opus 4.7 giới thiệu Task Budgets trong phiên bản beta công khai:

Cho phép nhà phát triển kiểm soát số lượng token mà Claude sử dụng cho một nhiệm vụ cụ thể
Giúp AI ưu tiên công việc qua các lần chạy dài hơn
Tối ưu hóa chi phí và hiệu suất cho các quy trình tự động phức tạp

3. Chế độ Auto cho người dùng Max

Chế độ Auto, trước đây chỉ dành cho người dùng Team và Enterprise, giờ đây đã được mở rộng cho người dùng Max:

Claude tự đưa ra quyết định thay mặt bạn
Giảm gián đoạn trong các tác vụ dài hơn
Rủi ro thấp hơn so với việc bỏ qua tất cả các quyền

Tương thích và di chuyển từ phiên bản cũ

Opus 4.7 là một nâng cấp trực tiếp từ Opus 4.6, nhưng có hai thay đổi quan trọng cần lưu ý:

Bộ tokenizer mới:
- Cải thiện cách mô hình xử lý văn bản
- Cùng một đầu vào có thể ánh xạ tới nhiều token hơn (khoảng 1.0-1.35× tùy thuộc vào loại nội dung)
Hướng dẫn theo nghĩa đen hơn:
- Opus 4.7 diễn giải hướng dẫn theo nghĩa đen hơn
- Lời nhắc được viết cho các mô hình trước đây có thể tạo ra kết quả không mong muốn
- Cần điều chỉnh lại lời nhắc để tránh lỗi

Phản hồi từ cộng đồng công nghệ

Phản hồi từ cộng đồng công nghệ về Claude Opus 4.7 đã rất tích cực, với nhiều chuyên gia và nhà phát triển ca ngợi các cải tiến của nó:

Từ diễn đàn Reddit (r/ClaudeAI):

Nhiều người dùng đã báo cáo sự cải thiện đáng kể trong việc giải quyết các tác vụ phức tạp so với Opus 4.6. Đặc biệt, khả năng xử lý mã nguồn và thực hiện các nhiệm vụ đa bước phức tạp đã nhận được nhiều lời khen ngợi.

Từ các CEO và nhà lãnh đạo công nghệ:

Michele Catasta, Chủ tịch của Replit: “Đối với Replit, Claude Opus 4.7 là một quyết định nâng cấp dễ dàng. Đối với công việc hàng ngày của người dùng, chúng tôi nhận thấy nó đạt được cùng chất lượng với chi phí thấp hơn - hiệu quả và chính xác hơn trong các tác vụ như phân tích nhật ký và dấu vết, tìm lỗi, và đề xuất sửa chữa. Cá nhân tôi thích cách nó phản biện trong các cuộc thảo luận kỹ thuật để giúp tôi đưa ra quyết định tốt hơn.”
Scott Wu, CEO của Devin: “Claude Opus 4.7 đưa tự chủ dài hạn lên một tầm cao mới trong Devin. Nó hoạt động mạch lạc trong nhiều giờ, vượt qua các vấn đề khó thay vì bỏ cuộc, và mở khóa một lớp công việc điều tra sâu mà chúng tôi không thể chạy đáng tin cậy trước đây.”
Oege de Moor, CEO của XBOW: “Đối với công việc sử dụng máy tính nằm ở trung tâm của kiểm thử thâm nhập tự động của XBOW, Claude Opus 4.7 mới là một thay đổi bước ngoặt: 98.5% trên benchmark visual-acuity của chúng tôi so với 54.5% của Opus 4.6. Điểm đau lớn nhất của Opus của chúng tôi đã biến mất một cách hiệu quả, và điều đó mở khóa việc sử dụng nó cho một lớp công việc mà trước đây chúng tôi không thể.”

Phản hồi từ nhà phát triển:

Tại các diễn đàn như Dev.to và GitHub, nhiều nhà phát triển đã báo cáo:

Giảm vòng lặp vô hạn trong các nhiệm vụ phức tạp
Khả năng phát hiện lỗi tốt hơn đáng kể
Tính nhất quán cao hơn trong các dự án lớn và phức tạp

Một nhà phát triển trên DEV Community chia sẻ: “Tôi đã đưa một công việc thực tế từ danh sách tồn đọng của mình, chỉ định cho Opus 4.6, ghi lại kết quả, sau đó chỉ định cho Opus 4.7 trên một nhánh mới. 4.6 bị lặp lỗi trong 45 phút và không giải quyết được vấn đề. 4.7 đã hoàn thành trong 11 phút, sau khi tự dừng lại để kiểm tra tính hợp lý của một giả định mà tôi không yêu cầu nó kiểm tra.”

Giá cả và khả năng truy cập

Giá cho Claude Opus 4.7 vẫn giữ nguyên so với phiên bản 4.6:

$5 cho mỗi triệu token đầu vào
$25 cho mỗi triệu token đầu ra

Claude Opus 4.7 có sẵn trên:

Claude.ai (cho người dùng Pro, Max, Team và Enterprise)
Claude API
Amazon Bedrock
Google Cloud Vertex AI
Microsoft Foundry

An toàn và liên kết

Anthropic đã thực hiện đánh giá an toàn toàn diện đối với Opus 4.7:

Hồ sơ an toàn tương tự như Opus 4.6 với tỷ lệ hành vi đáng lo ngại thấp
Cải thiện về tính trung thực và khả năng chống lại các cuộc tấn công “tiêm nhắc lệnh” độc hại
Giới thiệu các biện pháp bảo vệ tự động phát hiện và chặn các yêu cầu an ninh mạng có rủi ro cao

Opus 4.7 cũng là mô hình đầu tiên triển khai các biện pháp bảo vệ an toàn dự án Glasswing của Anthropic - hướng tới mục tiêu cuối cùng là phát hành rộng rãi các mô hình cấp Mythos.

Các chuyên gia an ninh mạng làm việc hợp pháp có thể đăng ký tham gia Chương trình Xác minh An ninh mạng của Anthropic để truy cập các khả năng bị giới hạn này.

Trường hợp sử dụng lý tưởng

Claude Opus 4.7 đặc biệt phù hợp với các trường hợp sử dụng sau:

1. Lập trình phức tạp

Các quyết định kiến trúc phức tạp
Tái cấu trúc mã nguồn khó
Xử lý các lỗi đồng thời
Đánh giá PR lớn

2. Agent tự chủ dài hạn

Điều tra kéo dài nhiều giờ
Tự động hóa CI/CD
Agent nghiên cứu
Nhiệm vụ sử dụng máy tính

3. Tầm nhìn độ phân giải cao

Sử dụng máy tính
Trích xuất sơ đồ
Ảnh chụp màn hình UI
Hình ảnh khoa học đời sống

4. Công việc chuyên nghiệp quan trọng

Đánh giá pháp lý
Phân tích tài chính
Bảng điều khiển
Lý luận tài liệu phức tạp

Kết luận

Claude Opus 4.7 đại diện cho một bước tiến đáng kể trong lĩnh vực AI tiên tiến, đặc biệt là trong lập trình và các quy trình tự động. Với hiệu suất vượt trội trong các nhiệm vụ phức tạp, khả năng xử lý hình ảnh độ phân giải cao, và tính năng tự kiểm chứng, mô hình này thiết lập một tiêu chuẩn mới cho trợ lý AI.

Mặc dù có một số cân nhắc về sự thay đổi trong cách tokenize và yêu cầu điều chỉnh lại lời nhắc, những lợi ích tổng thể của Opus 4.7 dường như vượt xa những thách thức này đối với hầu hết người dùng.

Đối với các nhóm phát triển, các startup AI, và các doanh nghiệp làm việc với các dự án phức tạp, Claude Opus 4.7 cung cấp một lựa chọn mạnh mẽ đáng để xem xét trong hệ sinh thái AI hiện nay.

Thụ's Notes

Discussion about this post

Ready for more?