Công ty Anthropic vừa công bố mô hình AI mới nhất của mình có tên là Claude Sonnet 4.5. Phiên bản này tập trung vào việc cải thiện khả năng lập trình, suy luận toán học và năng lực thực thi các tác vụ phức tạp trên máy tính. Đi kèm với mô hình mới là một loạt cập nhật cho các sản phẩm và công cụ hướng đến đối tượng nhà phát triển.
Mô hình mới của Anthropic và các cập nhật mới
Cùng với việc ra mắt Claude Sonnet 4.5, Anthropic cũng giới thiệu các cải tiến cho hệ sinh thái công cụ của mình. Cụ thể, công cụ Claude Code được bổ sung tính năng “checkpoints” giúp lập trình viên lưu và khôi phục lại các phiên làm việc. Ngoài ra, giao diện dòng lệnh (terminal) được làm mới và một extension riêng cho phần mềm VS Code cũng được phát hành. Về phía API, các tính năng mới như chỉnh sửa ngữ cảnh và quản lý bộ nhớ được thêm vào để hỗ trợ các AI agent xử lý những công việc phức tạp trong thời gian dài. Người dùng các ứng dụng Claude giờ đây cũng có thể thực thi mã lệnh và tạo tệp tin trực tiếp trong giao diện trò chuyện.
Đặc biệt, Anthropic lần đầu tiên phát hành bộ công cụ Claude Agent SDK, cung cấp các nền tảng mà công ty đã sử dụng để xây dựng Claude Code, cho phép các nhà phát triển tự tạo ra các tác tử AI của riêng mình.

Theo Anthropic, mô hình mới cho thấy kết quả cao trên bài kiểm tra SWE-bench, vốn dùng để đo lường khả năng viết và sửa lỗi phần mềm. Về khả năng thực thi tác vụ trên máy tính, mô hình đạt 61.4% trên benchmark OSWorld, so với mức 42.2% của phiên bản Sonnet 4 được ghi nhận cách đây bốn tháng. Công ty cũng cho biết mô hình có sự cải thiện về kiến thức chuyên ngành trong các lĩnh vực như tài chính, luật, y khoa và STEM.
Công ty cũng cho biết Claude Sonnet 4.5 có những cải thiện về sự cân bằng. Thuật ngữ này được dùng để mô tả việc huấn luyện mô hình nhằm giảm thiểu các hành vi không mong muốn như đưa ra thông tin sai lệch hay nịnh bợ. Bên cạnh đó, khả năng chống lại các cuộc tấn công “prompt injection” (kỹ thuật dùng câu lệnh để lừa AI) cũng được nâng cao nhằm tăng cường bảo mật cho các hệ thống có khả năng tự thực thi tác vụ.
Claude Sonnet 4.5 hiện đã có sẵn cho các nhà phát triển thông qua API. Mức giá sử dụng cũng được giữ nguyên so với phiên bản Claude Sonnet 4. Anthropic cũng giới thiệu một bản xem trước nghiên cứu tạm thời mang tên “Imagine with Claude”, cho phép người dùng gói Max trải nghiệm khả năng tạo phần mềm theo thời gian thực của mô hình.
Comments