AITin tức

Claude Opus 4.5 mới được tích hợp vào thẳng Excel và Chrome: Tự động xử lý bảng tính và vượt kỹ sư trong bài test tuyển dụng

    0

    Vừa qua, Anthropic công bố Opus 4.5, phiên bản cuối cùng của dòng 4.5, tiếp nối Sonnet 4.5 và Haiku 4.5. Điểm khác biệt lớn nhất của lần ra mắt này nằm ở chiến lược bình dân hóa các tác vụ phức tạp, biến AI từ một công cụ chat đơn thuần thành trợ lý đắc lực ngay trên nền tảng làm việc quen thuộc.

    Đưa AI vào lõi công việc văn phòng

    Thay đổi mang tính chiến lược nhất của Opus 4.5 là khả năng tích hợp sâu vào các công cụ phổ biến thông qua hai sản phẩm là Claude for ChromeClaude for Excel. Sau giai đoạn thử nghiệm (pilot), Anthropic đã sẵn sàng triển khai rộng rãi các tính năng này.

    Động thái này cho phép Opus 4.5 phát huy tối đa năng lực sử dụng máy tính và phân tích dữ liệu. Cụ thể, tiện ích mở rộng trên Chrome sẽ được cung cấp cho toàn bộ người dùng gói Max. Trong khi đó, công cụ chuyên biệt cho Excel (cho phép AI thao tác trực tiếp trên các bảng tính phức tạp) sẽ khả dụng cho khách hàng thuộc phân khúc Max, Team (Nhóm) và Enterprise (Doanh nghiệp). Đây được xem là lời giải cho bài toán đưa AI vào hỗ trợ trực tiếp các tác vụ văn phòng hàng ngày mà không cần chuyển đổi qua lại giữa các ứng dụng.

    Hiệu suất vượt qua kỹ sư con người

    Để vận hành trơn tru các tác vụ tích hợp nêu trên, Opus 4.5 sở hữu sức mạnh tính toán vượt trội. Trên các bảng xếp hạng uy tín về lập trình (SWE-Bench, Terminal-bench) hay sử dụng công cụ (tau2-bench), mô hình này đều giữ vị trí dẫn đầu. Đáng chú ý, Opus 4.5 là AI đầu tiên phá vỡ mốc 80% điểm số tại bài kiểm tra lập trình SWE-Bench Verified.

    Minh chứng rõ ràng nhất cho năng lực này là kết quả từ bài kiểm tra tuyển dụng nội bộ của Anthropic. Khi được yêu cầu giải cùng một đề bài dành cho vị trí kỹ sư hiệu suất trong giới hạn 2 giờ, Opus 4.5 đã đạt điểm số cao hơn bất kỳ ứng viên con người nào từng tham gia. Kết quả này không chỉ khẳng định vị thế kỹ thuật của Anthropic mà còn đặt ra những câu hỏi lớn về sự thay đổi chất lượng nhân sự trong ngành phần mềm tương lai.

    Xóa bỏ rào cản bộ nhớ với Endless Chat

    Hiểu rằng sức mạnh xử lý sẽ trở nên vô nghĩa nếu AI “quên” mất bối cảnh trong các dự án dài hơi, Anthropic đã tái cấu trúc hoàn toàn cách Opus 4.5 quản lý bộ nhớ. Bà Dianne Na Penn, Giám đốc quản lý sản phẩm nghiên cứu của hãng, khẳng định rằng việc chỉ nới rộng cửa sổ ngữ cảnh (context window) là chưa đủ; AI cần biết chọn lọc chi tiết nào cần ghi nhớ.

    Cải tiến này là nền tảng cho tính năng Endless Chat dành cho người dùng trả phí. Giờ đây, khi chạm ngưỡng giới hạn dữ liệu, hệ thống sẽ không ngắt quãng cuộc hội thoại mà tự động nén các thông tin cũ để giải phóng bộ nhớ. Điều này đảm bảo tính liền mạch, đặc biệt quan trọng khi người dùng sử dụng Opus 4.5 như một lead agent để chỉ huy các tác vụ phức tạp kéo dài.

    Tư duy linh hoạt và bối cảnh thị trường

    Không máy móc tuân theo quy tắc, Opus 4.5 còn thể hiện khả năng tư duy giải quyết vấn đề linh hoạt như con người. Trong một thử nghiệm mô phỏng đại lý hàng không, khi gặp quy định cấm đổi vé hạng phổ thông, AI đã tự đưa ra giải pháp sáng tạo: nâng cấp hạng ghế cho khách trước, sau đó mới tiến hành đổi chuyến. Dù bị máy chấm là sai kịch bản, nhưng cách xử lý này cho thấy mức độ thấu hiểu mục tiêu cuối cùng (giúp đỡ khách hàng) thay vì tuân thủ cứng nhắc.

    Sự xuất hiện của Opus 4.5 vào thời điểm này đã hâm nóng thị trường công nghệ cuối năm, đặt Anthropic vào thế đối đầu trực tiếp với các đối thủ nặng ký như GPT 5.1 của OpenAI (ra mắt 12/11) và Gemini 3 của Google (ra mắt 18/11).

    Hiện tại, Opus 4.5 đã có mặt trên API và ba nền tảng đám mây lớn với mã định danh claude-opus-4-5-20251101. Mức giá niêm yết là 5 USD cho 1 triệu token đầu vào và 25 USD cho 1 triệu token đầu ra, mở ra cơ hội tiếp cận AI cao cấp cho nhiều doanh nghiệp và lập trình viên.

    Comments