Chính phủ Mỹ đã ban hành lệnh yêu cầu Anthropic vô hiệu hóa quyền truy cập vào Claude Fable 5 và Claude Mythos 5 trên phạm vi toàn cầu. Căn cứ vào các lo ngại về an ninh quốc gia, quyết định này buộc công ty phải lập tức dừng mọi kết nối của người dùng đến với 2 mô hình AI mạnh nhất của họ. Hiện tại, người dùng tại Việt Nam khi truy cập Clade cũng không thể sử dụng hai mô hình này.
Lệnh cấm Claude Fable 5 và Claude Mythos 5
Mục tiêu ban đầu của chỉ thị này là ngăn chặn các công dân nước ngoài sử dụng Claude Fable 5 và Claude Mythos 5. Tuy nhiên để tuân thủ quy định trên thì Anthropic phải đóng cửa hai mô hình này đối với tất cả người dùng trên toàn thế giới bao gồm cả các nhân viên mang quốc tịch nước ngoài đang làm việc cho chính họ. Những mô hình AI khác do Anthropic phát triển hiện vẫn hoạt động bình thường.
Sự việc này thu hút nhiều sự chú ý vì Claude Mythos 5 là AI có năng lực cao nhất mà Anthropic từng tạo ra. Kể từ đợt thử nghiệm hồi đầu tháng 4, AI này bị giới hạn truy cập nghiêm ngặt do có khả năng dò tìm lỗ hổng bảo mật phần mềm vượt trội. Đại diện Anthropic cho biết Claude Mythos 5 đã phát hiện ra lỗi trên mọi hệ điều hành và trình duyệt web phổ biến. Do đó công ty chỉ cung cấp AI này cho khoảng 50 tổ chức đã qua thẩm định như Amazon, Apple, Google, Microsoft và CrowdStrike thông qua chương trình Project Glasswing để phục vụ công tác phòng thủ an ninh mạng.

Trong khi đó Claude Fable 5 vừa được phát hành rộng rãi ra công chúng cách đây ba ngày. Đây là phiên bản thương mại của Claude Mythos 5 nhưng được tích hợp thêm các rào cản an toàn nhằm ngăn chặn các câu trả lời liên quan đến rủi ro không gian mạng hoặc sinh học. Theo số liệu kiểm tra từ Vals AI, Claude Fable 5 đạt hiệu suất cao nhất trong số các AI đang được cung cấp cho người dùng trước khi bị đình chỉ.
Mặc dù văn bản chính thức nêu lý do là kiểm soát xuất khẩu, Anthropic tin rằng nguyên nhân cốt lõi xuất phát từ cáo buộc có người đã bẻ khóa thành công Claude Fable 5. Cho đến nay, cơ quan chức năng mới chỉ cung cấp bằng chứng về một phương pháp bẻ khóa trong phạm vi hẹp. Phương pháp này thực chất là yêu cầu AI đọc một đoạn mã nguồn cụ thể để tìm kiếm các lỗi phần mềm bên trong.
Anthropic lập luận rằng khả năng dò lỗi mã nguồn là một tính năng phổ biến, vốn đã có mặt trên nhiều AI khác trên thị trường như GPT-5.5 của OpenAI. Các chuyên gia an ninh mạng cũng đang sử dụng những tính năng tương tự hàng ngày để bảo vệ hệ thống của họ. Đại diện Anthropic khẳng định hệ thống bảo vệ của hãng hoạt động độc lập với AI gốc. Dù người dùng có lừa được Claude Fable 5 vượt qua các quy tắc an toàn, các lớp phòng thủ nền tảng vẫn sẽ ngăn chặn việc tạo ra những nội dung thực sự gây hại. Công ty cũng đã kiểm tra dữ liệu sử dụng gần đây và không phát hiện bất kỳ trường hợp nào vượt qua được rào cản an toàn để gây ra hậu quả tiêu cực.
Việc Anthropic yêu cầu lưu trữ dữ liệu khách hàng của Claude Fable 5 trong 30 ngày chính là một phần trong chiến lược phòng thủ đa lớp này. Chính sách đó tuy tiêu tốn nhiều chi phí nhưng lại giúp công ty có cơ sở nghiên cứu và khắc phục các phương pháp bẻ khóa tiềm ẩn
Hiện tại, Anthropic đã chấp hành lệnh gỡ bỏ nhưng không giấu sự thất vọng trước quyết định từ chính quyền. Công ty không đồng tình với việc cơ quan quản lý thu hồi một sản phẩm thương mại đang phục vụ hàng triệu người dùng chỉ vì một nguy cơ bẻ khóa. Phía Anthropic cảnh báo rằng, nếu áp dụng tiêu chuẩn khắt khe này cho toàn ngành công nghiệp, toàn bộ tiến trình triển khai AI mới của tất cả các nhà cung cấp sẽ bị đình trệ.
Anthropic đồng ý rằng chính phủ cần có quyền ngăn chặn các đợt phát hành AI không an toàn. Mặc dù vậy quy trình đó phải minh bạch, công bằng, rõ ràng và dựa trên các bằng chứng kỹ thuật thực tế chứ không phải áp đặt một cách đường đột. Đội ngũ phát triển của Anthropic đã gửi lời xin lỗi đến toàn bộ khách hàng và đang tích cực làm việc với cơ quan chức năng để sớm khôi phục lại quyền truy cập cho Claude Fable 5 và Claude Mythos 5.
Nguồn: TechCrunch, Anthropic

