Hôm qua, OpenAI đã chính thức bước vào cuộc đua “tác nhân AI” đang nóng nhất hiện nay. Phiên bản nâng cấp mang tên ChatGPT Agent được trang bị một “máy tính ảo” của riêng mình, cho phép nó chủ động làm việc, suy luận và hành động để hoàn thành các nhiệm vụ phức tạp từ đầu đến cuối.

ChatGPT Agent làm được gì?
Thay vì những câu lệnh đơn giản, giờ đây người dùng có thể giao phó cho ChatGPT Agent những yêu cầu đa tầng. Trong buổi giới thiệu, các lãnh đạo dự án của OpenAI đã trình diễn những khả năng ấn tượng:
- Lên kế hoạch phức tạp: Yêu cầu “lên kế hoạch cho một buổi hẹn hò”, Agent sẽ tự động kết nối Lịch Google để tìm buổi tối rảnh, sau đó đối chiếu với dịch vụ đặt bàn để tìm nhà hàng phù hợp và gợi ý cho người dùng.
- Phân tích và sáng tạo: Nó có thể “phân tích ba đối thủ cạnh tranh và tạo một bản trình chiếu slide”, tự động tổng hợp thông tin và biến nó thành một sản phẩm cụ thể.
- Tự động hóa công việc đời thường: Trưởng nhóm sản phẩm Yash Kumar chia sẻ ông đã dùng Agent để tự động hóa việc xin cấp chỗ đậu xe mới tại văn phòng vào thứ Năm hàng tuần, một công việc nhỏ nhưng ông thường hay quên.
Công nghệ đằng sau ChatGPT Agent
Sức mạnh của ChatGPT Agent đến từ một mô hình AI hoàn toàn mới, được phát triển chuyên biệt bằng cách hợp nhất hai công nghệ có sẵn là khả năng tương tác web như người thật của công cụ “Operator” và kỹ năng tổng hợp, phân tích sâu của “Deep Research”. Nó được cấp quyền truy cập vào “toàn bộ một chiếc máy tính” thay vì chỉ một trình duyệt, và được trang bị bộ công cụ mạnh mẽ:
- Trình duyệt trực quan và văn bản: Để tương tác với website một cách linh hoạt.
- Terminal: Để chạy mã lệnh và xử lý tệp tin.
- Trình kết nối (Connectors): Cho phép kết nối với các ứng dụng như Gmail, Github để truy xuất và hành động dựa trên dữ liệu của người dùng.
Trong các bài kiểm tra, Agent đã thiết lập nhiều kỷ lục mới về hiệu năng, thậm chí vượt trội đáng kể so với con người trong các tác vụ phức tạp về khoa học dữ liệu (DSBench) và mô hình tài chính.
Việc ra mắt của ChatGPT Agent là một phần trong xu hướng lớn của toàn ngành. Khái niệm “tác nhân AI” đã trở thành tâm điểm từ năm 2023, với các gã khổng lồ như Amazon, Meta và Google đều công khai mục tiêu này. Thực tế đã chứng minh sức mạnh của công nghệ khi công ty fintech Klarna thông báo tác nhân AI của họ đã xử lý khối lượng công việc tương đương 700 nhân viên chỉ sau một tháng.
OpenAI thừa nhận rằng một công cụ mạnh mẽ cũng đi kèm những rủi ro mới, đặc biệt là nguy cơ “tấn công prompt injection” khi một trang web độc hại có thể lừa AI thực hiện hành động sai trái. Để giải quyết vấn đề này, OpenAI đã thiết lập nhiều lớp bảo vệ, đặt người dùng vào vị trí trung tâm của sự kiểm soát. Cụ thể, Agent phải luôn xin phép trước khi thực hiện bất kỳ hành động không thể đảo ngược nào như gửi email hay mua hàng, và người dùng có toàn quyền can thiệp vào quá trình bất cứ lúc nào. Thêm vào đó, một cơ chế bảo vệ bổ sung là “Chế độ Theo dõi” (Watch Mode) sẽ được kích hoạt khi AI truy cập các trang web nhạy cảm như tài chính, yêu cầu người dùng phải giám sát trực tiếp để tác vụ tiếp tục. Để hạn chế rủi ro ở mức tối đa, các giao dịch tài chính hiện cũng đang bị giới hạn và mô hình được huấn luyện để chủ động từ chối các yêu cầu nguy hiểm như chuyển khoản ngân hàng.
Đáng chú ý, OpenAI đã chủ động áp dụng các biện pháp phòng ngừa ở mức cao nhất cho các rủi ro sinh học và hóa học, thể hiện sự cẩn trọng tối đa.
Mặc dù mạnh mẽ, đội ngũ phát triển cũng cho biết Agent có thể hoạt động hơi chậm, bởi nó được tối ưu cho các tác vụ khó thay vì tốc độ tức thời. “Đây là thứ bạn có thể khởi động để nó chạy ngầm và quay lại sau khi hoàn thành,” đại diện OpenAI giải thích.
Cách sử dụng và lộ trình tương lai
OpenAI đã bắt đầu triển khai ChatGPT Agent cho người dùng các gói Pro, Plus, và Team. Người dùng có thể kích hoạt bằng cách chọn “agent mode” trong menu công cụ hoặc gõ lệnh “/agent”. Các tài khoản Doanh nghiệp và Giáo dục sẽ được tiếp cận vào cuối mùa hè này.
Đây mới chỉ là bước khởi đầu. OpenAI khẳng định sẽ liên tục cải tiến để biến ChatGPT Agent trở thành một công cụ ngày càng hiệu quả, an toàn và hữu ích hơn trong tương lai.
Comments