Chỉ vài ngày sau khi ra mắt mô hình GPT-5.3 Instant, OpenAI vừa tiếp tục giới thiệu GPT-5.4 – phiên bản trí tuệ nhân tạo mới nhất với những nâng cấp đáng kể về khả năng suy luận, viết mã lệnh và hỗ trợ công việc văn phòng (như xử lý bảng tính, tài liệu hay bài thuyết trình). Điểm nhấn đáng chú ý nhất của phiên bản này là tính năng điều khiển máy tính trực tiếp. Thay vì chỉ đưa ra các bước hướng dẫn bằng văn bản như trước đây, GPT-5.4 có thể thay người dùng trực tiếp thao tác trên máy tính để hoàn thành các tác vụ liên quan đến nhiều phần mềm và ứng dụng khác nhau.
Khả năng AI trực tiếp thao tác trên máy tính
Tính năng mới này phù hợp với định hướng phát triển công nghệ AI hiện nay, khi các hãng muốn tạo ra các công cụ hoạt động ngầm để tự xử lý những công việc trực tuyến. Theo OpenAI, mô hình có thể viết mã lệnh để điều khiển hệ thống, đồng thời thực hiện các thao tác nhấp chuột và gõ phím dựa trên việc phân tích ảnh chụp màn hình thiết bị. Để dễ hình dung, sự xuất hiện của các công cụ như ChatGPT Agent cho phép bạn giao phó những nhiệm vụ cần thao tác qua nhiều bước. Chẳng hạn, khi bạn nhập câu lệnh: “Hãy tìm công thức nấu món phở bò, sau đó truy cập trang web siêu thị và đặt mua các nguyên liệu cần thiết”, AI sẽ tự động mở trình duyệt, tìm kiếm và thêm sản phẩm vào giỏ hàng thay cho bạn. Dù vậy, người dùng vẫn cần theo dõi quá trình này vì tính năng tự động hóa trên máy tính vẫn đang ở giai đoạn đầu và có thể xảy ra lỗi.
Khả năng tổng hợp thông tin và cải thiện độ chính xác
Bên cạnh việc sử dụng ứng dụng, GPT-5.4 cũng được cải thiện khả năng thu thập và tổng hợp thông tin từ nhiều nguồn khác nhau. OpenAI cho biết mô hình có thể duy trì việc tìm kiếm qua nhiều bước để lọc ra những dữ liệu phù hợp nhất. Tính năng này hữu ích với các câu hỏi yêu cầu tìm kiếm chi tiết giữa lượng thông tin lớn, từ đó giúp AI tổng hợp thành một câu trả lời rõ ràng và có tính logic. Về mức độ chính xác, OpenAI thông báo GPT-5.4 là mô hình bám sát thực tế nhất của họ hiện tại, với tỷ lệ đưa ra thông tin sai lệch giảm khoảng 33% so với phiên bản GPT-5.2. Tuy nhiên, người dùng vẫn nên chủ động kiểm chứng các số liệu quan trọng. Trí tuệ nhân tạo đang dần tốt hơn, nhưng các mô hình này chưa đạt đến mức trí tuệ nhân tạo tổng quát, do đó vẫn chưa thể đảm bảo độ chính xác tuyệt đối trong mọi trường hợp.
Tích hợp vào hệ thống API và giao diện ChatGPT
OpenAI đang cung cấp GPT-5.4 qua nhiều kênh khác nhau để người dùng dễ tiếp cận. Khả năng chính của mô hình được tích hợp vào hệ thống API và công cụ hỗ trợ lập trình Codex. Điều này giúp GPT-5.4 kết nối với các công cụ và API bên thứ ba chính xác hơn để hỗ trợ hoàn thành công việc, đồng thời việc AI tương tác với các trình duyệt web cũng hoạt động ổn định hơn. Đối với người dùng phổ thông, OpenAI đang bắt đầu đưa mô hình suy luận GPT-5.4 Thinking trực tiếp vào giao diện ChatGPT. Nhờ đó, người dùng có thể sử dụng khả năng phân tích mới này để xử lý các công việc văn phòng cần sự liền mạch, liên quan đến tài liệu, bảng tính hay bài thuyết trình.




Comments