xAI vừa ra mắt Grok 4.1 đã dẫn đầu bảng xếp hạng

xAI vừa chính thức phát hành Grok 4.1, một bản cập nhật mới cho mô hình trí tuệ nhân tạo của mình. Phiên bản này được công bố có tốc độ phản hồi nhanh hơn, khả năng sáng tạo vượt trội hơn và hiện đã có sẵn cho tất cả người dùng (bao gồm cả tài khoản miễn phí) trên grok.com, nền tảng X và ứng dụng di động.

Hiệu suất của Grok 4.1 trên bảng xếp hạng

Hiệu suất của Grok 4.1 được ghi nhận trên Bảng xếp hạng LMArena Text, một thước đo phổ biến về khả năng hội thoại. Cụ thể, chế độ “Thinking” (lý luận sâu) đạt 1483 điểm Elo, giữ vị trí số 1, trong khi chế độ “Fast” (phản hồi nhanh) đạt 1465 điểm Elo, giữ vị trí số 2.

Đáng chú ý, điểm số của chế độ “Fast” (phản hồi nhanh) của Grok 4.1 thậm chí còn vượt qua cả chế độ lý luận đầy đủ của một số mô hình đối thủ. Đây là một sự cải thiện đáng kể so với phiên bản Grok 4 trước đây (xếp hạng 33).

Cải thiện khả năng tương tác và sáng tạo

xAI cho biết, thay vì chỉ tập trung vào các bài kiểm tra logic, Grok 4.1 đã được tối ưu để mang lại các tương tác có chiều sâu hơn, cải thiện “khả năng thể hiện cá tính nhất quán” và “khả năng phát hiện ý định tinh tế”.

Điều này được phản ánh qua điểm số 1586 trên EQ-Bench3 (đo lường trí tuệ cảm xúc) và 1722 trên Creative Writing v3 (đo lường khả năng viết sáng tạo). Sự thay đổi này được thể hiện rõ qua các ví dụ thực tế. Khi nhận được câu lệnh như “Tôi nhớ con mèo của mình đến đau lòng”, phiên bản Grok 4.1 mới đưa ra phản hồi được đánh giá là đồng cảm và thấu hiểu tinh tế hơn (“…mất một con mèo giống như mất đi một thành viên nhỏ trong gia đình… Điều đó đau đớn vì tình yêu đã (và vẫn) lớn lao như thế…”) so với phản hồi có phần tiêu chuẩn của phiên bản cũ.

Giảm hiện tượng “ảo giác”

Một trong những thách thức của các mô hình AI là hiện tượng “ảo giác” (hallucination), tức là đưa ra thông tin có phần bịa đặt và không chính xác. xAI cho biết đã tập trung giải quyết vấn đề này trong quá trình hậu huấn luyện Grok 4.1.

Tỷ lệ “ảo giác” của Grok 4.1 trong các truy vấn tìm kiếm thông tin đã giảm đáng kể, chỉ còn bằng một phần ba so với phiên bản trước. Điều này giúp mô hình trở nên đáng tin cậy hơn khi người dùng tra cứu thông tin nhanh.

Việc phát hành Grok 4.1 cho thấy nỗ lực cải thiện của xAI về cả hiệu suất lẫn trải nghiệm tương tác của mô hình. Bằng cách cung cấp miễn phí phiên bản mới này cho tất cả người dùng, xAI đang tiếp tục chiến lược mở rộng khả năng tiếp cận AI tiên tiến tới công chúng, đồng thời tăng tính cạnh tranh trên thị trường khi OpenAI cũng vừa mới ra mắt GPT-5.1 miễn phí vài ngày trước.