Tại COMPUTEX 2024, NVIDIA đã giới thiệu dòng laptop “RTX AI PC” mới từ ASUS và MSI. Những chiếc laptop này sẽ được trang bị card đồ họa GeForce RTX 4070, vi xử lý AMD Strix mới nhất, hệ điều hành Windows 11 với các tính năng độc quyền trên dòng Copilot+ PC.
Trong sự kiện, NVIDIA cho biết: “Dòng laptop RTX AI PC mới được công bố từ ASUS và MSI sẽ có GPU GeForce RTX 4070 cùng các hệ thống trên chip tiết kiệm năng lượng với khả năng của Windows 11 AI PC”. Ngoài ra, NVIDIA cũng xác nhận với The Verge trong một cuộc họp ngắn rằng, những chiếc laptop mới sẽ đi kèm với CPU Strix mới nhất của AMD.
Tuy nhiên, NVIDIA cho biết, những chiếc Copilot+ PC đầu tiên sử dụng chip AMD có thể sẽ không có các tính năng AI của Microsoft ngay từ khi ra mắt. Trên blog chính thức, hãng viết: “Những chiếc PC Windows 11 AI này sẽ nhận được bản cập nhật miễn phí các tính năng Copilot+ PC khi có sẵn“. Điều này cho thấy Microsoft có thể chưa sẵn sàng ra mắt Recall và các tính năng Windows AI khác trên chip AMD.
Thêm vào đó, NVIDIA cũng đang giữ vững vị thế của mình trong các tác vụ hỗ trợ AI trên laptop. Trong khi Microsoft đang tập trung vào việc chuyển các mô hình AI sang NPU, NVIDIA được cho là đang nỗ lực để GPU của họ trở nên hữu ích các tác vụ AI có trên PC. Được biết, hãng đang tập trung mạnh vào thương hiệu “laptop RTX AI”, nhấn mạnh rằng GPU của họ có khả năng xử lý khối lượng công việc AI nặng hơn so với NPU.
Thậm chí, NVIDIA còn ra mắt RTX AI Toolkit vào tháng 6, bao gồm các công cụ và SDK để tùy chỉnh, tối ưu hóa và triển khai mô hình. Những công cụ này sẽ lấy mô hình Llama 2 của Meta và tối ưu hóa nó để chạy với yêu cầu VRAM thấp hơn và hiệu suất cao hơn.
Ngoài ra, NVIDA còn hợp tác với Microsoft để phát triển các mô hình AI nền tảng được tích hợp vào Windows 11. Sự hợp tác này sẽ cung cấp cho các nhà phát triển ứng dụng quyền truy cập API dễ dàng vào các mô hình ngôn ngữ nhỏ (SLM) được tăng tốc bằng GPU, cho phép họ tạo ra các ứng dụng AI mạnh mẽ hơn chạy trên Windows Copilot Runtime.
Tháng trước, Microsoft đã công bố Windows Copilot Runtime tại sự kiện Build của hãng. NVDIA cho biết, công việc của họ trong việc tăng tốc các mô hình AI bằng GPU RTX sẽ được phát hành dưới bản xem trước cho nhà phát triển vào cuối năm nay. Windows Copilot Runtime được thiết kế để giúp các nhà phát triển dễ dàng thêm các tính năng AI vào ứng dụng của họ, đồng thời dựa vào phần cứng NPU để tăng tốc các tính năng đó, hoặc GPU từ NVIDIA trong thời gian tới.
Hiện tại, sự chênh lệch giữa khả năng xử lý AI của GPU NVIDIA và NPU trên các dòng Copilot+ PC là khá lơn. Cụ thể, khả năng xử lý của CPU chỉ đạt khoảng 40 TOPS, trong khi GPU trên PC của NVDIA có thể đạt tới hơn 1.000 TOPS. Tuy nhiên, NPU lại có ưu điểm là tiêu thụ ít điện năng hơn, phù hợp với các thiết bị di động như laptop. Trong khi đó, GPU lại phù hợp với các tác vụ xử lý mô hình AI lớn với hiệu suất cao hơn trên máy tính để bàn.