Mới đây, NVIDIA đã chính thức công bố bộ xử lý đồ họa AI thế hệ mới có tên Blackwell với 208 tỷ bóng bán dẫn và khả năng tính toán gấp 5 lần thế hệ trước
Về thông số kỹ thuật, chip Blackwell của NVIDIA có 208 tỷ bóng bán dẫn, cao gấp đôi so với 80 tỷ bóng trên chip H100, có năng lực xử lý AI đạt 20 petaflop (20 triệu tỷ phép tính mỗi giây), gấp năm lần mức 4 petaflop của H100. Theo công bố từ hãng, chip Blackwell trên thực tế có thể xử lý tác vụ nhanh gấp 7-30 lần so với H100, đồng thời giảm 25 lần chi phí cũng như mức tiêu thụ năng lượng.
Ông Jensen Huang – CEO của NVIDIA cho biết, việc huấn luyện một mô hình AI 1.800 tham số trước đây cần đến 8.000 GPU Hopper và 15 megawatt điện. Thế nhưng, 2.000 GPU Blackwell có thể thực hiện khối lượng công việc tương tự với lượng điện năng chỉ là 4 megawatt.
Ngoài ra, vị CEO này chia sẻ rằng, một trong những cải tiến quan trọng trên chip mới là hệ thống Transformer Engine thế hệ thứ hai, giúp tăng gấp đôi khả năng tính toán, băng thông và kích thước mô hình bằng cách sử dụng 4 bit neuron thay vì 8 bit. Khi kết hợp bộ chuyển mạch NVLink, hệ thống này có thể hỗ trợ tối đa 576 GPU giao tiếp với nhau với băng thông hai chiều là 1,8TB/s. The Verge cho biết, điều này đòi hỏi NVIDIA cần phải xây dựng một chip chuyển mạch mạng hoàn toàn mới, có 50 tỷ bóng bán dẫn và sở hữu khả năng tính toán là 3.6 teraflop FP8.
Tại sự kiện, NVIDIA vẫn chưa công bố giá cho chip B200. Hiện nay, chip H100 đang được bán với giá khoảng 30.000 – 40.000 USD. Ngoài ra, NVIDIA cũng hướng tới khách hàng mua số lượng lớn bằng cách đóng gói nhiều chip vào một thiết kế duy nhất, gọi là GB200 NVL72. Gói chứa 72 chip AI, 36 bộ xử lý trung tâm, 600.000 bộ phận và nặng 1.361 kg. Ông Jensen Huang cũng tiết lộ Amazon, Google, Microsoft và Oracle sẽ dùng GB200 NVL72 cho trung tâm dữ liệu của mình.
Bên cạnh chip AI thế hệ mới, Nvidia cũng ra mắt nền tảng nghiên cứu dựa trên đám mây, sử dụng AI để nghiên cứu và thử nghiệm 6G tại GTC 2024. Hệ thống bao gồm một ứng dụng mô phỏng các môi trường như tháp di động đơn lẻ hoặc toàn bộ thành phố, cho phép nhà nghiên cứu và tổ chức thử nghiệm mạng 6G theo thời gian thực mà không cần phải lắp đặt trong thực tế. Các đơn vị đầu tiên tham gia nền tảng này có Nokia, Ansys, Samsung, SoftBank và Đại học Boston.
Theo: The Verge