0

Mới đây, OpenAI đã phát hành hai mô hình ngôn ngữ mã nguồn mở (open-weight) mới, được tối ưu hóa để chạy cục bộ trên các máy tính để bàn và laptop thông thường. Đây là lần đầu tiên OpenAI cung cấp một mô hình AI mã nguồn mở kể từ năm 2019, đánh dấu sự trở lại trong cuộc đua đang ngày càng gay gắt với các đối thủ như Meta và DeepSeek.

AI mạnh mẽ có thể chạy ngoại tuyến

Hai mô hình AI mới được OpenAI giới thiệu có tên là gpt-oss-20b (phiên bản cỡ vừa) và gpt-oss-120b (phiên bản cỡ lớn). Điểm đặc biệt của các mô hình này là chúng thuộc dạng “open-weight”, tức là các tham số hoặc trọng số đã được huấn luyện của mô hình được công khai. Điều này cho phép các nhà phát triển tải về, chạy cục bộ và tinh chỉnh mô hình cho các tác vụ cụ thể mà không cần kết nối Internet hay truy cập vào máy chủ của OpenAI.

“Một trong những điều độc đáo của các mô hình mở là mọi người có thể chạy chúng cục bộ. Họ có thể chạy chúng phía sau tường lửa của riêng mình, trên cơ sở hạ tầng của riêng họ,” ông Greg Brockman, đồng sáng lập OpenAI, cho biết trong một cuộc họp báo.

Cần phân biệt giữa mô hình “open-weight” và “open-source” (mã nguồn mở hoàn toàn). Các mô hình mã nguồn mở sẽ cung cấp quyền truy cập vào toàn bộ mã nguồn, dữ liệu huấn luyện và phương pháp luận. Động thái này diễn ra trong bối cảnh OpenAI đang trong quá trình huy động tới 40 tỷ USD trong một vòng tài trợ mới do Softbank Group dẫn đầu.

OpenAI cho biết phiên bản nhỏ hơn, gpt-oss-20b, hoạt động tốt nhất với các thiết bị có ít nhất 16GB VRAM hoặc bộ nhớ hợp nhất, và được mô tả là “hoàn hảo cho các GPU tiêu dùng cao cấp và máy Mac dùng chip Apple Silicon”. Trong khi đó, mô hình lớn hơn gpt-oss-120b yêu cầu ít nhất 60GB VRAM hoặc bộ nhớ hợp nhất và có thể chạy trên một GPU duy nhất.

Theo OpenAI, hiệu suất của hai mô hình này tương tự như các mô hình suy luận độc quyền nhỏ hơn của hãng là o3-minio4-mini. Chúng đặc biệt vượt trội trong các lĩnh vực lập trình, toán thi đấu và các truy vấn liên quan đến sức khỏe. Cả hai được huấn luyện trên một bộ dữ liệu chỉ gồm văn bản, tập trung vào kiến thức khoa học, toán học và lập trình bên cạnh kiến thức chung.

Việc OpenAI phát hành các mô hình mở được xem là một bước đi nhằm cạnh tranh trong một thị trường đang rất sôi động. Trong một thời gian, các mô hình Llama của Meta được coi là tốt nhất, nhưng vị thế này đã thay đổi vào đầu năm nay khi DeepSeek của Trung Quốc phát hành một mô hình suy luận mạnh mẽ và hiệu quả về chi phí.

Song song với việc ra mắt sản phẩm mới, Amazon cũng thông báo rằng các mô hình mã nguồn mở của OpenAI hiện đã có mặt trên nền tảng AI tạo sinh Bedrock của Amazon Web Services (AWS). Đây là lần đầu tiên một mô hình của OpenAI được cung cấp trên Bedrock.

So sánh Galaxy A56 5G và POCO X7 Pro: Chọn hiệu năng hay sự cân bằng?

Previous article

Google ra mắt Genie 3, AI tạo thế giới game 3D theo thời gian thực

Next article

You may also like

Comments

Comments are closed.

More in AI