Hướng dẫn chạy DeepSeek R1 cục bộ trên PC

Bài viết này sẽ hướng dẫn chi tiết cách cài đặt và sử dụng mô hình ngôn ngữ lớn (LLM) DeepSeek R1 trên máy tính cá nhân. DeepSeek R1 là một LLM mã nguồn mở mạnh mẽ, nổi bật trong các tác vụ AI đàm thoại, hỗ trợ lập trình và giải quyết vấn đề. Việc chạy mô hình cục bộ mang lại nhiều lợi ích như bảo vệ quyền riêng tư dữ liệu, tăng tốc độ xử lý và khả năng tùy chỉnh sâu rộng.

Để đơn giản hóa quá trình triển khai, chúng ta sẽ sử dụng Ollama, một công cụ cho phép chạy các mô hình AI một cách dễ dàng trên nhiều nền tảng.

Giới thiệu về Ollama

Ollama là một công cụ mã nguồn mở được thiết kế để đơn giản hóa việc chạy các mô hình ngôn ngữ lớn trên máy tính cá nhân. Nó cung cấp các tính năng nổi bật như:

Hỗ trợ đa dạng mô hình: Tương thích với nhiều LLM phổ biến, bao gồm cả DeepSeek R1.
Tính tương thích cao: Hoạt động trên macOS, Windows và Linux.
Dễ sử dụng và hiệu quả: Cài đặt nhanh chóng, lệnh đơn giản và tối ưu hóa tài nguyên.

Các bước cài đặt và sử dụng

Cài đặt Ollama:
- macOS: Mở Terminal và chạy lệnh: Bashbrew install ollama
- Windows và Linux: Tham khảo hướng dẫn chi tiết trên trang web chính thức của Ollama.
Tải mô hình DeepSeek R1:
- Mở Terminal và chạy lệnh: Bashollama pull deepseek-r1
- Để tải các biến thể tinh chỉnh (ví dụ: 1.5B, 7B, 14B), sử dụng cú pháp sau: Bashollama pull deepseek-r1:1.5b
Khởi động Ollama:
- Mở một tab Terminal mới hoặc cửa sổ Terminal khác và chạy lệnh: Bashollama serve
Sử dụng DeepSeek R1:
- Mở một tab Terminal mới hoặc cửa sổ Terminal khác và chạy lệnh: Bashollama run deepseek-r1
- Để chạy biến thể tinh chỉnh, sử dụng cú pháp tương ứng (ví dụ: ollama run deepseek-r1:1.5b).
- Để đưa ra câu lệnh cho mô hình, sử dụng cú pháp sau: Bashollama run deepseek-r1:1.5b "Câu lệnh của bạn"

Ví dụ

Trò chuyện: ollama run deepseek-r1 "What’s the latest news on Rust programming language trends?"
Lập trình: ollama run deepseek-r1 "How do I write a regular expression for email validation?"
Toán học: ollama run deepseek-r1 "Simplify this equation: 3x^2 + 5x - 2."

Giới thiệu về DeepSeek R1

DeepSeek R1 là một mô hình ngôn ngữ lớn được thiết kế đặc biệt cho các nhà phát triển, với các khả năng nổi bật như:

AI đàm thoại: Tạo ra các cuộc trò chuyện tự nhiên, giống con người.
Hỗ trợ lập trình: Hỗ trợ tạo và tinh chỉnh mã nguồn.
Giải quyết vấn đề: Giải quyết các bài toán, thách thức về thuật toán và nhiều hơn nữa.

Tại sao nên chạy DeepSeek R1 cục bộ?

Bảo vệ quyền riêng tư: Dữ liệu của bạn được giữ an toàn trên máy tính cá nhân, không được chia sẻ với bên thứ ba.
Tốc độ xử lý nhanh chóng: Mô hình chạy trực tiếp trên máy tính của bạn, giảm thiểu độ trễ.
Tích hợp linh hoạt: Dễ dàng tích hợp DeepSeek R1 vào quy trình làm việc và các công cụ hiện có.

Các mô hình DeepSeek R1 Distill

DeepSeek còn cung cấp các biến thể Distill của DeepSeek R1, là các phiên bản nhỏ gọn hơn, được tinh chỉnh từ mô hình gốc. Các mô hình này phù hợp cho người dùng có phần cứng hạn chế hoặc ưu tiên tốc độ xử lý.

Lời khuyên

Tự động hóa: Sử dụng shell script để tự động hóa các tác vụ lặp đi lặp lại.
Tích hợp IDE: Kết hợp DeepSeek R1 với IDE của bạn để tăng năng suất.
Công cụ hỗ trợ: Sử dụng các công cụ mã nguồn mở như mods để quản lý và tương tác với các LLM cục bộ và trên đám mây.

Câu hỏi thường gặp

Nên chọn phiên bản DeepSeek R1 nào?
- Nếu bạn có GPU mạnh mẽ, hãy sử dụng phiên bản DeepSeek R1 chính để có hiệu suất tốt nhất.
- Nếu bạn có phần cứng hạn chế hoặc muốn tốc độ xử lý nhanh, hãy chọn các biến thể Distill.
Có thể chạy DeepSeek R1 trong Docker hoặc trên máy chủ từ xa không?
- Có, bạn có thể chạy DeepSeek R1 trong Docker, trên máy ảo đám mây hoặc máy chủ riêng, miễn là Ollama có thể được cài đặt.
Có thể tinh chỉnh DeepSeek R1 không?
- Có, cả mô hình chính và các biến thể Distill đều có thể được tinh chỉnh.
Các mô hình này có hỗ trợ sử dụng thương mại không?
- Có, các mô hình DeepSeek R1 được cấp phép theo MIT, cho phép sử dụng thương mại.

Nguồn: WorkOS