Tin tức

Tiiny AI Pocket Lab được Guinness xác nhận là MiniPC nhỏ nhất chạy LLM, kích thước bằng sạc dự phòng

    0

    Tiiny AI, một startup công nghệ chuyên sâu (deep-tech) từ Mỹ, vừa công bố Tiiny AI Pocket Lab – thiết bị được Kỷ lục Guinness Thế giới xác nhận là siêu máy tính AI cá nhân nhỏ nhất hành tinh. Sản phẩm này có kích thước chỉ tương đương một cục sạc dự phòng nhưng sở hữu khả năng vận hành các mô hình ngôn ngữ lớn (LLM) lên đến 120 tỷ tham số mà không cần kết nối internet hay máy chủ đám mây.

    Sức mạnh siêu máy tính trong lòng bàn tay

    Tiiny AI Pocket Lab sở hữu kích thước khiêm tốn 14,2 x 8 x 2,53 cm cùng trọng lượng vỏn vẹn 300 gram. Dù ngoại hình nhỏ gọn, thiết bị này giải quyết bài toán hóc búa nhất của ngành trí tuệ nhân tạo hiện nay là đưa sức mạnh tính toán của các trung tâm dữ liệu khổng lồ vào túi áo người dùng.

    Theo công bố từ nhà sản xuất, cỗ máy tí hon này có khả năng chạy các mô hình ngôn ngữ lớn với quy mô lên tới 120 tỷ tham số (120B parameters). Đây là năng lực xử lý thường chỉ thấy trên các hệ thống máy chủ chuyên dụng hoặc những dàn GPU đắt tiền. Tiiny AI định vị sản phẩm này nằm trong “vùng vàng” của AI cá nhân (các mô hình từ 10B đến 100B tham số), đáp ứng hơn 80% nhu cầu thực tế của người dùng chuyên nghiệp, lập trình viên và nhà nghiên cứu.

    Cấu hình phần cứng tối ưu cho AI cục bộ

    Để đạt được hiệu suất này trong một thân máy nhỏ gọn, Tiiny AI Pocket Lab trang bị vi xử lý ARM v9.2 mới nhất với 12 nhân. Trái tim của hệ thống là bộ xử lý thần kinh chuyên biệt (NPU) cung cấp sức mạnh tính toán 190 TOPS (nghìn tỷ phép tính mỗi giây).

    Điểm nhấn kỹ thuật nằm ở dung lượng bộ nhớ RAM lên tới 80GB chuẩn LPDDR5X kết hợp cùng ổ cứng SSD 1TB. Dung lượng bộ nhớ lớn cho phép thiết bị thực hiện kỹ thuật lượng tử hóa (quantization) mạnh mẽ, giúp các mô hình AI khổng lồ vận hành mượt mà ngay trên thiết bị. Mức tiêu thụ điện năng của máy cũng được tối ưu hóa ấn tượng, chỉ khoảng 65W cho toàn hệ thống và 30W TDP, thấp hơn nhiều lần so với các giải pháp GPU truyền thống.

    Kỷ nguyên độc lập khỏi đám mây

    Ông Samar Bhoj, Giám đốc Chiến lược thị trường (GTM) của Tiiny AI nhận định, nút thắt thực sự của AI hiện nay không phải là sức mạnh tính toán mà là sự lệ thuộc vào đám mây. Việc xử lý dữ liệu tập trung tạo ra các rủi ro về quyền riêng tư, chi phí vận hành cao và độ trễ mạng.

    Tiiny AI Pocket Lab hướng đến triết lý “trí tuệ thuộc về con người, không phải trung tâm dữ liệu”. Thiết bị cho phép người dùng thực hiện các tác vụ phức tạp như suy luận đa bước, phân tích ngữ cảnh sâu, tạo nội dung và xử lý thông tin nhạy cảm hoàn toàn ngoại tuyến (offline). Mọi dữ liệu, sở thích và tài liệu của người dùng được lưu trữ cục bộ với mã hóa cấp ngân hàng, đảm bảo tính riêng tư tuyệt đối mà các hệ thống đám mây khó cam kết.

    Sức mạnh của Tiiny AI Pocket Lab đến từ hai công nghệ đột phá do đội ngũ kỹ sư từ MIT, Stanford và Intel phát triển:

    • TurboSparse: Phương pháp kích hoạt thưa thớt (sparse activation) ở cấp độ nơ-ron, giúp tăng hiệu quả suy luận mà không làm giảm độ thông minh của mô hình.
    • PowerInfer: Công cụ suy luận không đồng nhất giúp phân chia khối lượng công việc AI giữa CPU và NPU một cách linh hoạt.

    Sự kết hợp này cho phép thiết bị đạt hiệu suất ngang ngửa máy chủ nhưng vẫn tiết kiệm năng lượng, giúp người dùng tiếp cận khả năng xử lý tương đương GPT-4o ngay trên bàn làm việc.

    Tiiny AI xây dựng một hệ sinh thái phần mềm cởi mở cho thiết bị này. Người dùng có thể cài đặt hàng loạt mô hình mã nguồn mở hàng đầu hiện nay như GPT-OSS, Llama, Qwen, DeepSeek, Mistral và Phi chỉ với một cú nhấp chuột. Máy cũng hỗ trợ triển khai các tác nhân AI (AI agents) phổ biến như OpenManus, ComfyUI hay Flowise.

    Sự xuất hiện của Tiiny AI Pocket Lab tạo ra áp lực cạnh tranh đáng kể lên các giải pháp phần cứng đắt đỏ hiện có. Trong khi các thiết bị như Project Digits của NVIDIA hay DGX Spark có giá dao động từ 3.000 đến 4.000 USD, đại diện Tiiny AI hứa hẹn một mức giá dễ tiếp cận hơn cho người dùng phổ thông.

    Tiiny AI Pocket Lab cùng các tính năng chi tiết sẽ chính thức được trình diễn tại triển lãm công nghệ CES 2026 vào tháng 1 tới.

    Comments