Chi tiết Gemini 1.5 mới ra mắt: Mạnh tương đương Gemini 1.0 Ultra

Mới đây, Google đã trình làng Gemini 1.5, phiên bản nâng cấp của Gemini 1.0 từng được giới thiệu tháng 12 năm ngoái. Đây là mô hình ngôn ngữ lớn (Large Language Model – LLM) được đào tạo trên cấu trúc cùng cơ sở dữ liệu mới hơn, hứa hẹn cải thiện đáng kể hiệu suất sử dụng của người dùng.

Google giới thiệu mô hình ngôn ngữ Gemini 1.5

Nâng cấp lớn nhất trên Gemini 1.5 đến từ lượng cửa sổ ngữ cảnh mà mô hình này hỗ trợ. Theo 9to5Google, “Cửa sổ ngữ cảnh” (Context Windows) của mô hình AI được tạo thành từ các mã thông báo, là các khối được xây dựng để xử lý thông tin. Được biết, phiên bản Pro của Gemini 1.5 sở hữu cửa sổ ngữ cảnh lên đến 128.000 mã thông báo, gấp 4 lần so với Gemini 1.0. Con số này ngang ngửa với GPT-4 Turbo của OpenAI và kém một chút so với Claude 2.1 của Anthropic (200.000).

Theo GenK, việc cửa sổ ngữ cảnh hỗ trợ nhiều mã thông báo hơn có những lợi ích như sau:

Gemini 1.5 Pro có thể phân tích, phân loại và tóm tắt chính xác một lượng lớn nội dung với những yêu cầu nhất định. Chẳng hạn, khi được cung cấp 402 trang bản ghi âm từ sứ mệnh Apollo 11 lên mặt trăng, nó có thể suy luận về các cuộc trò chuyện, sự kiện và chi tiết trong toàn bộ tài liệu.

Gemini 1.5 Pro có khả năng hiểu và suy luận phức tạp với các dạng dữ liệu đa phương thức, bao gồm video. Chẳng hạn, khi được cung cấp một bộ phim câm 44 phút của Buster Keaton, mô hình có thể phân tích chính xác các điểm cốt truyện và sự kiện, thậm chí suy luận về những chi tiết nhỏ trong phim mà người xem dễ bỏ qua.

Gemini 1.5 Pro có thể giải quyết các vấn đề phức tạp hơn trong khối lượng code lớn. Khi được cung cấp một yêu cầu với hơn 100.000 dòng code, nó có thể suy luận dựa trên các ví dụ, đề xuất những thay đổi hữu ích và giải thích cách thức hoạt động của các phần khác nhau trong code.

So với Gemini 1.0 Pro, Gemini 1.5 Pro cho hiệu suất vượt trội hơn 87% với các điểm chuẩn đánh giá trên văn bản, code, hình ảnh, âm thanh và video. Nó thậm chí hoạt động ở mức tương đồng với Gemini 1.0 Ultra. Gemini 1.5 Pro cũng thể hiện kỹ năng “học theo ngữ cảnh” ấn tượng. Trên thực tế, nó có thể học một kỹ năng mới từ những thông tin được cung cấp trong thời gian dài mà không cần tinh chỉnh gì thêm.

Vừa qua, Google đã chính thức đổi tên chatbot Bard thành Gemini, đồng thời ra mắt gói dịch vụ trả phí với giá 20 USD mỗi tháng dành cho người dùng muốn sử dụng nhiều tính năng và các tác vụ xử lý phức tạp. Tại Việt Nam, gói Gemini Advanced được Google đặt ở mức giá 489.000đ mỗi tháng. Đi cùng với sự thay đổi này, Google cũng ra mắt ứng dụng độc lập của Gemini trên hệ điều hành Android.

Nguồn: 9to5Google, GenK