Tin tức

Google Dịch bổ sung thêm 110 ngôn ngữ mới, phá bỏ rào cản ngôn ngữ cho hàng triệu người

0

Với mục tiêu xóa bỏ rào cản ngôn ngữ và kết nối mọi người trên toàn cầu, Google vừa công bố bổ sung 110 ngôn ngữ mới cho công cụ Google Dịch. Đây được xem là bản cập nhật lớn nhất từ trước đến nay của công cụ dịch thuật phổ biến này, nâng tổng số ngôn ngữ được hỗ trợ lên 243.

Được biết, bản cập nhật mang tính đột phá này được thực hiện nhờ sức mạnh của mô hình ngôn ngữ lớn PaLM 2, cho phép Google Dịch học và xử lý hiệu quả hơn các ngôn ngữ có mối liên hệ chặt chẽ. Trong 110 ngôn ngữ mới, từ Quảng Đông phổ biến đến Qʼeqchiʼ ít người biết đến, chúng đại diện cho tiếng nói của hơn 614 triệu người, mở ra các bản dịch thuật cho khoảng 8% dân số thế giới. Đáng chú ý, khoảng một phần tư số ngôn ngữ mới là đến từ Châu Phi, bao gồm Fon, Kikongo, Luo, Ga, Swati, Venda và Wolof.

Dưới đây là một số ngôn ngữ mới được hỗ trợ trong Google Dịch:

  • Afar là một ngôn ngữ thanh điệu được sử dụng ở Djibouti, Eritrea và Ethiopia. Trong số tất cả các ngôn ngữ được ra mắt lần này, Afar có nhiều đóng góp từ cộng đồng tình nguyện nhất.
  • Tiếng Quảng Đông từ lâu đã là một trong những ngôn ngữ được yêu cầu bổ sung nhiều nhất trong Google Dịch. Bởi vì tiếng Quảng Đông thường trùng lặp với tiếng Quan Thoại trong văn bản, nên việc tìm kiếm dữ liệu và huấn luyện mô hình gặp nhiều khó khăn.
  • Manx là ngôn ngữ Celtic của Đảo Man. Nó gần như bị tuyệt chủng sau khi người bản ngữ cuối cùng qua đời vào năm 1974. Nhưng nhờ vào phong trào phục hưng trên toàn đảo, hiện nay đã có hàng nghìn người nói tiếng này.
  • NKo là dạng chuẩn hóa của các ngôn ngữ Manding Tây Phi, thống nhất nhiều phương ngữ thành một ngôn ngữ chung. Bảng chữ cái độc đáo của nó được phát minh vào năm 1949 và hiện có một cộng đồng nghiên cứu tích cực phát triển nguồn lực và công nghệ cho nó.
  • Punjabi (Shahmukhi) là biến thể của tiếng Punjabi được viết bằng chữ viết Ba Tư-Ả Rập (Shahmukhi) và là ngôn ngữ được sử dụng nhiều nhất ở Pakistan.
  • Tamazight (Amazigh) là một ngôn ngữ Berber được sử dụng rộng rãi trên khắp Bắc Phi. Mặc dù có nhiều phương ngữ, nhưng dạng viết có thể hiểu được lẫn nhau. Nó được viết bằng chữ Latinh và chữ Tifinagh, cả hai đều được Google Dịch hỗ trợ.
  • Tok Pisin là một ngôn ngữ Creole dựa trên tiếng Anh và là ngôn ngữ chung của Papua New Guinea. Nếu bạn nói tiếng Anh, hãy thử dịch sang Tok Pisin – bạn có thể hiểu được ý nghĩa của nó!

Cách Google chọn loại ngôn ngữ

Chia sẻ về tiêu chí lựa chọn ngôn ngữ, Google cho biết họ ưu tiên những biến thể được sử dụng phổ biến nhất. Ví dụ, đối với tiếng Romani với nhiều phương ngữ khác nhau, Google Dịch tập trung vào Romani Nam Vlax, biến thể được sử dụng phổ biến ở trên mạng.

Ngoài ra, mô hình ngôn ngữ PaLM 2 còn đóng vai trò quan trọng, giúp Google Dịch học hiệu quả hơn các ngôn ngữ có liên quan chặt chẽ với nhau, bao gồm các ngôn ngữ gần với tiếng Hindi, như Awadhi và Marwadi, và tiếng Creole Pháp như Creole Seychelles và Creole Mauritius.

OnePlus ra mắt điện thoại có hiệu năng khủng: Chạy Snapdragon 8 Gen 3, 24GB RAM, pin 6.100mAh mà giá chưa tới 12 triệu

Previous article

Samsung tiếp tục bị lộ ảnh sản phẩm trước ngày ra mắt, lần này là Galaxy Watch7, Watch Ultra và Galaxy Buds3

Next article