Google I/O 2022’nin bir parçası olarak şirket, 24 yeni dilin eklenmesi de dahil olmak üzere Google Çeviri için en son değişikliklerini açıkladı. Bunlar dünyanın en yaygın dilleri değildir. Ancak bazıları dünya genelinde milyonlarca insan tarafından kullanılmaktadır. Örneğin, yakında eklenecek en çok kullanılan dil, kuzey Hindistan, Nepal ve Fiji’de kullanılan Bhojpuri’dir. Hindistan’ın 2011 nüfus sayımına göre, dil en az 51 milyon kişi tarafından kullanılıyor.
Google’ın araştırmasına göre, bu son güncellemeden en az kullanılan dil, Hindistan’da yaklaşık 20.000 kişinin kullandığı Sanskritçe. Bu yeni diller, şirketin Zero-Shot Makine Çevirisi teknolojisini kullanarak hizmete eklediği ilk dillerdir. Herhangi bir örnek görmeden kelimeleri başka bir dile çevirmeyi öğrenebilen bir makine öğrenme modelidir. Google, bunun nasıl çalıştığına dair ayrıntıları paylaşmadı. ancak şirketin 2016’dan beri bahsettiği bir teknoloji olarak biliniyor.
Teknolojinin yanı sıra Google, çevirileri hassaslaştırmaya yardımcı olmak için anadili İngilizce olan kişilerden ve dil bilimcilerden yardım aldı. Google, “bu teknoloji etkileyici olsa da mükemmel değil” diyerek bunun sorunlara açık olduğunu belirtiyor. Diller aşağıdadır ve istatistikler, Google’ın dünya çapındaki popülerlik tahminlerinden alınmıştır.
İşte Google Çeviri için Eklenen 24 Dil
- Kuzeydoğu Hindistan’da yaklaşık 25 milyon kişi tarafından kullanılan Assam dili
- Bolivya, Şili ve Peru’da yaklaşık iki milyon kişi tarafından kullanılan Aymara
- Mali’de yaklaşık 14 milyon kişi tarafından kullanılan Bambara
- Kuzey Hindistan, Nepal ve Fiji’de yaklaşık 50 milyon kişi tarafından kullanılan Bhojpuri
- Maldivler’de yaklaşık 300.000 kişi tarafından kullanılan Dhivehi
- Kuzey Hindistan’da yaklaşık üç milyon kişi tarafından kullanılan Dogri
- Gana ve Togo’da yaklaşık yedi milyon kişi tarafından kullanılan Ewe
- Guarani, Paraguay ve Bolivya, Arjantin ve Brezilya’da yaklaşık yedi milyon kişi tarafından kullanılıyor
- Kuzey Filipinler’de yaklaşık 10 milyon kişi tarafından kullanılan Ilocano
- Konkani, Orta Hindistan’da yaklaşık iki milyon kişi tarafından kullanılıyor
- Sierra Leone’de yaklaşık dört milyon kişi tarafından kullanılan Krio
- Çoğu Irak’ta olmak üzere yaklaşık sekiz milyon kişi tarafından kullanılan Kürtçe (Şoran)
- Lingala, Demokratik Kongo Cumhuriyeti, Kongo Cumhuriyeti, Orta Afrika Cumhuriyeti, Angola ve Güney Sudan Cumhuriyeti’nde yaklaşık 45 milyon kişi tarafından kullanılıyor
- Uganda ve Ruanda’da yaklaşık 20 milyon kişi tarafından kullanılan Luganda
- Kuzey Hindistan’da yaklaşık 34 milyon kişi tarafından kullanılan Maithili
- Kuzeydoğu Hindistan’da yaklaşık iki milyon kişi tarafından kullanılan Meiteilon (Manipuri)
- Kuzeydoğu Hindistan’da yaklaşık 830.000 kişi tarafından kullanılan Mizo
- Etiyopya ve Kenya’da yaklaşık 37 milyon kişi tarafından kullanılan Oromo
- Quechua, Peru, Bolivya, Ekvador ve çevre ülkelerde yaklaşık 10 milyon kişi tarafından kullanılıyor
- Hindistan’da yaklaşık 20.000 kişi tarafından kullanılan Sanskritçe
- Güney Afrika’da yaklaşık 14 milyon kişi tarafından kullanılan Sepedi
- Eritre ve Etiyopya’da yaklaşık sekiz milyon kişi tarafından kullanılan Tigrinya
- Eswatini, Mozambik, Güney Afrika ve Zimbabve’de yaklaşık yedi milyon kişi tarafından kullanılan Tsonga
- Gana’da yaklaşık 11 milyon kişi tarafından kullanılan Twi
Dillerin Google Çeviri’de ne zaman görüneceğini henüz bilmiyoruz. Ancak daha sonraki bir tarihte kademeli olarak hizmete sunulmasını bekliyoruz.