Bilim Haberleri

Meta’dan sonra Google’da yapay zekaya ses ürettiriyor

Yapay zeka teknolojisi her geçen gün yeni bir düzeye ulaşıyor. Birçok kişi bu teknolojiyi ödevlerini tamamlamakta kullanırken, yapay zeka bu çeşit kullanımların çok daha ötesine geçebiliyor. Google, yıllardır yapay zekanın bu potansiyelini tam manasıyla keşfetmek için çalışmalar yapıyor. AudioPaLM ismini verdikleri son geliştirmeleriyle, eşsiz bir doğrulukla dinleme, konuşma ve çeviri yeteneği sunabilecek bir model üzerinde çalışıyorlar.

Google araştırmacıları, AudioPaLM ismini verdikleri, dinleme, konuşma ve çeviri yeteneği olan yeni bir lisan modelini tanıttılar. Bu model, PaLM-2 ve AudioLM ismindeki iki var olan modelin yeteneklerini birleştirerek oluşturuldu. AudioPaLM, metin tabanlı bir lisan modeli olan PaLM-2’nin dilsel bilgi tahlil yeteneği ile paralinguistik bilgi muhafaza konusunda harika olan AudioLM modelinin yeteneklerini bir ortada sunarak hem metin üzerinde hem de konuşmada daha geniş kapsamlı bir anlayış ve üretim sağlıyor.

Meta’dan sonra Google’da yapay zekaya ses ürettiriyor

AudioPaLM, konuşmayı ve metni temsil etmek için sonlu sayıda belirteç kullanan bir söz dağarcığı kullanıyor. Bu da, konuşma tanıma, metinden sese dönüştürme ve konuşmadan konuşmaya çeviri üzere süreçlerin tek bir mimari ve eğitim sürecine entegre edilmesini mümkün kılıyor.

AudioPaLM, mevcut sistemlere kıyasla daha yeterli bir performans gösterdiği belirtildi. Bu model, daha evvel karşılaşmadığı lisan kombinasyonları için sıfır öğrenme ile metinden konuşmaya çeviri yapabiliyor. Kısa konuşma ipuçlarına dayanarak, sesleri farklı lisanlar arasında taşıyabiliyor ve farklı lisanlardaki farklı ses tonlarını yakalayıp yine üretebiliyor.

Haberois Editör

Türkiye'nin bir numaralı haber platformu olan Haberois, okuyucularına en güncel son dakika haberlerini tarafsız olarak sunar.

İlgili Makaleler

Başa dön tuşu