Mozilla‘nın geliştirmeye devam ettiği yan projelerden biri olan DeepSpeech; Baidu tarafından hem CPU hem de NVIDIA CUDA hızlandırmasıyla TensorFlow’un üstüne inşa edilen bir konuşma metni motoru olarak tanımlanıyor. Mozilla DeepSpeech 0.6’nın bu hafta yapılan performans iyileştirmeleriyle kullanıma sunulduğu bildiriliyor. DeepSpeech 0.6, Reuben Morais tarafından duyuruldu. DeepSpeech 0.6, şu anda bu açık kaynak kodlu konuşma metni motoru için %7.5 kelime hata oranı sağlamış bulunuyor. Yeni sürüm çeşitli API değişikliklerine, eğitim grafikleri için TensorFlow 1.14 cuDNN RNN desteğiyle daha iyi eğitim performansına sahip bulunuyor, ayrıca, dil modellerini en iyi 500k kelimeyi kullanacak şekilde kısalttığı söyleniyor. DeepSpeech 0.6’yı ses dosyalarından gelen konuşmaları yazmak için denemek isteyenler, GitHub‘dan gelen ikilileri alabilirler. Mozilla Hacks blog‘unda DeepSpeech 0.6 hakkında ayrıntılı bilgi edinilebilir.
DeepSpeech 0.6 edinmek için aşağıdaki linklerden yararlanabilirsiniz.