DSpace@Çankaya

Metinden Bağımsız Otomatik Konuşmacı Tanıma Sistemleri ve Performans Karşılaştırması

Basit öğe kaydını göster

dc.contributor.author Taşel, Faris Serdar
dc.contributor.author Sönmez, Arzu Burçak
dc.date.accessioned 2024-03-07T08:47:33Z
dc.date.available 2024-03-07T08:47:33Z
dc.date.issued 2010
dc.identifier.citation Taşel, Faris Serdar; Sönmez, Arzu Burçak. "Metinden Bağımsız Otomatik Konuşmacı Tanıma Sistemleri ve Performans Karşılaştırması", 3. Mühendislik ve Teknoloji Sempozyumu, pp. 1-8, 2010. tr_TR
dc.identifier.uri http://hdl.handle.net/20.500.12416/7519
dc.description.abstract Otomatik Konuşmacı Tanıma Sistemleri önemli bir çalışma alanı olmakla beraber başlıca üç farklı alanda yaygın olarak kullanılmaktadır. Bunlar, kimlik doğrulama, kimlik izleme ve adli uygulamalardır. Otomatik konuşmacı tanıma uygulamaları, konuşma esnasında çıkardığımız seslerden gerekli bilgilerin çıkartılması esasına dayanmaktadır. Geliştirilen uygulamalar, çıkarılan bu bilgiler doğrultusunda, insanları seslerinden tanımaları için eğitilebilirler. Otomatik Konuşmacı Tanıma Sistemlerinde ilk basamak öznitelik çıkarma işlemidir. Bu işlem için MFCC (Mel-frequency Cepstral Coefficients) tabanlı yaklaşımlar yaygın olarak kullanılır. İkinci basamak ise öznitelik sınıflandırma işlemidir. Her konuşmacı bir sınıfa karşılık gelmekte ve bulunduğu sınıfın özelliklerini belirlemektedir. VQ (Vector Quantization - Vektörel Nicemleme) ve GMM (Gaussian Mixture Models - Gaussian Karışım Modelleri), sınıflandırma işleminde kullanılan tekniklerden en yaygın olanlarıdır. Bahsettiğimiz bu işlemler sistemin eğitim safhasında kullanılırlar. Test safhasında ise, herhangi bir kişiden gelen ses bilgisinin eğitim safhasında oluşturulan sınıflardan hangisine ait olabileceğine karar verilir. Kapalı küme sistemlerde, sistem sadece daha önce eğitilmiş konuşmacı sınıflarını ayırdetmekten sorumludur. Bu çalışma, metinden bağımsız, kapalı küme konuşmacı tanıma sistemi geliştirmede etkili olan bu iki tekniği performans açısından karşılaştırmak amacıyla yapılmıştır. Elde edilen sonuçlarda GMM tekniğinin, VQ tekniğinden daha başarılı olduğu gözlemlenmiştir. tr_TR
dc.language.iso tur tr_TR
dc.rights info:eu-repo/semantics/closedAccess tr_TR
dc.subject MFCC tr_TR
dc.subject Konuşmacı Tanıma tr_TR
dc.subject Vektörel Nicemleme tr_TR
dc.subject Gaussian Karışım Modeli tr_TR
dc.title Metinden Bağımsız Otomatik Konuşmacı Tanıma Sistemleri ve Performans Karşılaştırması tr_TR
dc.type conferenceObject tr_TR
dc.relation.journal 3. Mühendislik ve Teknoloji Sempozyumu tr_TR
dc.contributor.authorID 55346 tr_TR
dc.identifier.startpage 1 tr_TR
dc.identifier.endpage 8 tr_TR
dc.contributor.department Çankaya Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü tr_TR


Bu öğenin dosyaları:

Dosyalar Boyut Biçim Göster

Bu öğe ile ilişkili dosya yok.

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster