DSpace Repository

Parallelization study on the clustering technique to mine large datasets

Show simple item record

dc.contributor.author Yıldırım, Ahmet Artu
dc.date.accessioned 2016-02-01T12:36:21Z
dc.date.available 2016-02-01T12:36:21Z
dc.date.issued 2011-01-27
dc.identifier.citation YILDIRIM, A.A. (2011). Parallelization study on the clustering technique to mine large datasets. Yayımlanmamış yüksek lisans tezi. Ankara: Çankaya Üniversitesi Fen Bilimleri Enstitüsü. tr_TR
dc.identifier.uri http://hdl.handle.net/20.500.12416/634
dc.description.abstract Parallel clustering algorithm implementations concerning message passing interface (MPI) and compute unified device architecture (CUDA) model with their applications to very large datasets have been presented in the thesis. WaveCluster is a novel clustering approach based on wavelet transforms. Despite it?s novelty, it requires considerable amount of time to collect results for large sizes of multidimensional datasets. In the MPI algorithm; divide and conquer approach has been followed and communication among processors are kept at minimum to achieve high efficiency. Developed parallel WaveCluster algorithm exposes high speedup and scales linearly with the increasing number of processors. Parallel behavior of WaveCluster approach has been also investigated by executing the algorithm on graphical processing unit (GPU). High speedup values have been obtained in the computation of wavelet transform and connected component labeling algorithms in the GPUs with respect to the sequential algorithms running on the CPU tr_TR
dc.description.abstract Bu tezde, mesaj geçirme ara yüzü (MPI) ve birleşik aygıt mimarisi hesaplaması (CUDA) modelini uygulayarak geliştirilen paralel öbekleme algoritmaları, çok geniş veri kümeleri üzerindeki uygulamaları ile birlikte tanıtılmıştır. WaveCluster, wavelet dönüşümü tabanlı yenilikçi bir öbekleme analizi yaklaşımıdır. Bu yaklaşımın etkinliğine rağmen, çok boyutlu geniş veri kümeleri üzerinde çalıştırıldığında çalışma zamanı fazla olmaktadır. Geliştirilen MPI algoritmasında; yüksek verimlilik değerlerini elde etmek için işlemciler arasındaki haberleşme en az seviyede tutulmuştur. Yapılan deneysel çalışmalarda, MPI algoritması yüksek hızlanma değerleri vermiştir ve ayrıca artan işlemci sayısı ile birlikte doğrusal bir çalışma karakteristiği göstermiştir. WaveCluster yaklaşımı ayrıca grafik işlemci ünitesi (GPU) üzerinde CUDA modeli uygulanarak paralelleştirilmiştir. Geliştirilen CUDA algoritmasında, wavelet dönüşümü ve bağlı parçaları işaretleme algoritmaları geliştirilmiştir. CPU üzerinde sıralı çalışan WaveCluster yaklaşımına kıyasla CUDA algoritmalarında yüksek hızlanma değerleri elde edilmiştir tr_TR
dc.language.iso eng tr_TR
dc.publisher
dc.rights info:eu-repo/semantics/openAccess tr_TR
dc.subject Cluster Analysis tr_TR
dc.subject WaveCluster Approach tr_TR
dc.subject Öbekleme Analizi tr_TR
dc.subject WaveCluster Yaklaşımı tr_TR
dc.subject Paralel WaveCluster tr_TR
dc.title Parallelization study on the clustering technique to mine large datasets tr_TR
dc.title.alternative Geniş veri kümelerini işleme amacıyla öbekleme tekniği üzerine paralelleştirme çalışması tr_TR
dc.type masterThesis tr_TR
dc.contributor.department Çankaya Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Bölümü tr_TR


Files in this item

This item appears in the following Collection(s)

Show simple item record