dc.contributor.author |
Erciyes, Necdet Eren
|
|
dc.date.accessioned |
2023-07-19T13:21:54Z |
|
dc.date.available |
2023-07-19T13:21:54Z |
|
dc.date.issued |
2022 |
|
dc.identifier.citation |
Erciyes, Necdet Eren (2022). Deep learning methods with pre-trained word embeddings and pre-trained transformers for extreme multi label text classification / Çoklu etiket sınıflandırması için önceden eğitilmiş kelime vektörleri ve önceden eğitilmiş transformer modelleri ile derin öğrenme yöntemleri. Yayımlanmış yüksek lisans tezi. Ankara: Çankaya Üniversitesi Fen Bilimleri Enstitüsü. |
tr_TR |
dc.identifier.uri |
http://hdl.handle.net/20.500.12416/6543 |
|
dc.description.abstract |
Son yıllarda, çevrimiçi metin belgelerinde dikkat çekici sayısal bir artış olduğu görülmektedir. Bu artış, metni birçok farklı alanda sınıflandırmak için oldukça gelişmiş makine öğrenimi yöntemlerinin oluşturulmasını gerektiriyor. Bu makine öğrenimi yöntemlerinin etkinliği, yapılandırılmamış verilerin karmaşık doğasını ve var olan özelliklerin ilişkilerini anlamak için model kapasitesine bağlıdır. Metin sınıflandırma problemlerini çözmek için uzun süredir SVM, kNN, Rocchio sınıflandırması gibi birçok farklı makine öğrenmesi yöntemi önerilmiştir. Bu sığ öğrenme yöntemleri, pek çok farklı alanda şüphesiz başarıya ulaşmıştır. Metin gibi büyük ve yapılandırılmamış veriler için, herhangi bir özellik çıkarma yöntemi kullanmadan giriş verilerinden temsilleri ve özellikleri öğrenebilen derin öğrenme yöntemleri önemlil çözümlerden biri olarak gösterilmiştir. Bu çalışmada, basit RNN, CNN modellerinden önceden eğitilmiş transformer modellerine kadar çok etiketli metin sınıflandırması için son önerilen derin öğrenme yöntemlerinin doğruluğunu araştırıyoruz. Bu yöntemlerin performanslarını çok etiketli değerlendirme ölçütlerini hesaplayarak değerlendirdik ve sonuçları önceki çalışmalarla karşılaştırdık. |
tr_TR |
dc.description.abstract |
In recent years, there appears to be a remarkable increase int the number of textual documents online. This increase requires the creation of highly improved machine learning methods to classify text in many different domains. The effectiveness of these machine learning methods depends on the model capacity to understand the complex nature of the unstructured data and the relations of the features that exist. Many different machine learning methods were proposed for a long time to solve text classification problems, such as SVM, kNN and Rocchio classification. These shallow learning methods have achieved doubtless success in many different domains. For big and unstructured data like text, deep learning methods which can learn representations and features from the input data without using any feature extraction methods have shown to be one of the major solutions. In this study, we explore the accuracy of recent recommended deep learning methods for multi-label text classification starting with simple RNN, CNN models to pre-trained transformer models. We evaluated these methods' performances by computing multi-label evaluation metrics and compared the results with the previous studies. |
tr_TR |
dc.language.iso |
eng |
tr_TR |
dc.rights |
info:eu-repo/semantics/openAccess |
tr_TR |
dc.subject |
Çok Etiketli Metin Sınıflandırma |
tr_TR |
dc.subject |
Makine Öğrenmesi |
tr_TR |
dc.subject |
Derin Öğrenme |
tr_TR |
dc.subject |
Kelime Yerleştirme |
tr_TR |
dc.subject |
Transformerlar |
tr_TR |
dc.subject |
Multi-Label Text Classification |
tr_TR |
dc.subject |
Machine Learning |
tr_TR |
dc.subject |
Deep Learning |
tr_TR |
dc.subject |
Word Embedding |
tr_TR |
dc.subject |
Transformers |
tr_TR |
dc.title |
Deep learning methods with pre-trained word embeddings and pre-trained transformers for extreme multi label text classification |
tr_TR |
dc.title.alternative |
Çoklu etiket sınıflandırması için önceden eğitilmiş kelime vektörleri ve önceden eğitilmiş transformer modelleri ile derin öğrenme yöntemleri |
tr_TR |
dc.type |
masterThesis |
tr_TR |
dc.identifier.startpage |
1 |
tr_TR |
dc.identifier.endpage |
47 |
tr_TR |
dc.contributor.department |
Çankaya Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Bölümü |
tr_TR |