The aim of this study is creating a Document Classification system using Vector Space Model as baseline classifier. Cosine similarity is used to calculate similarity between Training Set and Test Set. Finally similar files are used to suggest topics for test files. Same method is used to create Kosmix Training and Test Sets and suggest topics. Results are compared and comparison results shown that Cosine similarity method is more successful.
Bu çalışmanın amacı Vektör Uzay Modeli kullanılarak bir Doküman sınıflandırma sistemi ortaya koymaktır. Daha sonra kosinüs benzerliği kullanarak öğrenme dokümanları ve test dokümanları arasında benzerlikleri hesaplanmıştır. Son olarak yüksek benzerlikli dosyalar üzerinden kategori tahminlemesinde bulunulmuştur. Aynı tahminleme sistemi Kosmix dosyaları üzerinde de uygulanarak sonuçlar karşılaştırılmıştır. Kosinus benzerliği metodunun daha başarılı olduğu sonucuna varılmıştır.