This thesis discusses our research on language independent multi-document summarization. We used latent semantic indexing and centroid based clustering methods in our summarization process. Firstly, our algorithm uses latent semantic analysis (LSA) to extract key-terms. Secondly, important sentences holding these key-terms are extracted by applying latent semantic indexing (LSI) and centroidbased clustering methods. Our experiments show that LSA improve key-term extraction. Also, our summarization system has achieved good results, compared to some other multi-document summarization systems.
Bu tez dilden bağımsız olarak çoklu dokümanlardan özet çıkarılması üzerine yaptığımız araştırmayı içermektedir. Özetleme işlemimizde saklı anlamsal indeksleme ve sanal merkeze dayalı kümeleme yöntemlerinden yararlandık. Sistemimizde ilk olarak saklı anlamsal analiz yöntemi kullanılarak anahtar terimler çıkarılır. Daha sonra anahtar terimleri içeren özet cümleler saklı anlam indeksleme ve sanal merkeze dayalı kümeleme yöntemleri kullanılarak çıkarılır. Yaptığımız deneyler saklı anlamsal analiz yönteminin anahtar kelimelerin çıkarılmasında başarılı olduğunu ortaya koymaktadır. Ayrıca, özet çıkarma sistemimiz diğer çoklu doküman özetleme sistemleri ile karşılaştırılınca iyi sonuçlar elde etmiştir.