In this thesis, I performed text analytics on Turkish academic articles about four science subjects and detected collocations according to statistical measures and tried to benchmark the results of each method in these subjects. The main purpose of my thesis is to create a terminology dictionary using only example journal articles. In accordance with this purpose, I applied some machine learning methods on Weka to test if my scores and Weka results can get more reliable results.
Bu tezde Türkçe akademik makaleler üzerinden çeşitli metodlarla hesaplama yaparak deyim analizi yapmaya çalıştım. Dört farklı konu başlığı altındaki makalelere uyguladığım metodların sonuçlarını sunarak doğruluk karşılaştırması yaptım. Buradaki temel amacım bir dizi akademik makale verildiğinde klasik istatistiksel analiz yöntemleri ile o araştırma alanı için bir terminoloji sözlüğü çıkarmaktır. Bu amaç doğrultusunda da esas uygulamamın yanı sıra Weka ile makine öğrenmesi yöntemlerini kullandım. Bundaki amacım ise her iki uygulamanın kombinasyonu ile daha iyi sonuç elde edip etmediğimi test etmektir.