Öğrencilerin okuldaki akademik başarıları hem öğrenciler hem öğretmenler hem de aileler tarafından önemsenmektedir. Bu nedenle performans tahmini, öğrencinin yaşamında önemli bir rol oynamaktadır. Performans tahmini ile başarısız öğrenciler başarılarını artırmaya yönlendirilebilir, çalışma programları oluşturulabilir, destekleyici ders kaynakları önerilebilir veya seçmeli dersler seçilebilir. Bu çalışmada öğrencinin akademik başarısı makine öğrenmesi yöntemleri ile tahmin edilebilmektedir. Bu çalışmada, Kaggle web sitesinden Portekiz'deki iki okuldan öğrencilerin bilgilerinden toplanan veri seti kullanılmıştır. Performans tahmini yapmak için üç farklı algoritma kullandık. Bunlar Karar Ağacı, Rastgele Orman ve Lojistik Regresyondur. Veri setinin %30'u test verisi olarak kullanılmıştır. Kalan %70'lik veri ise eğitim verisi olarak kullanılmıştır. Üç algoritma kullanılarak, karışıklık matrisi, doğruluk, geri çağırma, kesinlik ve auc değerleri elde edilir. Hangi algoritmanın hangi miktarda veri üzerinde daha başarılı olduğu sonucuna varılmıştır. Karar ağacı algoritması, 649 öğrenci verisi için maksimum derinlik 2 değeri ile en iyi doğruluk oranını verir. Rastgele orman algoritması, 649 öğrenci verisi ile en iyi doğruluğu verir. Lojistik regresyon algoritması, 395 öğrenci verisi ile en iyi doğruluğu verir.
The academic success of students in schools is valued by both students, teachers, and families. For this reason, performance prediction plays a significant role in students' life. With performance prediction, unsuccessful students can be directed to increase their success, study programs can be created, supportive course resources can be suggested, or elective courses can be selected. In this study, the academic success of the student can be predicted with machine learning methods. This study made use of dataset collected from student's knowledge from two schools in Portugal from Kaggle web site. We used three different algorithms to make performance prediction. These are Decision Tree, Random Forest and Logistic Regression. 30% of the dataset was used as test data. The remaining 70% data was used as training data. By using three algorithms, the confusion matrix, accuracy, recall, precision and auc values are obtained. It has been concluded that which algorithm is more successful on which amount of data. decision tree algorithm gives the best accuracy rate with max depth 2 value with 649 student data. The random forest algorithm gives the best accuracy with 649 student data. The logistic regression algorithm gives the best accuracy with 395 student data.