Optical Character Recognition (OCR) is one of the most widely used applications of automatic pattern recognition and it is a very active research field since the 50's. Today there are numerous algorithms that perform this task, each with its own strengths and weaknesses. In this thesis we explore neural networks to find the best topology regarding the number of layers and the number of neurons at each layer by classifying two different datasets using backpropagation networks with two different approaches. We then compare the results between them and show that the obtained optimum set of parameters is valid for both printed letter and the handwritten digits. Moreover the letter dataset consists of sixteen features with 20000 samples and twenty-six classes. Here we see that the number of classes is more than the number of features which affects our results. The second dataset which is handwritten digits consists of sixty-four features with 5620 samples and ten classes. Here we see that the results are better than the first dataset
Optiksel karakter tanımlaması (OKM) atomik model tanımlamasında dünyada en yaygın kullanılan uygulamalardan biridir ve 1950'li yıllardan bu yana oldukça aktif bir araştırma alanına sahiptir. Günümüzde bu alanda kullanılmakta olan bir takım algoritmalar ve bu algoritmalarında her birinin kendine özgü zayıf ve güçlü yanları mevcuttur.Bu tez çalışmasında katman sayısı ve her katmanda bulunan sinir sayısı göz önünde bulundurularak ve geri dağılım şebekesine 2 farklı yaklaşımda bulunularak 2 farklı veri kümesi oluşturduk ve bu yolla sinir ağlan için en iyi topolojiyi araştırdık. Daha sonra sonuçlan karşılaştırarak elde edilen optimum parametre kümesinin hem el yazısı hem de bilgisayar karakter çıktısı için geçerli olduğunu gösterdik. Sözü geçen karakter veri kümesi 16 farklı özellikli 20000 örnek ve 26 sınıftan oluşmaktadır. Burada sonuçlarımızı doğrudan etkileyen sınıf sayısının özellik sayısından sayıca daha fazla olduğu görünmektedir. El yazımı karakterlerden oluşan 2. veri kümesi ise 64 özellikli 5620 örnek ve 10 farklı sınıftan oluşmaktadır. Buradan sonuçların birinci veri kümesinden daha iyi olduğunu gözlemliyoruz