توسعه الگوریتم بازشناسی اعداد دستنویس فارسی بر پایه الگوریتمهای طبقه‌بندی شبکه عصبی چند لایه و احتمالاتی و به کمک مراکز خوشه

نوع مقاله : پژوهشی

نویسندگان

1 دانشکده مهندسی صنایع- دانشگاه صنعتی شریف

2 دانشکده مهندسی صنایع-دانشگاه صنعتی شریف

چکیده

در این پژوهش تلاش گردید با ارائه الگوریتمی بهبود یافته و مبتنی بر خوشه‌بندی، بازشناسی اعداد دستنویس فارسی با دقت قابل توجهی صورت پذیرد. بر این اساس، آموزش و بازشناسی الگو‌ها به کمک شبکه عصبی احتمالاتی و چند لایه پرسپترون میسر گردیده ‌است، به این صورت که پس از استخراج دو دسته ویژگی‌ مکان مشخصه و ناحیه‌ای از داده‌های آموزشی، داده‌های هر یک از کلاس‌های دهگانه بر اساس هر ویژگی با استفاده از روش‌های complete linkage، PAM و FCM خوشه‌بندی شده و کلاس‌های دهگانه جدید حاصل از خوشه‌بندی، توسط یکی از دو الگوریتم طبقه‌بندی کننده آموزش می‌بینند. تعداد بهینه خوشه‌های هر کلاس با استفاده از الگوریتم بهینه‌سازی جستجوی ممنوعه با تابع برازندگی نرخ بازشناسی تعیین می‌شود. میزان دقت الگوریتم در نهایت با استفاده از داده‌های آزمایش مورد سنجش قرار می‌گیرد و با توجه به نتایج ملاحظه می‌شود که الگوریتم پیشنهادی، بازشناسی اعداد دستنویس فارسی را با دقت بالایی انجام می‌دهد.

کلیدواژه‌ها


عنوان مقاله [English]

Development of an Algorithm for Persian Handwriting Digits Recognition Based on MLP and PNN Classifiers and Using Cluster Centers

نویسندگان [English]

  • Ali Miri 1
  • Majid Khedmati 2
1 Department of Industrial Engineering- Sharif University of Technology
2 Department of Industrial Engineering- Sharif University of Technology
چکیده [English]

Pattern recognition is a branch of machine learning that recognizes the patterns and regularities in a set of data and digit recognition is considered as one of the categories of pattern recognition. Due to the similarities between some digits in each language and especially in Persian, different algorithms have been developed to recognize the handwriting digits with the least error and in the shortest time complexity. One of the most common used methods in data classification is the neural network algorithm. while neural networks have been used in the literature for handwriting digits recognition, the combination of clustering approaches and neural network classifiers has not been considered for this problem. Accordingly, in this paper, an algorithm based on the combination of clustering approaches and neural network classifiers is proposed to recognize accurately the Persian handwritten digits. In this algorithm, the pattern training and recognition are performed based on probabilistic neural networks (PNN) and multilayer perceptron (MLP) neural networks. In this regard, after extracting the characteristic loci feature and zoning from each image in the training database, the data of each of the ten classes has been clustered using linkage, Partition Around Medoids (PAM) and Fuzzy C-Means (FCM) methods based on the extracted features. Then, the new ten classes resulted from the clustering algorithm are taught by one of the two classifiers including MLP and PNN. In order to determine the optimal number of clusters in each class, the Tabu search optimization algorithm which is one of the most accurate meta-heuristic optimization algorithms is used. The performance of the proposed algorithms is evaluated and compared with existing algorithms based on HODA dataset. Based on the results, the proposed algorithm recognizes accurately the Persian handwritten digits. In addition, the proposed method performs more accurate and much faster than most of the competing algorithms.

کلیدواژه‌ها [English]

  • Clustering
  • MLP
  • PNN
  • Digit Recognition
  • Tabu Search