بازشناسی قلم‌های فارسی با استفاده از اختلاط خبره ها و به کارگیری PCA جهت کاهش ویژگی‌ها

نویسندگان

1 دانشگاه علوم و فنون دریایی خرمشهر فوق لیسانس مهندسی الکترونیک

2 دانشگاه علوم و فنون دریایی خرمشهر ، دکتری معماری کامپیوتر

3 فوق لیسانس الکترونیک

چکیده

در این مقاله، یک روش جدید بر اساس ترکیب ویژگی‌ها و طبقه‌بند‌ها برای بازشناسی قلم‌های فارسی معرفی شده است. ویژگی‌ها ازتصاویر متون مختلف که به صورت بافت‌هایی با ابعاد یکسان 128× 128 پیکسل در آمده‌اند و با استفاده از روش‌های مختلفی همچون فیلتر گابور، نقاب‌های سوبل/روبرت و تبدیل‌های موجک دابیشز، هار و فیلتر‌های پایین گذر و بالا گذر سیملت استخراج شده‌ند. ویژگی‌های استخراج شده از این روش‌ها به صورت 2 به 2 با یکدیگر ترکیب گردیده‌اند. برای ارزیابی نرخ بازشناسی به کمک ویژگی‌های استخراج شده از سه شبکه عصبی MLP جهت طبقه‌بندی استفاده شده‌ و نتایج آنها با هم ترکیب شده‌است. هر کدام از شبکه‌های عصبی با استفاده از مجموعه ویژگی‌های حاصل از ترکیب دو روش آموزش داده شده است. در نهایت با استفاده از الگوریتم جمعیت پرندگان، وزن‌های بهینه را به منظور کمینه شدن خطا تعیین شدند. روش پیشنهادی با استفاده از پایگاه دادهHoda شامل 21000 نمونه از 10 فونت فارسی مختلف، ارزیابی گردیده است. با استفاده از وزن های تعیین شده، ترکیب شبکه‌های عصبی صورت گرفته است. با استفاده از روش ارائه شده نرخ بازشناسی 97.45 درصد بدست آمده‌است که نسبت به دیگر روش‌های ارائه شده بهبود چشمگیری در نرخ بازشناسی نتیجه شده است.

کلیدواژه‌ها


عنوان مقاله [English]

Using ME and PCA for Farsi Font Recognition

نویسندگان [English]

  • vahid zarei 1
  • Mohammad esmaeildoust 2
  • Ehsan Mortazavi 3
چکیده [English]

This paper presents a new method based on a combination of features and classifiers for font. Features are extracted and combined from textures of 128×128 pixels size. For feature extraction, Sobel-Roberts Features, Gabor Filter and different Wavelet transform same as Daubechies and Haar are employed. Extracted features combined together in a pairwise manner. Three MLP (Multi Layer Perceptron) used for classification, the MLPs run on different features. Then their output combined together by employing PSO (Position swarm optimization) algorithm for finding optimum weights. Experimental results have also verified this hypothesis. The proposed algorithm is examined on the Hoda dataset of 21000 samples prepared from 10 different Farsi fonts. The characteristics of the fonts are properly extracted in the method adopted by this research, achieved 97.45% accuracy in recognition rates so it has outperformed previous contributions and higher recognition rates.

کلیدواژه‌ها [English]

  • wavelet transform
  • Farsi font recognition
  • Gradient
  • PSO
  • Mixture of Experts
  • PCA