ارائه یک دسته‌بند مقاوم به منظور بازشناسی گفتار مبتنی بر هم‌افزایی خوشه‌بندی و فراوانی مشاهدات

نویسندگان

1 گروه مهندسی کامپیوتر، واحد دزفول، دانشگاه آزاد اسلامی، دزفول، ایران، دکترای کامپیوتر

2 باشگاه پژوهشگران جوان و نخبگان، واحد اندیمشک، دانشگاه آزاد اسلامی، اندیمشک، ایران، کارشناسی ارشد

3 گروه مهندسی کامپیوتر، واحد اندیمشک، دانشگاه ازاد اسلامی، اندیمشک، ایران

چکیده

بازشناسی گفتار به عنوان یکی از مهمترین شاخه های پردازش گفتار از دیر باز مورد توجه پژوهشگران و محققین بوده است. بازشناسی گفتار تکنولوژی است که قادر است کلمه( کلمات) اداء شده را که با یک سیگنال آکوستیک نمایش داده می-شود، معین نماید. پیچیدگی سیستم های بازشناسی گفتار به ویژگی های استخراج شده، بُعد آنها و نیز دسته بند بکار گرفته شده بستگی دارد. در این مقاله، یک دسته بند جدید پیشنهاد می شود که قادر است در فاز استخراج دانش، از طریق هم افزایی خوشه بندی و فراوانی مشاهدات، یک مدل مناسب برای هر کلمه مرجع، در قالب دو ماتریس "برنده" و "حداقل فاصله"، محاسبه نماید. در مرحله بازشناسی، روش پیشنهادی قادر است با استفاده از یک مکانیزم جریمه-پاداش، میزان شباهت بین گفتار ورودی ناشناخته و مدل های مرجع کلمات را معین نماید. به منظور ارزیابی روش پیشنهادی از پایگاه داده فارس دات استفاده شده است. نتایج حاصل از آزمایشات متعدد بر روی سیگنال های تمیز و نویزی نشان می دهند روش پیشنهادی از مقاوم پذیری بهتری در برابر نویز، دقت بالاتر و نیز پیچیدگی زمانی کمتری در مقایسه با سیستم های بازشناسی گفتار مبتنی بر مدل مخفی مارکوف برخوردار است.

کلیدواژه‌ها


عنوان مقاله [English]

Proposing a Robust Classifier for Speech Recognition Based on Synergy Clustering and Observations Frequency

نویسندگان [English]

  • Mohammad Mosleh 1
  • Mohammad Kheyrandish 1
  • Najmeh Hosseinpour 2
  • Mahdi Mosleh 3
چکیده [English]

Speech recognition as one of the important branches of speech processing has been attractive for researchers and scientist, from long time ago. Speech recognition is a kind of technology able to determine the pronounced word(s) shown by acoustic signal. The complexity of speech recognition systems depends on the extracted features, their dimensions and the applied classifier. In this paper, we propose a new classifier which is able to compute two matrices “winner” and “minimum distance” in a knowledge extraction phase, as a suitable model for any reference word using synergy clustering and frequency of observations. In the recognition phase, the proposed method is able to determine the similarity between inputted unknown speech and word reference models based on a penalty-reward mechanism. In order to evaluate the proposed method, the FARSDAT data set is used. The results of several experiments on clean and noisy signals show more resistant against noise, higher accuracy and less time complexity for the proposed method, in comparison to the HMM-based speech recognition system.

کلیدواژه‌ها [English]

  • Classification
  • Feature Extraction
  • Hidden Markov Model(HMM)
  • robustness
  • Clustering
  • Speech recognition