ارایه دو تابع جدید فعال ساز برای شبکه‌های عصبی مصنوعی با مقادیر مختلط و کاربرد آن ها در مسایل با مقادیر حقیقی

نوع مقاله : مقاله پژوهشی

نویسنده

دانشگاه تربیت مدرس

چکیده

انتخاب تابع فعال‌ساز مناسب یکی از چالش های اصلی شبکه‌های عصبی با مقادیر مختلط می‌باشد. تابع فعال‌ساز انتخابی، باید دو شرط مشتق‌پذیری و کران دار بودن را داشته باشد. زمانی که از این شبکه‌ها برای حل مسایل با مقادیر حقیقی استفاده می‌شود، تابع فعال‌ساز وظیفه نگاشت از فضای مختلط به فضای حقیقی را نیز بر عهده دارد. در این مقاله دو تابع جدید فعال‌ساز برای شبکه‌های با مقادیر مختلط پیشنهاد شده است که شروط فوق را به خوبی تامین می کند. توابع فعال‌ساز پیشنهادی دارای چهار ناحیه اشباع بوده و بر خلاف پرسپترون دو لایه معمولی، توانایی حل مسایل جداناپذیر خطی را دارند. برای هر یک از توابع پیشنهادی، روابط اصلاح وزن استخراج شده و روند آموزش و تست شبکه عصبی شرح داده شده است. با استفاده از دو مجموعه داده ی تشخیص پزشکی، مربوط به بیماری های دیابت و سرطان سینه، عملکرد شبکه بر روی مسایل با مقادیر حقیقی مورد سنجش قرار گرفته و نشان داده شده است که شبکه عصبی مختلط با توابع پیشنهادی، ساختار ساده‌تر و سرعت همگرایی بالاتری نسبت به شبکه‌های چند لایه پرسپترون استاندارد دارند. میزان صحت تشخیص این شبکه‌ها، برای بیماری دیابت 80% و برای سرطان سینه 95% می باشد

کلیدواژه‌ها


عنوان مقاله [English]

Proposing Novel Activation Functions for Complex-Valued Neural Networks and their Applications on Real-Valued Classification Problems

نویسنده [English]

  • Aboozar Ghorbani Nejad
Tarbiat Modares Uni
چکیده [English]

One of the primary challenges in complex-valued neural networks (CVNNs) is to find an appropriate activation function (AF) that should be differentiable and bounded. The AF should properly map the complex domain into real-valued outputs, when the CVNN is used to process real-valued problems. In this paper, we proposed two novel AFs that well satisfied the above conditions. The proposed AFs saturate in four regions and unlike the simple two-layered perceptron, they are able to solve linear non-separable problems. Weight adjustment formulas are developed, and the learning and testing processes are described for both networks. To evaluate the performance of the proposed scheme, two readily available labeled data sets on diabetes and breast cancer are used to detect the respective illnesses. It has been shown that the proposed CVNNs have simpler structures and faster convergence rate than an standard multi-layered realvalued perceptron. The proposed scheme achieves correct diagnosis rates of 80% and 95% for diabetes and breast cancer, respectively in the corresponding data sets.

کلیدواژه‌ها [English]

  • Activation Function
  • Breast Cancer
  • Complex-Valued Neural Networks
  • Diagnostic
  • Diabetes