شناسایی سرقت ادبی مبتنی بر الگوریتم ژنتیک و برچسب گذاری نقش معنایی در مقالات علمی

نویسندگان

1 کارشناس ارشد،دانشگاه آزاد اسلامی، واحد ملایر، باشگاه پژوهشگران جوان و نخبگان، ملایر، ایران

2 استادیار گروه مهندسی کامپیوتر، دانشگاه بوعلی سینا، همدان، ایران

چکیده

امروزه با پیشرفت روز افزون اینترنت و گسترش مقالات برخط ‌‌دستبردهای علمی راحت‌‌تر شده است. سرقت ادبی استفاده دوباره یا کپی کردن متنی بدون ارجاع به نویسنده‌‌ی اصلی است. سرقت علمی یا تقلب در مدارس و دانشگاهها می‌‌تواند به عنوان یک فاکتور محرک برای معلمان، دانش آموزان، دانشجویان و اساتید به حساب آید. اگر سرقت علمی و ادبی به درستی شناسایی نشود، متقلبان و سارقان می‌‌توانند به نتایجی برسند که مستحق آن نیستند. در این مقاله روشی جهت شناسایی سرقت ادبی بر مبنای برچسب‌‌گذاری نقش معنایی و الگوریتم ژنتیک ارائه می‌‌شود. روش پیشنهادی بر روی متون انگلیسی عمل پردازش را انجام می‌‌دهد. نتایج آزمایش بر روی مجموعه داده‌‌های PAN-PC-09 نشان می‌‌دهد که روش پیشنهادی، مقدار پارامترهای ارزیابی مانندRecall،‌‌Precision و F-measureرا نسبت به روش‌‌های قبلی ارائه شده در زمینه شناسایی سرقت ادبی بهبود می‌‌دهد.

کلیدواژه‌ها


عنوان مقاله [English]

Plagiarism detection in the scientific papers using semantic role labeling and Genetic algorithm

نویسندگان [English]

  • rezvan yaghobi 1
  • حسن ختن لو 2
چکیده [English]

In recent years, Plagiarism has been easier through increasing development of internet and online papers. Plagiarism is to reuse or copy a text without referencing to the original author. Plagiarism or fraud in schools and universities will be a stimulating factor for researchers. If plagiarism was not identified correctly, cheaters and Plagiarists could get results that are not deserved.This paper presents a method based on the semantic role labeling (SRL) and Genetic Algorithm (GA). The Proposed method works on English texts. Results of the experiments on PAN-PC-9 corpus demonstrate that the proposed method improves values of evaluation parameters such as recall, precision and F-measure, comparing with previous approaches in plagiarism detection.

کلیدواژه‌ها [English]

  • Semantic Plagiarism
  • Similarity calculation
  • Semantic Role Labeling
  • Genetic Algorithm
  • Plagiarism