یک سیستم نوین پرسش و پاسخ مذهبی در زبان فارسی

نویسندگان

1 گیلان

2 فارغ التحصیل دانشگاه گیلان، کارشناسی ارشد نرم افزار، مهندسی کامپیوتر

چکیده

سیستم‌های پرسش و پاسخ، زیرشاخه‌ای از علوم پردازش زبان طبیعی و بازیابی اطلاعات محسوب می‌شوند که در چند دهه اخیر مورد علاقه زیاد محققین قرار گرفته‌اند. هدف سیستم‌‌های پرسش و پاسخ این است که تکنیک‌هایی فراتر از سیستم‌های بازیابی اطلاعات امروزی را توسعه دهند تا بتوانند پاسخ دقیق سوالات زبان طبیعی را بازیابی کنند. در این پژوهش، معماری پیشنهادی سیستم پرسش و پاسخ در زبان فارسی بر روی سوالات غیرحقیقت معرفی می‌شود. معماری پیشنهادی از سه مولفه پردازش سوال، بازیابی سند و رتبه‌بندی مجدد تشکیل شده است. در مولفه پردازش سوال، پیش پردازش‌های لازم بر روی سوال انجام شده و عنوان سوال تشخیص داده شده است. در مولفه بازیابی سند، موتورهای جستجوی منبع باز مورد استفاده قرار گرفته است و به منظور رتبه‌بندی مجدد، از روش‌های یادگیری ماشین استفاده شده است. نتایج نشان می‌دهد که سیستم پیشنهادی توانسته است به دقت 82.29 درصد و میانگین معکوس رتبه 71.88 درصد دست یابد. می‌توان اظهار کرد که سیستم پیشنهادی در نوع خود، اولین سیستم پرسش و پاسخ با چنین ویژگی‌هایی در زبان فارسی به خصوص در دامنه مذهبی است.

کلیدواژه‌ها


عنوان مقاله [English]

A novel question answering system for religious domain in Persian

نویسندگان [English]

  • SeyedAbolghasem Mirroshandel 1
  • Yasaman Boreshban 2
چکیده [English]

Question answering system is an important major in natural language processing and information retrieval which has interested a group of researchers in these decades. Question answering systems aim to develop techniques that can go beyond the current information retrieval systems in order to return exact answers to natural language questions. In this research, Persian question answering architecture on non-factoid questions will be proposed. The proposed architecture consists of three components: question processing, document retrieval, and re-ranking. In question processing component required preprocessing was performed and question topic was recognized. In document retrieval component, open source search engine was utilized and machine learning methods were applied for re-ranking task. Our experimental result represents that proposed system has achieved 81.29 % accuracy and 71.88 % mean reciprocal rank. It can be stated that our proposed system is the first question answering system with such features in Persian, especially in the religious domain.

کلیدواژه‌ها [English]

  • Information Retrieval
  • Natural Language Processing
  • Question answering system
  • Mean reciprocal rank