أقامت كلية علوم الحاسب ونظم المعلومات ندوة بعنوان: A MODEL AND FRAMEWORK FOR PLAGIARISM DETECTION IN ARABIC DOCUMENTS IN ARABIC LANGUAGE - College of Computer Science & Information Systems

أرشيف الأخبار

null أقامت كلية علوم الحاسب ونظم المعلومات ندوة بعنوان: A MODEL AND FRAMEWORK FOR PLAGIARISM DETECTION IN ARABIC DOCUMENTS IN ARABIC LANGUAGE

 

 

صبح الانتحال مشكلة سيئة السمعة في المجتمع الأكاديمي العالمي. يعد كشف الانتحال في الوثائق العربية مهمة صعبة بالتحديد بسبب تعقيد بنية اللغة. تقدم هذه الرسالة نموذجاً وإطارًا للكشف عن الانتحال في المستندات العربية. يستند الإطار إلى تمثيل منطقي للمستند مثل الفقرات ، الجمل ، والكلمات. الهدف الرئيسي من هذا البحث هو تطوير وتنفيذ نموذج الكشف عن الانتحال باللغة العربية "ا د بي د ام" والذي يعتمد على النموذج القادر على كشف الانتحال في الوثائق العربية وآلية البحث عن الوثائق المرشحة المماثلة داخل مجموعة بيانات. من خلال تطوير طريقة ما قبل المعالجة بما في ذلك إزالة الكلمات المستبعدة ، الجذعية والتأصيل. التنفيذ على طريقة تعتمد على المحتوى وتتكون أساسا من بصمات النصوص حسب خصوصية اللغة العربية ومقارنة تمثيلها المنطقي باستخدام خوارزميات الإستدلالية للكشف عن الانتحال. لقد قدمت أداة للكشف عن الانتحال في الوثائق لعربية باستخدام وظيفة تجزئة "ب ك د ر" التجزئة تعتمد عليها لتوليد بصمات النصوص باستخدام دالة الهاش. الهدف الثاني هو تمثيل المستند المنطقي هو توفير وقت الحساب عن طريق تجنب المقارنات غير الضرورية. ولهذا السبب ، قمت بتعريف خوارزمية الإستدلال لكل مستوى في الشجرة: مستوى المستند ومستوى الفقرة ومستوى الجملة.