ورود کاربران دانشگاهی
ثبت نام(مطالعه آنلاین پایان نامه ها)
کاربر مهمان
سپندا
جمعه 10 فرودرین 1403
|
54.174.85.205
:Your IP
س
امانه
پ
ایان
ن
امه های
د
انشگاه
ا
صفهان (
سپندا
)
صفحه اول(جستجو)
مرور موضوعی
پرسش های متداول و راهنما
سامانه تطبیق پایان نامه با شیوه نامه
تماس با ما
(0)
عنوان :
ابهام زدایی اسم های هم نام در ترجمه ماشینی فارسی به انگلیسی براساس چهارچوب تحلیل معنایی پنهان
انتشارات :
دانشگاه اصفهان
سال :
1396
زبان :
Persian
شماره سند :
15667
موضوع :
زبان شناسی گرایش رایانشی
پژوهشگر :
سحر نجفی مرغملكی
توصیفگر لاتین :
Machine translation ? Disambiguation ? Natural language processing ? Homonymy ? Corpus
توصیفگر فارسی :
ترجمه ماشینی ◄ ابهام زدایی ◄ پردازش زبان طبیعی ◄ هم نامی ◄ پیكره
دانشکده :
دانشكده زبانهای خارجی، گروه زبان شناسی
مقطع :
كارشناسی ارشد
استاد راهنما :
رضوان متولیان نائینی، بیژن شوشتریان
استاد مشاور :
سال دفاع :
1396
شماره رکورد :
15667
شماره راهنما :
اردیبهشت ماه 1396
فهرست :
فهرست مطالبعنوان صفحهفصل اول: کلیات پژوهش1-1. مقدمه 12-1. بیان مسأله¬ی پژوهشی 21-3. اهمیت پژوهش و کاربردهای آن 41-4. اهداف پژوهش 41-5. سؤالات پژوهش 41-6. روش¬شناسی پژوهش 51-7. تعریف واژگان تخصصی 71-8. جمع¬بندی 7فصل دوم: پیشینه¬ی پژوهش2-1. مقدمه 92-2. پیشینه¬ی پژوهش 92-2-1. پیشینه¬ی داخلی 92-2-2. پیشینه¬ی خارجی 152-3. جمع¬بندی 19فصل سوم: مبانی نظری پژوهش3-1. مقدمه 213-2. ماشین ترجمه 213-2-1. ترجمه ماشینی مبتنی بر فرهنگ لغت 233-2-2. ترجمه ماشینی مبتنی بر قاعده 243-2-2-1. روش مستقیم ...................................................................................................................... 253-2-2-2. روش مبتنی بر انتقال ........................................................................................................ 25عنوان صفحه3-2-2-3. روش بین¬زبانی .................................................................................................................... 253-2-3. ترجمه ماشینی مبتنی بر پیکره 263-2-3-1. ترجمه ماشینی آماری ....................................................................................................... 263-2-3-2. مدل ترجمه آماری مبتنی بر کلمه ................................................................................. 263-2-3-3. مدل آماری مبتنی بر عبارت ............................................................................................ 273-2-3-4. مدل آماری مبتنی بر نحو ................................................................................................. 273-2-4. ترجمه ماشینی مبتنی بر مثال 273-2-5. روش مبتنی بر هستان¬شناسی 283-2-6. ترجمه ماشینی ترکیبی 283-3. ابهام 293-3-1. ابهام واژگانی 303-3-1-1. ابهام مقوله¬ای ....................................................................................................................... 313-3-1-2. ابهام واژه¬های هم¬آوا ........................................................................................................... 323-3-1-3. ابهام واژه¬های هم¬نویسه ..................................................................................................... 343-3-1-4. ابهام واژه¬های هم¬نام ........................................................................................................... 353-3-1-5. ابهام واژه¬های چند معنا .................................................................................................... 393-3-1-6. ابهام انتقالی ......................................................................................................................... 413-3-1-7. ابهام ترکیبی ........................................................................................................................ 423-3-1-8. ابهام مجازی ......................................................................................................................... 423-3-2. ابهام ساختاری 433-3-2-1. ابهام ساختاری واقعی ......................................................................................................... 453-3-2-2. ابهام ساختاری سیستمی یا تصادفی .............................................................................. 463-3-2-3. ابهام ساختاری در اتصال گروه حرف اضافه .................................................................. 473-3-2-4. ابهام گروهی ......................................................................................................................... 48عنوان صفحه3-4. روش¬های مختلف ابهام¬زدایی 493-4-1. رویکرد نظارت شده پیکره بنیاد برای رفع ابهام معنایی کلمات 523-4-1-1. روش¬های مبتنی بر شباهت مثال¬ها ............................................................................... 533-4-1-1-1. روش k- نزدیک¬ترین همسایه 543-4-1-2. روش مبتنی بر احتمالات ................................................................................................. 543-4-1-2-1. روش بیزی ساده 543-4-1-2-2. مدل لگاریتم خطی 553-4-1-2-3. مدل مخفی مارکف 583-4-1-2-4. برچسب¬گذاری اجزاء کلام جهت رفع ابهام 593-4-1-3. روش¬های مبتنی بر قوانین متمایز کننده ...................................................................... 633-4-1-3-1. روش لیست تصمیم 643-4-1-3-2. روش درخت تصمیم 643-4-1-4. روش¬های مبتنی بر قواعد ترکیب ................................................................................... 653-4-2. رویکرد نیمه نظارت شده پیکره بنیاد برای رفع ابهام معنایی کلمات 663-4-2-1. مدل بوت یاراوسکی ............................................................................................................ 663-4-2-2. مدل فعال¬سازی تعاملی ( برای دسترسی به مفاهیم از میان پایگاه داده¬ها) .......... 673-4-3. رویکرد نظارت نشده پیکره بنیاد برای رفع ابهام معنایی کلمات 683-4-3-1. متمایزسازی گروهی متن .................................................................................................. 693-4-3-2. گراف هم¬رخداد ................................................................................................................... 703-4-3-2-1. الگوریتم هایپرلکس 703-4-3-3. رفع ابهام معنی واژه با استفاده از پیکره¬ی موازی ........................................................ 703-4-3-4. راهبرد B یا راهبرد قانونی سنتوید ................................................................................. 713-4-3-5. تحلیل معنایی پنهان ......................................................................................................... 733-5. روش¬های مختلف ارزیابی سیستم¬های رفع ابهام 76عنوان صفحه3-5-1. معیار ارزیابی تشابه دقیق 773-5-2. حساس ساختن ارزیابی به فاصله معنایی/ ارتباطی بین معانی 793-5-3. چهارچوبی برای ارزیابی اولیه و تولید مجموعه¬ی آزمایشی 813-5-4. فهرست معانی چند زبانه برای ارزیابی 843-6. جمع¬بندی 85فصل چهارم: مدل تحلیل معنایی پنهان برای رفع ابهام اسم¬های هم¬نام4-1. مقدمه 874-2. استخراج اسم¬های هم¬نام 884-3. آماده¬سازی متون حاوی معانی مختلف اسم هم¬نام 904-4. پیاده¬سازی مدل تحلیل معنایی پنهان 944-4-1. ساخت ماتریس کلمه- سند 954-4-2. تجزیه ماتریس کلمه- سند و تعیین معادل صحیح اسم هم¬نام 1014-5. جمع¬بندی 152فصل پنجم: ارزیابی مدل پیشنهادی5-1. مقدمه 1535-2. معیارهای ارزیابی 1535-2-1. معیار دقت 1545-2-2. معیار فراخوانی 1545-2-3. موزز دیکودر 1555-2-4. ارزیابی مدل پیشنهادی با دو معیار دقت و فراخوانی 1565-3. یافته¬ها و نتایج پژوهش 1605-4. کاربردهای پژوهش و پیشنهادات 1615-5. جمع¬بندی 162عنوان صفحهمنابع و مأخذ............................................................................................................................163پیوست¬ها ................................................................................................................................175
چکیده :
چکیده یکی از چالش ¬برانگیزترین مسائل در ترجمه¬ی ماشینی، رفع ابهام معنایی کلمات می¬باشد. در واقع ابهام معنایی اشاره به حالتی دارد که یک عنصر زبانی در بافت کاربردی¬اش بیش از یک معنی داشته باشد. یک گروه از واژه¬های مبهم که منجر به بروز مشکل در ترجمه¬ی ماشینی می¬شوند، واژه¬های هم¬نام می¬باشند که به دو یا چند واژه با صورت و تلفظ یکسان و معنای مختلف و غیر مرتبط اطلاق می¬شوند. تعیین معنای مناسب واژه¬های هم¬نام و به خصوص اسم¬های هم¬نام مطلق در جمله در بهبود عملکرد ماشین ترجمه تأثیر به سزایی خواهد داشت. هدف این پژوهش ارائه¬ی روشی برای رفع ابهام اسم¬های هم¬نام در متن می-باشد. در این راستا با استفاده از مدل تحلیل معنایی پنهان در صدد ترجمه و رفع ابهام اسم¬های هم¬نام مطلق برآمدیم. این روش نسبت به روش¬های دیگر دارای محاسنی است؛ از جمله این که به فرهنگ لغت روابط ساختاری، تجزیه جزء کلام متن و یا هر ورودی خارجی دیگری نیازی ندارد و به دلیل این که معنای کلمه در بافت در نظر گرفته می¬شود، ترجمه¬ی دقیق¬تری را ارائه می¬کند. از این رو پس از استخراج واژه¬های هم¬نام، چهارده اسم هم¬نام را به صورت تصادفی انتخاب نمودیم و سپس جملاتی که اسم¬های هم¬نام مربوطه در آن موجود بود را از وب سایت¬های مختلف، پیکره بی¬جن¬خان و میزان استخراج کردیم. بعد از آن کلمات مضمون را از این جملات استخراج و ماتریس کلمه- سند را ایجاد نمودیم. پس از کاهش ابعاد ماتریس اولیه، 80 جمله حاوی اسم هم¬نام را با استفاده از این مدل ترجمه کردیم و k را با مقادیر مختلف در نظر گرفتیم تا بتوانیم k بهینه در مدل تحلیل معنایی پنهان را تعیین نماییم. علاوه بر این ترجمه به دست آمده در ماشین ترجمه موزز دیکودر را نیز با ترجمه¬های مبتنی بر مدل تحلیل معنایی پنهان مقایسه نمودیم. معیار دقت و فراخوان در حالتی که k ماکزیمم است به ترتیب %55/98 و %07/86 می-باشد. در حالتی که k مینیمم است معیار دقت و فراخوان به ترتیب %85/68 و %85/68 می¬باشد. معیار دقت در حالتی که k معادل 3، 4 و 5 در نظر گرفته شده، به ترتیب %48/85، %14/98 و %55/96 می-باشد. معیار فراخوان در حالتی که k معادل 3، 4 و 5 در نظر گرفته شده، به ترتیب %71/75، %83/68 و %79/71 می¬باشد. بر اساس نتایج به دست آمده مشخص گردید که نیازی به کاهش ابعاد ماتریس یا کاهش n نیست و در صورت کاهش ابعاد، این کاهش بعد از لحاظ زمانی و از لحاظ حافظه قابل ملاحظه نیست و این که هر چه ابعاد بیش¬تر در نظر گرفته شود به مراتب دقت ابهام¬زدایی بالاتر خواهد بود. کلید واژه¬ها: ترجمه ماشینی، ابهام¬زدایی، پردازش زبان طبیعی، هم¬نامی، پیکره
چکیده انگلیسی :
Abstract One of the challenging issues in machine translation is word sense disambiguation. One of the categories of ambiguous words is absolute homonym noun. Disambiguation of absolute homonym nouns has a significant effect on improving machine translation performance. In this thesis we have proposed an approach to identify the meaning of each homonym nouns using Latent Semantic Analysis (LSA) model. First, homonyms were extracted from Aryanpur Persian to English dictionary. Next, fourteen homonym nouns were selected randomly. In this step for each meaning of homonym noun a sentence was selected from different websites, Mizan and Bijankhan corpora. Then 80 sentences were provided to be translated based on LSA model and Moses Machine Translation. The translated homonym nouns were evaluated based on Precision and Recall criteria. It’s important to point out that in this research different amounts of K were considered. Precision and Recall for maximum K were 98.55% and 86.07% respectively. These two criteria for minimum K were 68.85% and 68.85% respectively. Precision and Recall for translation with Moses Machine Translation were 60.86% and 34.56%. According to obtained results it is not necessary to reduce the dimensions of the matrix, since the amount of saved memory or time is not significant. As a result, disambiguation will be more authentic when the dimensions are not reduced. In addition, experimental results show that our approach outperforms previous works in terms of Precision and Recall. Keywords: Machine translation, Disambiguation, Natural language processing, Homonymy, Corpus
کلید واژه ها :
ترجمه ماشینی ◄ ابهام زدایی ◄ پردازش زبان طبیعی ◄ هم نامی ◄ پیكره , Machine translation ◄ Disambiguation ◄ Natural language processing ◄ Homonymy ◄ Corpus
0
صفحه اول :
University of Isfahan Faculty of Foreign Languages Department of Linguistics M.A. Thesis Disambiguation of Homonym Nouns in Persian- English Machine Translation Based on Latent Semantic Analysis Framework Supervisors: Dr. Rezvan Motavallian Naeini Dr. Bijan Shoushtarian By: Sahar Najafi Marghmalaki May 2017
فصل اول :
1-8
فصل دوم :
9-20
فصل سوم :
21-86
فصل چهارم :
87-152
فصل پنجم :
153-227
فصل ششم :