• ورود کاربران دانشگاهی

  • ثبت نام(مطالعه آنلاین پایان نامه ها)

  • سپندا

    کاربر مهمان
    پنجشنبه 2 آذر 1396| 54.146.50.80 :Your IP
    سامانه پایان نامه های دانشگاه اصفهان (سپندا)



    عنوان :
    ارائهی یک روش یادگیری رتبه بندی مستقل از پرس وجو برای موجودیت های RDF حاصل از پرس وجو های SPARQL
    انتشارات : دانشگاه اصفهان
    سال :1393
    زبان : Persian
    شماره سند : 12540
    موضوع :مهندسی کامپیوتر گرایش هوش مصنوعی
    پژوهشگر : سارا لطیفی
    توصیفگر لاتین : Linked Data ? Learning to Rank ? Query-Independent Features ? Semantic Search ? Web of Data
    توصیفگر فارسی : داده های پیوندی ◄ یادگیری رتبه بندی ◄ ویژگی های مستقل از پرس وجو ◄ پرس وجو معنایی ◄ وب داده
    دانشکده : دانشکده مهندسی کامپیوتر، گروه مهندسی هوش مصنوعی
    مقطع : کارشناسی ارشد

    استاد راهنما : محمدعلی نعمت‌بخش
    استاد مشاور :
    سال دفاع : 1393
    شماره رکورد : 12540
    شماره راهنما : COM2 328
    فهرست : فهرست مطالب
    عنوان صفحه
    1 مقدمه ...................................................................................................................................................1
    1-1- معرفی موضوع 1
    1-2- وب معنایی 2
    1-2-1- معماری وب معنایی 2
    1-2-2- داده¬های پیوندی 4
    1-2-3- شناسه¬ی همسان منبع 5
    1-2-4- چارچوب تشریح منابع 6
    1-2-5- زبان پرس¬وجوی SPARQL 8
    1-3- رتبه¬بندی 9
    1-4- بیان مسئله 11
    1-5- هدف تحقیق 11
    1-6- اهمیت و ارزش تحقیق 12
    1-7- کاربرد نتایج تحقیق 13
    1-8- ساختار پایان¬نامه 13
    2 تحقیقات پیشین در زمینه¬ی مسئله¬ی پژوهش 14
    2-1- مقدمه 14
    2-2- رتبه¬بندی در وب معنایی 14
    2-2-1- رتبه¬بندی اسناد معنایی 15
    2-2-2- رتبه¬بندی رابطه 15
    2-2-3- رتبه¬بندی موجودیت 15
    2-2-3-1- رتبه¬بندی وابسته به پرس‌و‌جو ..............................................................................................16
    2-2-3-2- رتبه¬بندی مستقل از پرس‌و‌جو ..............................................................................................16
    2-3- کارهای مرتبط 18
    2-4- جمع¬بندی 31
    3 ارائه¬ی روش پیشنهادی................................................................................................................... 33
    3-1- مقدمه 33
    3-2- یادگیری رتبه¬بندی 33
    3-2-1- ماشین بردار پشتیبان رتبه¬بند 36
    3-3- ویژگی¬های مستقل از پرس‌و‌جو 39
    3-4- ویژگی¬های استخراج شده از گراف RDF 39
    3-4-1- تعداد موضوع¬ها در سطح k 41
    3-4-2- تعداد شیءها در سطح k 41
    3-4-3- تعداد انواع مسندهای خروجی در سطح k 41
    3-4-4- تعداد انواع مسندهای ورودی در سطح k 41
    3-4-5- میانگین فرکانس مسندهای خروجی در سطح k 42
    3-4-6- میانگین فرکانس مسندهای ورودی در سطح k 42
    3-4-7- تعداد رشته¬های ثابت 42
    3-5- تعداد پیوندهای وزن¬دار 43
    3-5-1- وزن¬دهی بدون نظارت پیوندها 43
    3-5-2- محاسبه¬ی رتبه¬ی موجودیت¬ها 44
    3-6- موتورهای جست¬وجوی کلاسیک 44
    3-7- محتوی اطلاعات 45
    3-7-1- محتوی اطلاعات بخش¬بندی شده 45
    3-8- بررسی یک مثال 47
    3-8-1- ویژگی¬های استخراج شده از گراف RDF 50
    3-8-2- تعداد پیوندهای وزن¬دار 50
    3-8-3- موتورهای جست¬وجوی کلاسیک 51
    3-8-4- محتوی اطلاعات بخش¬بندی شده 51
    3-8-5- نرمال¬سازی ویژگی¬ها 53
    3-9- جمع¬بندی 54
    4 ارزیابی روش پیشنهادی 55
    4-1- مقدمه 55
    4-2- پیاده¬سازی روش پیشنهادی 55
    4-3- ماشین بردار پشتیبان رتبه¬بند 56
    4-4- مجموعه¬داده 57
    4-4-1- مجموعه¬داده¬ی پیوندی 57
    4-4-1-1- ذخیره¬ی مجموعه¬داده .............................................................................................................60
    4-4-2- مجموعه¬ی پرس‌و‌جو 62
    4-5- روش ارزیابی 62
    4-5-1- ویژگی هدف 62
    4-5-2- داده¬های آموزشی و آزمون 63
    4-6- معیارهای ارزیابی 63
    4-6-1- NDCG 63
    4-6-2- ضریب همبستگی رتبه¬ی اسپیرمن 66
    4-7- ارزیابی الگوریتم پیشنهادی 66
    4-8- جمع¬بندی 70
    5 نتیجه¬گیری و راه¬کارهای آینده 71
    5-1- مقدمه 71
    5-2- نتیجه¬گیری 72
    5-3- کارهای آینده 72
    6 مراجع ...............................................................................................................................................73



    چکیده :
    چکیده RDF یک مدل داده¬ای برای نمایش داده¬های ساخت¬یافته بر روی وب¬ می¬باشد. SPARQL یک زبان پرس¬وجو برای داده¬های RDF است که امکان پاسخ به نیازهای اطلاعاتی پیچیده را فراهم می¬آورد. این پرس¬وجو¬های ساخت¬یافته، پاسخ¬های دقیق و کامل را بازمی-گرداند. دقیق بودن پاسخ¬ها به این معناست که پاسخ¬های بازیابی شده دقیقاً پاسخ¬های پرس¬وجو بوده و صحیح هستند؛ کامل بودن پاسخ¬ها نیز به معنای بازیابی تمام پاسخ¬های ممکن می¬¬باشد. ممکن است تعداد پاسخ¬های بازیابی شده برای یک پرس-وجو بسیار زیاد باشد؛ در این حالت، کیفیت نتایج حاصل از پرس¬وجو، وابسته به رتبه¬بندی آن¬ها خواهد بود. با رشد سریع وب داده¬ها، نیاز به روش¬هایی کارآمد برای رتبه¬بندی نتایج حاصل از این نوع پرس¬وجو¬ها افزایش یافته است. به دلیل دقیق بودن پاسخ¬های حاصل از پرس¬وجو¬های SPARQL، برای رتبه¬بندی آن-ها تمرکز بر روی ویژگی¬های مستقل از پرس¬وجو می¬باشد. در این پژوهش از یک راه¬کار یادگیری رتبه¬بندی با استفاده از الگوریتم یادگیری ماشین بردار پشتیبان رتبه¬¬بند به همراه چهار دسته از ویژگی¬های مستقل از پرس¬وجو برای رتبه¬بندی موجودیت¬های حاصل از بازیابی پاسخ¬های پرس¬وجو¬های SPARQL استفاده شده است. این ویژگی¬ها شامل مجموعه ویژگی¬های مستخرج از گراف RDF، تعداد پیوندهای وزن¬دار، ویژگی مبتنی بر موتور جست¬وجوگر و محتوی اطلاعات منابع RDF می¬باشد. نتایج به دست آمده نشان می¬دهد که استفاده از مجموعه¬ی تمام ویژگی¬ها، بهترین کارایی را به دست می¬دهد. واژه¬گان کلیدی: داده¬های پیوندی، یادگیری رتبه¬بندی، ویژگی-های مستقل از پرس¬وجو، پرس¬وجو معنایی، وب¬داده.

    چکیده انگلیسی :
    Abstract Resource Description Framework (RDF) is a standard model for structured data on the web. A query language (SPARQL) is developed for RDF to search complex information needs. The results of a SPARQL query are exact and complete. By exact we mean that returned results are exactly match the query. By complete we mean that returned results include all the possible responses to the query. The number of returned results may be very large, when ranking responses thoroughly affects the quality of retrieval. By rapid growth of web of data, the need for efficient ranking methods for the results of SPARQL queries has been increased. Due to exact matching results in SPARQL queries, the focus for ranking is on the query-independent features. In this research, four sets of query-independent features are used to rank SPARQL results. These features are based on RDF graph, search engine, information content of the RDF resources and weighted LinkCount. A learning method is used to perform the ranking of random queries. The performance of individual features and the combination of them in learning the ranking model has been investigated. Experiments show that the complete feature set has better performance. Keywords: Linked Data; Learning to Rank; Query-Independent Features; Semantic Search; Web of Data.


    کلید واژه ها :
    داده های پیوندی ◄ یادگیری رتبه بندی ◄ ویژگی های مستقل از پرس وجو ◄ پرس وجو معنایی ◄ وب داده,Linked Data ◄ Learning to Rank ◄ Query-Independent Features ◄ Semantic Search ◄ Web of Data

    مهر1393
    0

    صفحه اول : University of Isfahan Faculty of Computer Engineering Department of Artificial Intelligence M.Sc Thesis A Query-Independent Learning to Rank Method for RDF Entity Results of SPARQL Queries Supervisor: Dr. Mohammadali Nematbakhsh By: Sara Latifi September 2014
    فصل اول : 1-13
    فصل دوم : 14-32
    فصل سوم : 33-54
    فصل چهارم : 55-70
    فصل پنجم : 71-80
    فصل ششم :