• ورود کاربران دانشگاهی

  • ثبت نام(مطالعه آنلاین پایان نامه ها)

  • کاربر مهمان
    چهار شنبه 29 شهریور 1396| 54.162.181.75 :Your IP

    سامانه دسترسی به پایان نامه های دانشگاه اصفهان



    عنوان :
    ارائه روشی برای استخراج قوانین وابستگی عمومی از داده های جدول گرا
    انتشارات : دانشگاه اصفهان
    سال :1386
    زبان : Persian
    شماره سند : 4001
    موضوع :
    پژوهشگر : سیامند ایوبی
    توصیفگر لاتین : ???????? MGRAssoeiation rules ? Transaction data ? Tabular data ? Algorithms ? Pen ? MGR algorithm
    توصیفگر فارسی : هوش مصنوعی ◄ 1386 ◄ قوانین وابستگی ◄ داده های تراکنشی ◄ داده های جدول گرا ◄ الگوریتم ◄ قلم
    دانشکده : دانشگاه اصفهان، دانشکده فنی مهندسی گروه کامپیوتر
    مقطع : کارشناسی ارشد کامپیوتر گرایش هوش مصنوعی

    استاد راهنما : دکتر احمد براانی
    استاد مشاور :
    سال دفاع : 1386
    شماره رکورد : 4001
    شماره راهنما : COM2 93
    فهرست : فهرست مطالب
    عنوان صفحه
    فصل 1 کلیات مسئله.....
    1-1 شرح مسئله............................................................................................................................................................................ 1
    1-2 اهمیت مسئله ........................................................................................................................................................................5
    1-3 الگوریتم ارائه شده برای حل مسئله .................................................................................................................................6
    1-4 نتایج بدست آمده .................................................................................................................................................................7
    فصل دوم قوانین وابستگی در داده‌های تراکنشی و جدولگرا......
    2-1 مقدمه .......................................................................................................................................................................................9
    2-2 قوانین وابستگی در داده‌های تراکنشی ..........................................................................................................................11
    2-2-1 بررسی داده‌های بسته بازاری ...............................................................................................................................13
    2-2-2 الگوریتم Apriori [6] ........................................................................................................................................15
    2-2-3 استخراج قوانین وابستگی از اقلام های پررخداد...............................................................................................20
    2-2-3-1 پیچیدگی زمانی الگوریتم Apriori ........................................................................................................22
    2-2-4 الگوریتم FP-growth [7] ................................................................................................................................22
    2-2-5 مزایا و معایب الگوریتم Fp-growth ..........................................................................................................26
    فصل سوم قوانین وابستگی در داده‌های جدول‌گرا.....
    3-1 تعمیم قوانین وابستگی به داده‌های جدول‌گرا.............................................................................................................. 27
    3-1-1 تعاریف .......................................................................................................................................................................29
    3-2 قوانین وابستگی ساده و گروه‌بندی .................................................................................................................................31
    3-2-1 الگوریتم CBA .......................................................................................................................................................33
    3-2-2 ترکیب درخت های تصمیم و قوانین وابستگی [32] .....................................................................................33
    3-2-2-1 نحوه ساخت درخت تصمیم به کمک قوانین وابستگی .............................................................................36
    3-2-2-2 بالا بردن دقت تشخیص به کمک درخت ساخته شده از قوانین وابستگی ...........................................37
    3-2-3 بررسی کارایی ..........................................................................................................................................................37
    3-3 تشخیص نوظهوری بوسیله اقلام های پررخداد [33] ...............................................................................................39
    3-3-1 توانایی های اقلام ها برای تشخیص نوظهوری .................................................................................................40
    3-3-2 دسته بندی اقلام ها ...............................................................................................................................................42
    3-3-3 تست و ارزیابی .........................................................................................................................................................43
    3-4 جمع بندی .........................................................................................................................................................................49
    فصل چهارم قوانین وابستگی عمومی در داده‌های جدولگرا.....
    4-1-1 مقایسه قوانین ساده با قوانین عمومی.................................................................................................................... 52
    4-1-2 استفاده از الگوریتمهای موجود برای استخراج اقلام های عمومی ...............................................................56
    4-2 استخراج اقلام های عمومی از اقلام های ساده ..........................................................................................................59
    4-2-1 محاسبه پشتیبانی اقلام های نیمه عمومی ........................................................................................................61
    4-2-2 محاسبه پشتیبانی اقلام های عمومی .................................................................................................................64
    4-3 استخراج اقلام های عمومی به کمک اقلام های ساده ................................................................................................67
    4-3-1 دسته بندی اقلام های ساده جهت کوچکتر کردن فضای جستجو ............................................................69
    4-3-2-1 استخراج اقلام های نیمه عمومی به کمک درخت MGR ...............................................................74
    4-3-3-2 استخراج اقلام های عمومی ........................................................................................................................77
    4-4 الگوریتم MGR ...............................................................................................................................................................80
    4-5 استخراج قوانین عمومی از اقلام های عمومی ...............................................................................................................81
    4-6 توانایی قوانین عمومی ........................................................................................................................................................82
    4-7 پیچیدگی زمانی و فضایی الگوریتم MGR .................................................................................................................85
    4-7-1 پیچیدگی زمانی الگوریتم MGR .......................................................................................................................85
    4-7-1-1 استخراج اقلام های نیمه عمومی از اقلام های ساده .............................................................................86
    4-7-1-2 استخراج اقلام های عمومی از اقلام های نیمه عمومی ........................................................................88
    4-8 الگوریتم MGR از لحاظ مدیریت حافظه ....................................................................................................................89
    فصل پنجم.. پیاده سازی و تست.....
    5-2 تست..................................................................................................................................................................................... 95
    5-3 نرم افزار MGR .................................................................................................................................................................98
    فصل ششم تیجه گیری و راهکارهای آینده.....
    ....................................................................................................................................................................................................... 104
    منابع ...........................................................................................................................................................106



    چکیده :
    چکیده استخراج قوانین وابستگی یکی از مهمترین تکنیک های استخراج دانش به شمار می رود. این روش نخستین بار برای استخراج الگوهای پررخداد از پایگاه داده های تراکنشی مورد استفاده قرار گرفت. هر الگوی پررخداد استخراج شده توسط این تکنیک، به صورت مجموعه ای از ایتم ها بیان می شود. اگرچه این روش به صورت سنتی جهت استخراج دانش از داده های تراکنشی مطرح شده است، اما ایده گسترش آن به پایگاه داده های جدولگرا همواره مطرح بوده است. پایگاه داده های تراکنشی شامل مجموعه ای از تراکنش ها هستند. در این پایگاه داده ها، هر تراکنش شامل مجموعه ای از ایتم ها است. داده های جدولگرا شامل مجموعه ای از رکوردها هستند. هر رکورد دارای یک مقدار برای یک ویژگی است. به منظور تعمیم تکنیک های استخراج قوانین وابستگی به داده های جدول گرا، مفهوم ایتم برای داده های جدول گرا باید تعریف گردد. در داده های تراکنشی، مفهوم ایتم یک مفهوم بنیادی است. یک تراکنش یا شامل یک ایتم است یا شامل آن نیست. در داده های جدولگرا، ایتم به صورت یک سه تایی (ویژگی، مقدار، عملگر) تعریف می گردد. اکثر روشهای ارائه شده برای استخراج قوانین وابستگی از داده های جدول گرا، تنها از عملگر تساوی در تعریف ایتم استفاده می نمایند. در این تحقیق، روشی برای استخراج قوانین وابستگی ارائه شده است که از تمامی عملگرهای در تعریف ایتم ها استفاده می نماید. الگوریتم ارائه شده بر این ایده استوار است که پشتیبانی ایتمست های حاوی عملگرهای را می توان از پشتیبانی ایتمست های حاوی تنها عملگر تساوی محاسبه نمود. الگوریتم ذکر شده, دارای پیچیدگی زمانی و فضایی قابل قبولی برای کاربردهای عملی است.

    چکیده انگلیسی :
    Abstract Mining association rules are one of the major techniques in data mining and have many applications in both data mining and machine learning. Most methods for mining association rules from tabular data only mine simple rules which only have equality operator in their items. For quantitative attributes, they discretize domain values by partitioning them to intervals. Limiting the operator only to equality deprives us many frequent patterns that may exist. It is obvious that where there is an order between objects, greater than or less than a value is as important as equating to the value. This aspect motivates us to extend the operators from equality to more general set of operators. We address the problem of mining general association rules in tabular data where rules can have all operators in the antecedent part. The proposed algorithm, Mining General Rules (MGR), is applicable on datasets with discrete-ordered attributes and also on quantitative discretized attributes. The proposed algorithm stores candidate general itemsets in a tree structure in such a way that supports of complex itemsets can be recursively computed from supports of simpler itemsets. The algorithm has benefits in the terms of time complexity, memory management and has great potential for parallelization.


    کلید واژه ها :
    هوش مصنوعی ◄ 1386 ◄ قوانین وابستگی ◄ داده های تراکنشی ◄ داده های جدول گرا ◄ الگوریتم ◄ قلم,الگوریتم MGRAssoeiation rules ◄ Transaction data ◄ Tabular data ◄ Algorithms ◄ Pen ◄ MGR algorithm

    اردیبهشت 1386
    0

    صفحه اول : University of Isfahan Faculty of Science Department of Engineering M.Sc. Thesis A New Algorithm For Mining General Association Rules From Tabular Data Supervisor: Dr. Ahmad Baraani By: Siyamand Ayubi May 2007
    فصل اول :
    فصل دوم :
    فصل سوم :
    فصل چهارم :
    فصل پنجم :
    فصل ششم :