ورود کاربران دانشگاهی
ثبت نام(مطالعه آنلاین پایان نامه ها)
کاربر مهمان
سپندا
جمعه 10 فرودرین 1403
|
54.243.2.41
:Your IP
س
امانه
پ
ایان
ن
امه های
د
انشگاه
ا
صفهان (
سپندا
)
صفحه اول(جستجو)
مرور موضوعی
پرسش های متداول و راهنما
سامانه تطبیق پایان نامه با شیوه نامه
تماس با ما
(0)
عنوان :
تشخیص کدهای پستی دست نویس فارسی بر روی پاکت های پستی به کمک روش های هوشمند پردازش تصویر
انتشارات :
دانشگاه اصفهان
سال :
1389
زبان :
Persian
شماره سند :
8276
موضوع :
کامپیوتر گرایش نرم افزار
پژوهشگر :
زهرا کامرانیان
توصیفگر لاتین :
Postal Code ? Handwritten ? Optical Character Recognition (OCR) ? Neural Network ? Classification ? Image Processing ? Envelope ? Feature Extraction ? Multi Layer Perceptron (MLP)
توصیفگر فارسی :
کدپستی ◄ دست نوشته ◄ بازشناسی بصری حروف ◄ شبکه عصبی ◄ طبقه بندی ◄ پردازش تصویر ◄ پاکت نامه ◄ استخراج ویژگی ◄ پرسپترون چند لایه
دانشکده :
دانشکده فنی مهندسی، گروه کامپیوتر
مقطع :
کارشناسی ارشد
استاد راهنما :
ناصر نعمت بخش
استاد مشاور :
امیر حسین منجمی
سال دفاع :
1389
شماره رکورد :
8276
شماره راهنما :
COM2 191
فهرست :
فهرستمطالبعنوان صفحهفصلاول:مقدمه..................................................................................................................................11-1- بازشناسی بصری حروف (OCR)............................................................................................................................21-2- اهداف این پژوهش.......................................................................................................................................................41-3- سازماندهی پایان نامه.................................................................................................................................................6فصلدوم:مروری بر کارهای پیشین در زمینهی OCR.......................................................................72-1- سیستمهای OCR فارسی.........................................................................................................................................92-2- بررسی تحقیقات انجام شده در زمینهی شناسایی ارقام فارسی/ عربی..........................................................102-3- بررسی تحقیقات انجام شده در شناسایی حروف فارسی/ عربی.......................................................................122-4- بررسی کارهای انجام شده در شناسایی آدرسها و کدهای پستی.................................................................15فصلسوم:معرفی ابزارها..............................................................................................................................................183-1-پردازش تصویر............................................................................................................................................................18 3-1-1- سطوح مختلف پردازش تصویر.......................................................................................................................................19 3-1-2- مراحل اساسی پردازش تصویر........................................................................................................................................203-2- طرز نمایش یک تصویر دیجیتالی.........................................................................................................................223-3-بهسازی تصویر............................................................................................................................................................243-4-هیستوگرام...................................................................................................................................................................243-5-ریختشناسی..............................................................................................................................................................253-6- تبدیل هاف..................................................................................................................................................................283-7- شبکههای عصبی.......................................................................................................................................................31فصل چهارم:روشهای پیشنهادی و سیستم پیادهسازیشده.........................................................544-1- کشف و جداسازی ارقام کدپستی در پاکتهای حاوی کادر.............................................................................56 4-2- کشف محل درج کدپستی و جداسازی ارقام در پاکتهای فاقد کادر.............................................................66 4-2-5- تعیین محل درج کدپستی..............................................................................................................................................714-3- استخراج ویژگی از ارقام دستنویس فارسی........................................................................................................734-4- انتخاب بردار ویژگی..................................................................................................................................................814-5- کلاسبندی ارقام دستنویس فارسی....................................................................................................................824-6- نتایج.............................................................................................................................................................................92فصل پنجم:نتیجهگیری و پیشنهادها................................................................................................945-1- نتایج عملکرد مراحل سیستم..................................................................................................................................945-2-پیشنهادها.....................................................................................................................................................................98مراجع...................................................................................................................................................100
چکیده :
چکیده در این پروژه یک سیستم کامل جهت شناسایی کدپستیهای دستنویس فارسی بر روی پاکتهای پستی با استفاده از شبکههای عصبی مصنوعی پیادهسازی شده است. در حال حاضر در کشور، دستهبندی پاکتها در ادارهی پست به صورت دستی انجام میگیرد. بنابراین ارایهی سیستم خودکاری با دقت و سرعت بالا برای جایگزینی سیستمهای دستی، به نظر ضروری و مفید میرسد. با تشخیص کدهای پستی توسط کامپیوتر، دستهبندی پاکتها بسیار سادهتر و سریعتر خواهد شد و این امر موجب بهبود عملکرد اداره پست میشود. در این سیستم دو نوع پاکت مورد بررسی قرار میگیرند: پاکتهای پستی حاوی کادر برای درج کدپستی و پاکتهای پستی فاقد کادر. ابتدا کشف محل کدپستی و جداسازی ارقام آن در هر دو نوع پاکت انجام میشود. در این مرحله، برای پاکتهای حاوی کادر، گامهای باینری کردن، جداسازی مؤلفههای همبندی و کشف کادر، جداسازی ارقام داخل کادر، تغییر ابعاد و حذف نویز انجام میشود. این مرحله در پاکتهای فاقد کادر، با یافتن خطوط زمینه، جداسازی مؤلفههای همبندی، استخراج ویژگی از مؤلفهها، کلاسبندی و ارایهی الگوریتمی جهت تعیین محل درج کدپستی صورت میگیرد. در اینجا استخراج ویژگی برای تمایز مؤلفههای رقمی و غیر رقمی انجام میشود. این ویژگیها عبارتند از: نسبت ارتفاع به پهنا، جهت و نسبت ارتفاع/ پهنا به ارتفاع/ پهنای مؤلفههای همسایه. پس از جداسازی ارقام کدپستی، مرحلهی استخراج ویژگی صورت میگیرد. در این مرحله دو روش استخراج ویژگی ارایه شده است: استخراج ویژگیهای آماری و استفاده از ویژگیهای تطبیق قالب. ویژگیهای آماری عبارتند از: جثه، نسبت ارتفاع به پهنا، نسبت پهنای بالا به پایین، نسبت ارتفاع چپ به راست، تقارن افقی و عمودی، تعداد گذر، وجود حفرهو فاصله تا پیکسل ابتدایی. در مرحلهی بعد تصاویر ارقام بر اساس ویژگیهای استخراجشده کلاسبندی میشوند. در کلاسبندی، شبکههای عصبی سه لایهی پسانتشار خطا مورد استفاده قرار گرفتهاند. سه شبکهی عصبی برای کلاسبندی ایجاد شده است. شبکهی عصبی اول مبتنی بر ویژگیهای آماری، شبکهی عصبی دوم مبتنی بر ویژگیهای تطبیق قالب و شبکهی عصبی سوم مبتنی بر ترکیب ویژگیهای آماری و تطبیق قالب است. سپس یک الگوریتم رأیگیری برای افزایش نرخ شناسایی پیشنهاد شده است. میانگین دقت این سیستم بر روی 2100 نمونهی آزمایشی در پاکتهای حاوی کادر، 5/97% است. همچنین دقت شناسایی این سیستم بر روی 420 نمونهی آزمایشی در پاکتهای فاقد کادر به میزان 2/92% می باشد. کلمات کلیدی:OCR فارسی، کدپستی، دستنوشتههای فارسی، ویژگیهای آماری، تطبیق الگو، شبکهی عصبی MLP، الگوریتم رأیگیری.
چکیده انگلیسی :
Abstract A complete system for off-line recognition of Persian handwritten postal codes on postal envelopes using artificial neural networks is presented in this thesis. Nowadays, the postal envelopes' categorizing is done manually in Iran. Thus, offering an automated system with high accuracy and speed to replace the manual systems seems to be necessary and useful. With postal code detection by computer, classification of envelopes will be done easier and faster, and can be improved the performance of post office. The system act on two envelope types: envelopes with postcode frames and envelopes without postcode frames. Firstly, postcode's place detection and digit segmentation are done. In this stage, binerization, connected components segmentation and frame detection, digit segmentationon the frame, size normalization, and noise reduction are performed on envelopes with frames. In addition, finding the baselines, connected components segmentation, components' feature extraction, classification, and proposing an algorithm to find postcode's place are executed on envelopes without frames. Here, feature extraction is done to distinguish digit and non-digit components. These features are: aspect ratio, direction, and height/ width to neighbors' height/ width ratio. After digit segmentation, feature extraction stage is performed. Two general feature extraction approaches are considered in this stage: statistical features' extraction, and using of template- matching features. Statistical features consists of: bulk, aspect ratio, top width to down width ratio, left height to right height ratio, Horizontal and Vertical Symmetry, cross counts, hole existence, and distance to the first pixel. In the next stage, digit images are classified based on the feature extraction. Back-propagation multilayer neural networks are used in classification. Three neural networks are created in this stage. The first neural network is based on statistical features. The second neural network is based on template- matching features, and the third neural network is based on combination of statistical and template- matching features. Afterwards, a voting algorithm is proposed for high performance multi level classification.Evaluating the proposed system with 2100 test samples on envelopes with postcode frames and 420 test samples on envelopes without postcode frames, the recognition rate of 97.5% and 92.2% is achieved, respectively. Keywords: Persian OCR, Postal Code, Handwritten, Statistical features, Template matching, MLP Neural Network, Voting Algorithm.
کلید واژه ها :
کدپستی ◄ دست نوشته ◄ بازشناسی بصری حروف ◄ شبکه عصبی ◄ طبقه بندی ◄ پردازش تصویر ◄ پاکت نامه ◄ استخراج ویژگی ◄ پرسپترون چند لایه,Postal Code ◄ Handwritten ◄ Optical Character Recognition (OCR) ◄ Neural Network ◄ Classification ◄ Image Processing ◄ Envelope
1389
0
صفحه اول :
University of Isfahan Faculty of Engineering Department of Computer Engineering M.Sc. Thesis Handwritten Farsi postal code recognition on postal envelops using intelligent imageprocessing methods Supervisor: Dr. Naser Nemat-Bakhsh Advisor: Dr. Sayed Amir Hasan Monadjemi By: Zahra Kamranian March 2011
فصل اول :
1-6
فصل دوم :
7-17
فصل سوم :
18-53
فصل چهارم :
54-93
فصل پنجم :
94-105
فصل ششم :