موجكها[1]

اخيراً تبديلات زيرباند و موجك گسسته [2]( DWT) در عرصه كا ربردهاي كدينگ ، شاخص گذاري تصاوير[3] و بازشناسي حروف با مقبوليت فراواني مواجه شده تند . در اين تبديلها ، يك تصوير بطور پياپي از مجموعه اي از فيلترهاي پايين گذر و بالا گذر عبور نموده و خروجي فيلترها يك چندي[4] مي شود تا نرخ داده ها ثابت باقي بماند .در DWT تنها خروجي پايين گذر به صورت پياپي فيلتر مي گردد .

در تبديل فوريه كه نوعي از تبديل با تابع پايه ارتوگونال(متعامد[5]) می باشد، از «موج[6]» های سينوسي استفاده مي شود كه در هر دو جهت داراي دوره نامحدود هستند . بطور مشابه در حالت گسسته ، بردارهاي پايه تبديل DFT نيز داراي دوره نامحدود مي باشند و بنابراين اين تبديل دارای ویژگی «دوره-محدود[7]» نمی باشد؛

 

اما در عمل به سيگنالهاي گذرايي بر مي خوريم که تنها در يك دوره كوتاه زماني غير صفر هستند . مثلاً بسياري از خصوصيات مهم تصاوير مانند لبه ،در يك مكان مشخص قرار دارند . اين تركيبات به هيچيك از توابع پايه تبديل فوريه شبيه نيستند ودر نتيجه توابع مذكور ابزار بهينه اي براي آناليز سيگنالها و تصاويري كه حاوي مؤلفه هاي گذرا يامتمركز در يك زمان يا مكان هستند ، نمي باشند . البته مي دانيم كه تبديل فوريه هر تابع تحليلي (حتي يك سيگنال گذراي باريك ) را بصورت مجموعي از سينوسها نمايش دهد . اما ضرايب بدست آمده از تبديل ، معيار فشرده اي از اطلاعات تصوير نخواهند بود .

براي رفع اين نقيصه رياضيدانان و مهندسين به كوششهايي دست زده اند كه در آنها توابع پايه با دوره محدود بكار برده مي شوند .به اين توابع پايه «موجک» و به تبدیلاتی که براساس آنها هستند، «تبدیلات موجک» می گویند. شکل 2-2-1-2 تفاوت بين موج و موجك را نشان ميدهد .دو منحني بالايي ، امواج سينوسي با فركانسهاي مختلف و دو منحني پاييني ، دو موجك با فركانس و موقعيت متفاوت مي باشند .

شکل 2-2-1-2

 

براي بسياري از سيگنالها ، تحليل فوريه ابزاري بينهايت مفيد محسوب مي شود ؛ زيرا پي بردن به محتواي فركانسي سيگنالها از اهميت ويژه اي برخوردار است . پس به چه دليل ما نيازمند تكنيكهاي ديگري همچون تحليل موجك مي باشيم ؟ تحلیل فوريه يك نقطه ضعف اساسي دارد و آن اينكه در فرايند تبديل یك سيگنال به حوزه فركانس ، اطلاعات زماني يا مكاني آن از بين مي رود. به عبارت ديگر ، با نگاه كردن به تبديل فوريه يك سيگنال نمي توان اظهار داشت كه يك رويداد خاص ، در چه برهه زماني و يا در چه مكاني از تصوير بوقوع پيوسته است . چنانچه تغييرات يك سيگنال در زمان يا مكان قابل ملاحظه نباشد ( سيگنال ايستادن) ، اين نقطه ضعف اهميت چنداني ندارد . ليكن بيشتر سيگنالهاي مورد توجه ، در بسياري نقاط (مانند نقاط ابتدايي وانتهايي ) از ماهيت غير ايستادن يا گذرا برخور دارند . اين نقاط اغلب مهمترين قسمت سيگنال مي باشند كه تحليل فوريه ابزار مناسبي براي آشكارسازي آنها محسوب نمي شود .

تبديل موجك يك تكنيك بسط سري است كه اين امكان را بوجود مي آورد كه بتوان سيگنال را در درجات مختلف تفكيك پذيري نمايش داد . قطعات مختلف تصوير سن د كه ممكن است مربوط به حروف يا كلمات باشند ، متناظر با سطوح مختلف تفكيك پذيري بوسيله ضرايب موجك نشان داده مي شوند .بازنمايي سيگنال در فرم آناليز چند تفكيكه [8]( MRA ) با درجه تفكيك پذيري پايين مي تواند در مقايسه با MRA با درجه تفكيك پذيري بالا، تغييرات محلي حادث شده در دست نوشته ها را بنحو مؤثري به خود جذب نمايد . ليكن بازشناسي در تفكيك پذيري پايين ممكن است باعث شود كه جزئيات با اهميت براي مرحله بازشناسي از دست برود . شكل پايين تبديل موجك يك تصوير نمونه را نشان مي دهد كه درآن ، ضرايب زير يك سطح آستانه حذف گرديده اند .

 

تبديل موجك انواع مختلفي دارد كه از توابع پايه متفاوتي برخوردارند ؛ نظير: Haar، Mexican، Morlet ، Symlets ، Coiflets ، Biorthogonal ، Daubechies، hat و غيره. از آنجائيكه توابع پايه موجك Haarشكل گسسته دارند ، تصور مي شود كه اين موجك براي كار با تصاوير باينري كاراكترها ، بر ساير موجكها ارجحيت داشته باشد . در اينجا از ذكر رياضيات تبديلات موجك بدليل حجم نسبتاً زياد آن صرف نظر مي شود . اخيراً Mowlaei و همكارانش روشي بمنظور بازشناسي كدهاي پستي و اسامي شهرهاي ايران كه بر روي بسته هاي پستي بصورت دست نويس نوشته مي شوند ، پيشنهاد نموده اند . بردارهاي ويژگي اين روش ، از طريق بكارگيري تبديل موجك گسسته با موجك اساسي Haarمحاسبه مي گردند . در مرحله پيش پردازش اين الگوريتم ، ابتدا محدوده هر حرف مشخص گرديده ، تصوير حرف به ابعاد 64*64 پيكسل تغيير اندازه مي يابد و در نهايت عمل نازكسازي انجام مي گيرد . در مرحله استخراج ويژگيها ، تبديل موجك سه سطحي بر روي تصوير نازك شده اعمال مي شود و ضرايب باند LLاز سطح سوم استخراج مي گردند. در انتها ماتريس ضرايب باند LL بصورت برداري درآمده ، يك فيلتر پايين گذر بمنظور هموارسازي بيشتر ضرايب ، به آن اعمال مي شود . براي آموزش سيستم ، يك شبكه عصبي MLPبا قانون پس انتشار خطا مورد استفاده قرار مي گيرد . راندمان اين روش براي حروف و ارقام دست نويس فارسي بترتيب 92.33 و 91.81 درصد گزارش شده است .

[1] Wavelets

[2] Discrete Wavelet Transform

[3] Image Indexing

[4] Decimate

[5] Orthogonal

[6] Wave

[7] Compactly supported

[8] Multi-Resolution Analysis