چکیده

پس از ابداع نظریه فازی در توسط پروفسور لطفی زاده، کاربردهای این نظریه در حیطه های متفاوت علم کامپیوتر مورد توجه محققان قرار گرفت. یکی از این زمینه ها مربوط به کاربرد نظریه سیستم های فازی در پایگاه های داده، بازیابی اطلاعات و سیستم های خبره و پایگاه دانش است. این سه حیطه در خیلی از جهات مشابه هم می باشند، اما تفاوت هایی نیز دارند. اما مهمترین مسئله ای که در پایگاه های داده فازی مطرح می شود، نحوه مواجهه با پدیده عدم قطعیت است. راهکارهای بسیاری برای حل این مسئله ارائه شده است که در این گزارش مهمترین رویکرد های پایگاه داده فازی و راه حل هایی که برای مدل سازی پایگاه های داده فازی ارائه شده است مورد بررسی قرار می گیرند.

 

 

۱٫                مقدمه

در سال ۱۹۶۵ در دانشگاه کالیفرنیا، برکلی پروفسور لطفی زاده تئوری مجموعه های فازی و منطق فازی را مطرح کرد، که در نتیجه آن در سال ۱۹۷۷ تئوری امکان[۱]، شکل گرفت. این تئوری برای مواجهه شدن با اکثر پدیده های جهان واقع که در آنها عدم قطعیت وجود دارد مورد استفاده قرار می گیرد. پس از آن که زاده در آن سالها تئوری خود را مطرح نمود، گردهمایی ها و کنفرانس های بسیاری در طول این سال ها در زمینه گسترش مفهوم عدم قطعیت و کاربرد این نظریه در زمینه های گوناگون صنعتی برگزار گردید و مقالات علمی زیادی در ژورنال ها به چاپ رسید.

یکی از کاربردهای نظریه فازی در زمینه پایگاه داده فازی است که موضوع این گزارش می باشد. این گزارش شامل ۳ قسمت می باشد. در بخش اول نظریه فازی به صورت بسیار خلاصه معرفی شده است. در این بخش آن دسته از مفاهیمی که در دو قسمت بعدی مورد نیاز است آمده است. برای مطالعه بیشتر در مورد مفاهیم نظریه فازی رجوع کنید به [۲]. در بخش دوم مهمترین رویکرد هایی که برای پایگاه های داده رابطه ای فازی مطرح شده است، معرفی شده اند. مراجع مطالب این قسمت [۲]، [۳] و [۴] می باشد. در قسمت سوم نیز مهمترین رویکردهایی که برای مدل سازی پایگاه های داده فازی و توسعه نمودار موجودیت – رابطه ارائه شده است معرفی شده اند. مهمترین مراجع این قسمت [۳] و [۴] می باشند.

۲٫                مقدمه ای بر نظریه فازی

در منطق کلاسیک عضویت در یک مجموعه به صورت صفر و یک در نظر گرفته می شود؛ بدین صورت که در صورتی که عضوی در یک مجموعه وجود داشته باشد با ۱ و در غیر این صورت با ۰ نشان داده می شود. و در حقیقت درجه عضویت تابعی است که برد آن عضو مجموعه {۰،۱} می باشد. اما از طرف دیگر در منطق فازی، مفهوم درجه عضویت در یک مجموعه به بازه [۰, ۱] گسترش می یابد. مفهوم منطق فازی از آن جهت مورد توجه قرار می گیرد که در جهان واقع نیز بسیاری از استدلال ها و دلایل بشر، جنبه عدم قطعیت و تقریبی دارد.

تعریف مجموعه فازی: یک مجموعه فازی روی یک مجموعه مبدا[۲] X مجموعه ای از جفت های

به صورتی که تابع درجه عضویت[۳] عضو فازی مجموعه A نامیده می شود. تابع درجه عضویت می تواند هر یک از مقادیر حقیقی بین ۰ و ۱ را بپذیرد.

: بیانگر این است که x قطعا به مجموعه فازی A تعلق ندارد.

: بیانگر این است که x قطعا به مجموعه فازی A تعلق دارد.

در زیر مثالی آمده است از یک مجموعه فازی؛ اگر مفهوم جوانی را به عنوان یک مجموعه فازی در نظر بگیریم و x، مقادیر سن در مجموعه اعداد طبیعی باشند. یک نمایش از این مجموعه فازی می تواند مشابه زیر باشد. در شکل شماره ۱ نمایشی از سه مجموعه فازی جوانی، میان سالی و پیری آمده است.

Young = 1/0 + … + 1/25 + 0.9/26 + 0.8/27 + 0.7/28 + 0.6/29 + 0.5/30 + … + 0.1/34

شکل شماره ۱: نمودار تابع درجه عضویت سه مجموعه فازی جوانی، میانسالی و پیری

در ادامه مهمترین خصوصیات منطق فازی آمده است:

  • در منطق فازی، استدلال دقیق یا منطق معمولی حالت خاصی از استدلال تقریبی است.
  • هر سیستم منطقی قابل تبدیل به منطق فازی است.
  • در منطق فازی، دانش به عنوان مجموعه ای از محدودیت های فازی یا انعطاف پذیر روی متغیر ها در نظر گرفته می شود.
  • استنتاج به عنوان فرآیند انتشار این محدودیت ها در نظر گرفته می شود.
  • در منطق فازی تمام مسائل دارای راه حلی هستند که درجه مطلوبیت (امکان) را نشان می دهد.

به کمک همین مفهوم ساده یک حیطه جدیدی از ریاضیات و نظریه محاسبات پدید آمد که کاربردهای بسیاری در حوزه های گوناگون علمی من جمله سیستم های کنترل، مدلسازی، شبیه سازی، بازشناسی الگو، سیستم های اطلاعاتی و دانشی (شامل پایگاه های داده، سیستم های مدیریت دانش، سیستم های خبره و . . . )، بینایی ماشین، هوش مصنوعی و موضوعات بسیار دیگر.

برای توابع عضویت انتخاب های متفاوتی وجود دارد که بسته به کاربرد مد نظر می توان یکی از آنها را انتخاب کرد. در یک تقسیم بندی کلی که توسط زاده ارائه شد می توان توایع فازی را به دو دسته خطی و غیر خطی (منحنی) تقسیم بندی کرد. توابع مثلثی، یکه، L، گاما، ذوزنقه، S، گاوسی، شبه نمایی، از جمله معروفترین توابعی هستند که برای مدل کردن درجه عضویت در مجموعه های فازی برای کاربردهای متفاوت مورد استفاده قرار گرفته اند. در شکل شماره ۲ سه تابع گاما، ذوزنقه ای و S آمده است.

شکل شماره ۲: نمودار تابع درجه عضویت گاما، S و ذوزنقه

مفاهیم مجموعه های فازی

مانند آنچه در نظریه مجموعه های دقیق وجود داشت، برای مجموعه های فازی نیز می توان مفاهیم پایه عملیات روی مجموعه های فازی را تعریف کرد. به عنوان مثال تعریف برخی از روابط بین دو مجموعه فازی A و B در جدول شماره ۱ آمده است:

 

نام تعریف
تساوی
زیر مجموعه
مجموعه پشتیبان A
مجموعه کرنل A
ارتفاع مجموعه A
مجموعه فازی نرمال
کاردینالیتی مجموعه A
برش آلفای مجموعه A

چدول شماره ۱: برخی مفاهیم پایه مجموعه های فازی

مجموعه فازی محدب مجموعه ای است که هر برش از آن یک بازه باشد. در شکل شماره ۳ یک مجموعه فازی محدب و یک مجموعه فازی غیر محدب آمده است.

شکل شماره ۳ : مجموعه فازی محدب و غیر محدب

برای گسترش عملگر های اجتماع، اشتراک و مکمل در مجموعه های فازی ذکر مقدماتی ضروری است. در انتخاب عملگر اجتماع و اشتراک باید این عملگر ها طوری انتخاب شوند که برای حالت خاص مجموعه های دقیق نیز درست عمل کنند. یعنی برخی خواص پایه مانند را داشته باشد ولی برای مجموعه های فازی پیدا کردن چنین عملگر هایی برای اجتماع و اشتراک امکان پذیر نمی باشد. ولی رایج ترین عملگر برای عملگر اشتراک Minimum و برای اجتماع Maximum می باشد. در شکل های شماره ۴ و ۵ برخی از عملگر های اجتماع و اشتراک پیشنهاد شده توسط افراد گوناگون آمده است. این که کدام عملگر نسبت به دیگری بهتر است مفهومی ندارد اما می توان برای تمامی این روابط رابطه زیر را داشت. توضیح اینکه s(x, y) و t(x, y) به ترتیب به معنای اجتماع و اشتراک می باشند.

Drastic product(x, y) < t(x, y) < Minimum(x, y)

Maximum(x, y) < s(x, y) < Drastic Sum(x, y)

برای مکمل یک مجموعه فازی رایج ترین رابطه، یک منهای درجه عضویت است، که در زیر آمده است.

 

شکل شماره ۴ : برخی از عملگر های پیشنهادی برای عملگر اشتراک

شکل شماره ۵ : برخی از عملگر های پیشنهادی برای عملگر اجتماع

 

معیار های امکان[۴] و بایستگی[۵]

این مفاهیم مجموعه فازی را به عنوان توزیع امکان در نظر می گیرد؛ بدین معنی که A(x) امکان یک حالت خاص در یک مجموعه را می دهد. و با این فرض معیار اول به معنی امکان اینکه مقدار A برایر مقدار B باشد را می دهد. این معیار میزان انطباق A و B را به هم می دهد. با این تفسیر Poss(A, B) به صورت زیر تعریف می شود:

معیار بایستگی بیانگر درجه ای است که B درون A قرار دارد به صورت زیر تعریف می شود:

در شکل شماره ۶ نمودار هایی که این دو مقدار را نشان می دهند آمده است.

شکل شماره۶ نمایش معیار های لزوم و بایستگی

رابطه های فازی

یک رابطه کلاسیک روی دو مجموعه X و Y زیر مجموعه ای از ضرب کارتزین X*Y می باشد. به همین ترتیب یک رابطه فازی R مجموعه ای فازی از تاپل ها است که هر یک از آنها درجه عضویتی بین ۰ و ۱ در رابطه دارند. در زیر تعریف رابطه فازی آمده است.

اگر U و V دو مجموعه پیوسته باشند و ، رابطه فازی R به صورت زیر تعریف می شود.

به عنوان مثال می توان رابطه تقریبا مساوی را به صورت زیر تعریف کرد.

به همین ترتیب می توان مشابه آنچه در رابطه های کلاسیک وجود داشت در این حالت گسترش یافته نیز عملیات روی رابطه های فازی را تعریف کرد.

در مورد مجموعه های فازی و سیستم های فازی مطالب بسیار زیادی مطرح است که برای کسب اطلاعات بیشتر به مراجع فازی مراجعه نمایید.

۳٫                رویکردهای پایگاه داده فازی

در این بخش مدل های مهم مطرح شده برای حل مسئله نحوه نمایش و کار با داده های غیر قطعی در پایگاه داده های رابطه ای معرفی می شوند. نمایش و کار با داده های غیر قطعی در پایگاه های داده رابطه ای، مسئله پیچیده ای است که برای حل آن باید در ساختار رابطه ها و عملگر های مربوط به کار با رابطه ها اصلاحاتی داده شود.

پایگاه داده رابطه ای مدل بسیار موفقی در گستره وسیعی از کاربردها بوده است و بیشتر سیستم های مدیریت پایگاه داده امروزی مبتنی بر این مدل می باشند. در مدل رابطه ای که برای اولین بار در سال ۱۹۷۰ توسط Codd مطرح گردید، نحوه نمایش و مواجهه با پدیده عدم قطعیت به صورت مناسبی در آن در نظر گرفته نشده بود هر چند تلاش هایی برای این منظور صورت گرفته است.

وجود مفهوم NULL اولین تلاش برای نمایش مفهوم داده غیر قطعی در پایگاه داده رابطه ای است. این مدل از تئوری مجموعه های فازی استفاده نمی کند. قرار دادن مقدار NULL برای یک صفت بیانگر این است که این صفت می تواند هر مقداری داشته باشد. با فرض این که صفت مربوطه باینری و دارای مقادیر درست و غلط می باشد، مقدار NULL می تواند معادل مقدار شاید[۶] (unknown در SQL) در نظر گرفته شود. در شکل شماره ۱ جدول صحت عملگر های NOT، AND و OR نشان داده شده است.

شکل شماره ۷: جدول صحت سه حالته، درست، غلط و شاید

بعد ها در این مفهوم تغییر کوچکی بوجود آمد و مقدار NULL دو معنای متفاوت به خود گرفت. علامت A به معنی مقدار ناشناخته و قابل اجرا است؛ این در حالی است که علامت I به معنی ناشناخته و غیر قابل اجرا (تعریف نشده) است. به عنوان مثال مقدار رنگ اتومبیل برای فردی که اتومبیل ندارد I و برای فردی که رنگ اتومبیلش ناشناخته است A است. در شکل شماره ۲ جدول صحت این حالت چهار مقداری آمده است.

شکل شماره ۸: جدول صحت چهار حالته

اما در سال ۱۹۸۲، C. J. Date رویکرد جدیدی برای مواجهه با مقادیر NULL ارائه نمود، بدین صورت که از آنجایی که نحوه ذخیره مقدار NULL مسئله واضح و روشنی نیست، این ویژگی نباید در مدل رابطه ای وجود داشته باشد. با این فرض، Date مفهوم جایگزین دیگری با نام مقادیر پیش فرض مطرح نمود.

در این مدل، برای هر صفت در پایگاه داده مقدار پیش فرضی تعیین می شود که در صورتی که کاربر در هنگام درج تاپل جدید مقداری را معین نکند، مقدار پیش فرض جایگزین آن می گردد.

در سال ۱۹۸۰، Grant راه حلی برای استفاده از مقادیر بازه ای در پایگاه داده رابطه ای ارائه داد که به نوعی مفهوم عدم قطعیت را می شد با این مفهوم نشان داد. در این راه حل عملگر های رابطه ای در دو نسخه درست و شاید مجددا تعریف می شوند. به عنوان مثال عملگر > به صورت زیر تعریف می شود.

 

طبق پیشنهاد Lipski در پرس و جوهای این مدل هر تاپل می تواند در یکی از این مجموعه جای گیرد:

مطمئنا متعلق به مجموعه نتایج

احتمالا متعلق به مجموعه نتایج

قطعا عدم تعلق به مجموعه نتایج

استفاده از مقادیر NULL و پیش فرض و همچنین مدل استفاده از نوع داده بازه راهکارهایی در پایگاه داده های رابطه ای برای مواجهه با عدم قطعیت است که در آنها تئوری مجموعه های فازی مطرح نیست. اما هیچ کدام از این مدل ها برای مدل سازی عدم قطعیت موجود در جهان واقع مناسب نمی باشند.

پس از تعریف نظریه مجموعه های فازی توسط زاده در سال ۱۹۶۵، استفاده از داده های فازی برای مدل کردن اطلاعات غیر قطعی در پایگاه های داده مدنظر قرار گرفت و از آنجا بود که نیاز به گسترش پایگاه داده های رابطه ای سنتی احساس شد. بیشتر فعالیت ها در این زمینه در گسترش مدل پایه و زبان پرس و جو به منظور نمایش و بازیابی داده های غیر قطعی بوده است.

طبق تقسیم بندی که در [۱] موجود است می توان پایگاه های داده رابطه ای فازی را به سه دسته اصلی تقسیم بندی نمود. در دسته اول برای هر تاپل یک درجه عضویت بین [۰, ۱] به جای {۰, ۱} در نظر می گیرند. (Raju and Majumdar, 1988) و  (Baldwin and Zhou, 1984) در این دسته جای می گیرند. دسته دوم از اصل جایگزینی هم ارزی متداول بین مقادیر دامنه به کمک معیارهای نزدیکی همچون روابط مشابهت[۷] (در Buckles and Petry, 1982) و روابط نزدیکی[۸] (در Shenoi and Melton, 1989) استفاده می کنند. در دسته سوم مستقیما از توزیع امکان برای مقادیر صفات استفاده می شود. (Prade and Testmale, 1984). بر اساس این سه مدل پایگاه داده فازی، مدل های فازی دیگری نیز توسعه داده شده اند که به نوعی ترکیبی از سه مدل اصلی می باشند.

روابط مشابهت؛ مدل Buckles و Petry

مدل Buckles و Petry اولین مدلی بود که از روابط مشابهت برای مدل سازی پایگاه داده رابطه ای استفاده نمود. در این مدل یک رابطه فازی به عنوان زیر مجموعه ای از ضرب کارتزین P(D1)* . . . * P(Dm)، جایی که P(Di) یک مجموعه بخشی[۹] از دامنه Di ، که شامل تمام زیر مجموعه های قابل تصور در دامنه Di می باشد؛ در نظر گرفته می شود. انواع داده ای که توسط این مدل مجاز شمرده می شوند، شامل موارد زیر می باشد:

  • مجموعه متناهی از مقادیر اسکالر (بر چسب ها)
  • مجموعه متناهی از اعداد
  • مجموعه اعداد فازی

این مجموعه ها منفصل هستند، و انواع دیگر داده از رابطه مشابهت ساخته می شوند. در حالت کلی از مقادیر مشابهت در بازه [۰, ۱] نرمال می شوند؛ به صورتی که ۰ به معنی کاملا متفاوت و ۱ به معنی کاملا متشابه می باشد. در این حالت می توان یک آستانه مشابهت که مقداری بین ۰ و ۱ است، تعریف نمود؛ بدین صورت که مقادیری که مشابهت آنها بیش از مقدار آستانه است یکسان (یا غیر قابل تمییز ) در نظر گرفته می شوند.

در این حالت، مشابه آنچه در مورد پایگاه داده رابطه ای کلاسیک وجود داشت، از جبر رابطه ای فازی برای عملیات و دستیابی به پایگاه داده استفاده می شود. جبر رابطه ای فازی به مانند آنچه در جبر رابطه ای کلاسیک وجود داشت، دارای چهار مولفه اصلی می باشد. با این تفاوت که در آن مکانیزمی برای تعریف آستانه (مینیمم) تشابه یا مقبولیت بین عناصر موجود در یک دامنه مشترک در نظر گرفته می شود. در حالت خاص این جبر رابطه ای فازی، هنگامی که آستانه را برابر ۱ قرار دهیم به جبر رابطه ای کلاسیک می رسیم که دو مقدار باید یکسان باشند تا هم ارز یا مشابه در نظر گرفته شوند. اما در پایگاه داده فازی تاپل ها در صورتی که تشابه مقدار مد نظر آنها از آستانه بیشتر باشد، یکسان در نظر گرفته می شوند.

به عنوان یک مثال از پایگاه داده فازی و جبر رابطه ای فازی، فرض کنید که پایگاه داده ما حاوی نظرات یکسری افراد خبره در سه زمینه x، y و z می باشد. در پایگاه داده دو جدول مشابه آنچه در شکل شماره ۹ می بینید وجود دارد؛ یکی جدولی به نام EXPERT که شامل دو ستون NAME و FIELD می باشد و دیگری با نام ASSESSMENT که دارای سه ستون OPTION، NAME و OPINION است. به علاوه مشابه آنچه در شکل شماره ۱۰ می بینید یک رابطه سازگاری فازی برای مقادیر دامنه OPINON تعریف شده است که در آن میزان سازگاری مقادیر Highly Favorable (HF)، Favorable (F)، Slightly Favorable(SF)،            Slightly Negative(SN)، Negative(N) و در نهایت Highly Negative(HN) نسبت به هم آمده است.

شکل شماره ۹: پایگاه داده شامل دو جدول

 

شکل شماره ۱۰: میزان سازگاری مقادیر دامنه OPINION با یکدیگر

 

رابطه سازگاری در حالت قدیمی یکه است و تنها مقادیر یک یا صفر را به خود می پذیرد و می تواند روی هر کدام از فیلد های جدول تعریف گردد.

حال فرض کنید می خواهیم پاسخ پرس و جوی زیر را بیابیم.

“کدام یک از جامعه شناسان (sociologists) نظرشان در مورد گزینه Y با نظر آقای Kass تقریبا مشابه است؟”

برای پاسخ به این پرس و جو اولین مرحله استخراج نظر آقای Kass در مورد گزینه Y به کمک پرس و جوی زیر است :

مرحله بعد استخراج نام تمام جامعه شناسان به کمک پرس و جوی زیر می باشد:

 

حال نوبت به JOIN رابطه موقت R2 و ASSESSMENT و استخراج نظرات این افراد به کمک پرس و جوی زیر می رسد:

و در انتها دو رابطه موقت R1 و R3 با هم JOIN می شوند و نتیجه نهایی پرس و جو مشخص می گردد. اما نکته قابل توجه در این حالت این است که باید آستانه تشابه که به عنوان مثال در اینجا ۰٫۷۵ در نظر گرفته می شود در متن پرس و جو گنجانده شود.

مشخص نمودن حد آستانه صفر برای NAME از این جهت ضرورت دارد که نام ها نیز به مانند نظرات در یک مجموعه ادغام گردند.

مدل پیشنهادی توسط Buckles و Petry تنها از رابطه های فازی و جبر رابطه فازی آنهم از نوع مشابهت استفاده می کند. مدل دیگری که توسط Shenoi و Melton در سال ۱۹۸۹ و ۱۹۹۰ پیشنهاد شد در حقیقت گونه دیگری از مدل قبلی بود.

مدل های ارائه شده به کمک توصیف امکان

پس از ارائه مدل هایی که از روابط مشابهت، هم ارزی و . . . برای توصیف پایگاه داده فازی استفاده می کردند، مدل هایی برای پایگاه داده رابطه ای پیشنهاد شد که از تئوری امکان برای نمایش عدم قطعیت استفاده می کردند. مهمترین این مدل ها در زیر آمده اند:

  • مدل Prade – Testemale
  • مدل Umano – Fukami
  • مدل Zemankova – Kaendel

در ادامه هر یک از این سه مدل را به صورت مختصر معرفی می کنیم.

  1. مدل Prade – Testemale

این مدل اولین مدلی بود که مفهوم پایگاه داده فازی را به کمک حوزه تئوری امکان تعریف نمود. در این مدل، هر صفت A ، دارای یک دامنه مقادیر D است. تمام دانش در مورد مقادیری که A به ازای نمونه x می گیرد به کمک توزیع امکان πA(x) روی مجموعه D ∪ {e} ، که e نماینده عناصری است که A نمی تواند برای نمونه x بگیرد، قابل نمایش است. به عبارت دیگر πA(x) رابطه ای است از D ∪ {e} به بازه [۰, ۱]. به کمک این فرموله سازی تمام انواع مقادیر تطبیق داده شده به کمک این مدل قابل نمایش می گردد. در هر مدل که از تئوری امکان استفاده می کند، به ازای هر صفت A مقدار d ای وجود دارد که πA(x)(d) = 1 ، این بدین معنی است که مقدار d به صورت کامل برای A(x) امکان پذیر است. در جدول شماره ۲ اطلاعات این مدل آمده است.

راه حل هایی که برای مقایسه دو توزیع امکان ارائه شده است، همان مفاهیم معیارهای بایستگی و لزوم است که در قسمت ۲ معرفی شدند.

جدول شماره ۲: نمایش اطلاعات دو مدل

 

  1. مدل Umano – Fukami

این مدل نیز به مانند مدل قبل از توزیع امکان برای مدل کردن اطلاعات استفاده می کند. در این مدل اطلاعات غیر قابل کاربرد می توانند به عنوان مقادیر توزیع امکان که دارای امکان صفر هستند، در یک دامنه مدل شوند؛ بدین صورت که اگر D مجموعه مبدا A(x) باشد و πA(x)(d) درجه امکانی باشد که A(x) مقدار d ∈ D را بگیرد، برای مقادیر ناشناخته و قابل استفاده[۱۰] می توان از معادله زیر استفاده نمود:

مقادیر غیر قابل استفاده حالت خاصی از توزیع امکان می باشد که تعریف نشده[۱۱] نامیده می شود و نمایش آن در زیر آمده است:

در حالات خاصی که اطلاعات کافی برای تشخیص این که مقدار قابل استفاده است یا خیر، در دسترس نیست، مقدار خاصی تحت عنوان Null طبق تعریف زیر پیشنهاد شده است:

Null = { 1/Unknown, 1/Undefined }

برای مابقی حالات غیر قطعی، مدلی مشابه مدل قبلی پیشنهاد شده است.

همانند مدل قبل در این مدل نیز هر نمونه ای از رابطه در این مدل دارای یک توزیع امکان بین صفر و یک می باشد که بیانگر درجه عضویت آن در رابطه است. به عبارت دیگر تابع عضویت یک رابطه فازی دارای m صفت به صورت زیر تعریف می شود.

تابع mR مقداری بین صفر و یک را به هر نمونه از رابطه R که در حقیقت نمایشگر میزان امکان آن است نسبت می دهد. این مقدار به عنوان درجه عضویت رابطه R برای یک نمونه خاص در نظر گرفته می شود.

برای پردازش پرس و جو نیز در این مدل کلیه نمونه های رابطه به سه زیر مجموعه تقسیم می شوند؛ دسته اول آن دسته از نمونه هایی هستند که به صورت کامل در حوزه جواب پرس و جو جای می گیرند؛ دسته دوم آنهایی که با درجه ای از امکان در حوزه جواب قرار می گیرند و دسته سوم شامل آنهایی می شود که قطعا در حوزه پاسخ پرس و جو جای نمی گیرند. در جدول شماره ۲ اطلاعات این مدل به صورت خلاصه آمده است.

  1. مدل Zemankova – Kandel

این مدل در سال ۱۹۸۴ و ۱۹۸۵ انتشار یافت. این مدل شامل ۳ بخش اصلی است:

  • یک پایگاه داده از مقادیر، که در آن داده ها به شیوه دو مدل قبلی در آنها سازمان دهی شده اند.
  • یک پایگاه داده توصیفی، که در آن زیر مجموعه های فازی و رابطه های فازی ذخیره شده است.
  • مجموعه ای از قوانین ترجمه که برای اداره کردن قیود مورد استفاده قرار می گیرد.

پرس و جو در این مدل تا حدودی شبیه مدل Prade – Testemale است با این تفاوت که از معیار لزوم برای یافتن تشابه بین مجموعه شروط فازی با صفت A برای هر تاپل در رابطه به کمک معادله زیر استفاده می شود:

معیار قطعیت با استفاده از معادله زیر داده شده است:

در این مدل به جای استفاده از معیار بایستگی که در مدل پیشنهادی Prade – Testemale آمده بود، از معیار قطعیت[۱۲] استفاده شده است. ولی تفسیر درجه قطعیت روشن نیست و هیچ رابطه ای بین لزوم و قطعیت (مشابه رابطه ای که بین لزوم و بایستگی وجود داشت    N(x) = 1 – P( x) ) وجود ندارد.

نتیجه هر پرس و جو در این مدل شامل دو فیلد لزوم و قطعیت برای هر یک از نتایج پرس و جو است. برای پرس و جو می توان مینیمم آستانه را مشخص نمود.

۴٫                مدل سازی فازی پایگاه داده (توسعه ER برای مواجهه با عدم قطعیت)

برای مدلسازی پایگاه داده فازی و یا به عبارتی خاص تر توسعه مفاهیم مدلسازی پایگاه داده مثل نمودار های موجودیت – رابطه (ER) برای توانایی نمایش پایگاه های داده فازی از سال ۱۹۸۶ تاکنون مدل های زیادی پیشنهاد شده است. اولین این مدل ها مدلی بود که توسط Zvieli – Chen ارائه شد که در آن سه سطح فازینس قابل مطرح شدن و نمایش بود.

  1. در اولین سطح، موجودیت ها، رابطه ها و صفات می توانند به عنوان مجموعه فازی در نظر گرفته شوند و به طریقی که در شکل شماره ۹ نشان داده شده است درجه عضویت یا به بیان دیگر درجه امکان آنها نمایش داده شود. به عنوان مثال در این شکل درجه امکان موجودیت Company، برابر ۹، رابطه Accept برابر ۰٫۷ و صفت EmailAddress برابر ۰٫۸ است. حال در پیاده سازی با توجه به آستانه در نظر گرفته شده برای موجودیت ها، رابطه ها و صفات در صورتی که درجه امکان از مقدار آستانه بالاتر باشد، پیاده سازی می شود.
  2. سطح دوم در رابطه با میزان رخداد فازی موجودیت ها و روابط می باشد. به عنوان مثال، موجودیت Young_Emplyees باید فازی باشد، به خاطر این که نمونه های آن یعنی Emplyees هر یک با درجه ای از عضویت عضو این موجودیت می باشند.
  3. سطح سوم در رابطه با مقادیر فازی برخی صفات از موجودیت ها و روابط است. به عنوان مثال صفت Quality یک بازیکن فوتبال می تواند مقادیر Bad، Good، Very good و . . . را بگیرد.

شکل شماره ۹: توسعه فازی ER پیشنهاد شده توسط Zvieli and Chen

مدل دیگری که توسط Yazici and Merdan در سال ۱۹۹۶ ارائه شد گونه فازی شده مدل IFO بود که ExIFO نام داشت. در این مدل راهبردهایی برای نمایش صفات فازی، صفات دارای مقادیر ناقص و صفات دارای مقادیر Null ارائه شده است. مدل های بسیار دیگری نیز برای این مسئله ارائه شده است که در ادامه یکی از کامل ترین و جدیدترین این مدل ها همراه با یک مثال معرفی می شود.

این مدل توسط Ma، Zhang، Ma و Chen به صورت مشترک ارائه شده است. در این مدل که مبتنی بر همان مدل سه سطحی ارائه شده توسط Zvieli – Chen است، به هر یک از مولفه های موجودیت، رابطه و صفت یک درجه اهمیت نسبت داده می شود. در این مدل مفاهیم generalization، specialization، category، و aggregation به صورت محدود شده و تحت شرایط خاصی گنجانده شده است. بنابراین این مدل می تواند بع عنوان گسترش یافته فازی EER و OODB نیز مطرح باشد.

در شکل ۱۰ علامت های مورد استفاده در این مدل نشان داده شده است. که مفهوم هر یک از آنها در زیر آمده است:

  1. صفت تک مقداری
  2. صفت چند مقداری
  3. صفات فازی منفصل (Disjunctive)
  4. صفات فازی مرتبط (Conjunctive)
  5. صفات Null
  6. صفات باز یا Null
  7. صفات منفصل نادقیق
  8. صفات مرتبط نادقیق
  9. موجودیت همراه با درجه عضویت
  10. رابطه همراه با درجه عضویت
  11. صفت همراه با درجه عضویت

مفاهیم گسترش یافته این مدل در قسمت            b این شکل آمده است:

  1. fuzzy total and disjoint specialization
  2. fuzzy total and overlapping specialization
  3. fuzzy partial and disjoint specialization
  4. fuzzy subclass with fuzzy multiple superclasses
  5. fuzzy category
  6. fuzzy aggregation

 

شکل شماره ۱۰ : علامت های مدل پیشنهاد شده توسط Ma، Zhang، Ma و Chen

در شکل شماره ۱۱ مثالی از استفاده از این مدل آمده است. در این مثال موجودیت Car سوپرکلاس دو زیرکلاس فازی New car و Old car در حالت Overlapping specialization است. در سویی دیگر موجودیت فازی Young Employee و موجودیت Company تشکیل یک مجموعه union می دهند که موجودیت فازی buyer را بوجود می آورد. از طرفی موجودیت فازی Young Employee یک رابطه فازی Like با موجودیت new car دارد. در نهایت نیز موجودیت car یک aggregation با برخی موجودیت مثل engine، interior، chassis و radio (با درجه فازی ۰٫۷) دارد. در شکل مشاهده می شود که engine تعدادی صفت فازی مثل size و turbo دارد.

Ma، Zhang و Ma در سال ۲۰۰۴ یک مدل دیگر نیز برای توسعه پایگاه های داده فازی ارائه کردند که در آن برخی از ویژگی های پایگاه های داده شی گرا، مثل اشیا، کلاس ها، روابط بین کلاس ها، مفاهیم ارث بری و ارث بری چندگانه توسعه داده شده است.

شکل شماره ۱۱ مثالی از مدل پیشنهاد شده توسط Ma، Zhang، Ma و Chen

 

 

 

۵٫                منابع

[۱] Chen, G. Q., 1999, Fuzzy Logic in Data Modeling, Semantics, Constraints, and Database Design, Kluwer Academic Publisher.

 

[۲] George J. Klir Bo Yuan, 1995, Fuzzy sets and Fuzzy Logic, Theory and applications, Prentice Hall PTR.

[۳] Zongmin Ma, 2005, Fuzzy Database Modeling with XML, Springer.

[۴] Jose Galindo, Angelica Urrutia, Mario Piattini, 2006, Fuzzy Databases: Modeling, Design And Implementation, Idea Group Publishing.

 

[۱] Possibility theory

[۲] Universe of discourse

[۳] Membership degree

[۴] Possibility

[۵] Necessity

[۶] maybe

[۷] Similarity Relation

[۸] Proximity Relation

[۹] Part set

[۱۰] Applicable

[۱۱] Undefined

[۱۲] Certainty