طبقه بندی خطی یکی از روشهای بازشناسی الگو است که در مبحث شبکه های عصبی دائماً با آن روبه رو می شویم .ابتدا توضیح مختصری در مورد دستگاههای طبقه بندی خطی ارائه می دهیم و کاربرد آنها را در بازشناسی الگو بررسی می کنیم. سپس سعی می کنیم مسئله جدایی پذیری غیر خطی را حل کنیم. مسئله ای که تحقیقات شبکه های عصبی را از سال های ۱۹۶۰ تا سال های اخیر به رکود کشیده بود.

بحث گذشته درباره نحوه تقسیم فضای الگو به وسیله توابع ممیز را ه را برای بحث جدید هموار کرده است. مجدداً مسأله ساده دو بعدی ودو طبقه ای شکل ۳-۱ را موردنظر قرار دهید. هدف طبقه بندی بردارهای ورودی به دو طبقه a و b می باشد. دیدیم که چگونه می توان فضای الگو را به وسیله یک محدوده تصمیم خطی جدا کرد.لیکن به چه طریق می توان خط محدوده را در عمل با وجود داده های واقعی به دست آورد ومحل آن را تعیین نمود؟

در شکل ۳-۶ فضای الگو را همراه با بردار جدیدی نشان داده ایم. این بردار را بردار وزن ها ، w ، می نامیم. از جهت این بردار برای نشان دادن محدوده تصمیم خطی استفاده خواهد شد.

محدوده تصمیم تابع ممیز f(x) را به صورت زیر تعریف می کند:

F(x) =

= xi عضو I ام بردار ورودی ،=w عضوبردار I ام بردار وزن ها، و = n ابعاد بردار ورودی خروجی این تابع برای هر بردار ورودی یا مثبت است یا منفی که بستگی به مقدار بردار وزن ها وبردار ورودی دارد. اگر فرض کنیم مقدار خروجی مثبت نشان دهد که بردار متعلق به طبقه

 

شکل ۳-۶ جدا کردن طبقه ها توسط یک محدوده تصمیم خطی .

a می باشد ومقدار منفی نمایانگر طبقه b باشد آن گاه برای طبقه بندی هر بردار کافی است به علامت f(x) نگاه کنیم. بدین صورت:

اگر ۰ f(x)> آنگاه طبقه a

اگر ۰f(x) < آنگاه طبقه b

مسأله در واقع یافتن بردار وزن های مناسب است که برای تمام ورودی های طبقه های b وa جواب صحیح بدهد. اگر با استفاده از جبر خطی تابع ممیز را بسط دهیم ارتباط مقدار خروجی تابع و بردار وزن به روشنی معلوم می شود.

F(x) =

که پس از بسط می تواند به صورت زیر نوشته شود.

)- F(x) = (\w\.\ x\

در حالی که زاویه بین بردارهای x وw است.

مقدار cos بین ۱+ و ۱- تغییر می کند. در نتیجه مقدار بیش از ۹۰ درجه بین بردار وزن ها وبردار ورودی علامت f(x) را تغییر می دهد. این امر به وشنی نشان دهنده محدوده تصمیم خط راست است زیرا نقطه تغییر علامت در ۹۰+ و۹۰- درجه می باشد. می بینینم که تابع فوق در واقع محدوده تصمیمی را معین می کند لیکن هنوز محل این محدوده و عناصر بردار وزنها را نمی دانیم.

دو پارامتر محل قرار گرفتن محدوده تصمیم را در فضای طرح کنترل می کند. یکی شیب خط و دیگری محل تلاقی خط با محور y ها (مطابق هندسه معمول خطوط راست). شیب خط در واقع به وسیله اندازه بردار وزن ها تعیین می گردد. این موضوع را می توان با بررسی نقطه تغییر جهت یعنی شرایط مرزی که مقدار خروجی تابع طبقه بندی صفر است به خوبی مشاهده کرد.

در این جا داریم:

 

با مقایسه این معادله ومعادله خط راست (y = mx +c) مشاهده می شود که شیب خط به وسیله نسبت و محل تلاقی خط با محور y ها به وسیله مقدار کنترل می شود.

تا این جا ثابت کرده ایم که اگر مقدار صحیح بردار وزن ها را بدانیم می توانیم فرایند تمیز دادن بردارها را به خوبی انجام داده ومحل محدوده تصمیمرا تعیین کنیم. آن چه هنوز نشان نداده ایم این است که چگونه می توان مقدار بردار وزنها را به دست آورد.متأسفانه این امر ساده ای نبوده و اکثراً این خط را به وسیله روش های تکراری آزمون و خطا و اصلاح مقدار وزن ها با استفا ده از نوعی تابع خطا ۱ به دست می آورند. تابع خطا معمولاً خروجی دستگاه طبقه بندی را با جواب مطلوب مقایسه کرده و اختلاف را به نحوی نشان می دهد. اگر کاربرد تابع ممیز را در یک مسأله طبقه بندی منطقی دوگانه در نظر بگیریم ابعاد این مسأله روشن تر می شود. اگر بردار ورودی از n عنصر صفر و یک تشکیل شده باشد تعداد طرح های ورودی برابر n2خواهد بود. برای تقسیم این طرح ها به انواع ممکن شاخه های دوگانه به صورت بالقوه تعداد n22تابع ممیز وجود خواهد داشت. لیکن دستگاه های طبقه بندی خطی فقط قادر به تعدادی از تقسیم بندی های دو شاخه ای هستندـ گروهی که در واقع جدایی پذیر خطی هستند. مسئله جدایی پذیری خطی موضوعی است که به طور تنگاتنگ، به تاریخچه تحقیقات شبکه های عصبی مربوط می باشد. در حال حاضر مسأله ای را «جدایی پذیرخطی» تعریف می کنیم که تنها به وسیله یک فوق صفحه بتوان محدوده تصمیم را به دو گروه طبقه بندی کرد.

مثالهایی که تاکنون آوردیم تنها دستگاههای خطی بودند که می توانستند فقط طبقه را جداکنند. در عمل می توان دستگاههای طبقه بندی خطی را طرح کرد که بتواند بیش از دو طبه را از یکدیگر تمیز دهند. این عمل را با تنظیم محدوده های تصمیم متعدد و آزمونهای چندگانه براساس شرایط موجود هر طبقه انجام می دهیم. به عنوان مثال ، در یک مسأله چهار طبقه ای (a,b,c,d) ابتدا محدوده تصمیمی را برای تمیز دادن طبقه a از (b,c,d) وسپس چنانچه در طبقه(b) نبود بین(c) و(d) در نظر می گرفتیم. به همین صورت برای مسائل طبقه بندی پیچیده تر سطوح محدوده تصمیم می تواندهمان طور که در شکل ۳-۷ آمده است به صورت جزء به جزء به قطعات متعدد تقسیم شود.

شکل ۳-۷ طبقه بندی خطی جزء به جزء برای طبقه بندی طرح های جدایی پذیر غیر خطی

 

در مسائل جدایی ناپذیر غیر خطی می توان حالات غیرخطی را همچنین با انجام یک عمل تبدیل در داده های ورودی قبل از طبقه بندی به وجود آورد. این تکنیک را ماشین می نامند. چنین پیش پردازش هایی قبل از طبقه بندی طرح ها توسط دستگاههای طبقه بندی امر معمول است. فرایند تبدیل به صورتی انتخاب می شود که بتواند طرحها را به کدهای جدیدی تبدیل کند به صورتی که قابل تفکیک توسط دستگاه طبقه بندی خطی باشند. اشکال عمده این روش آن است که می تواند کند باشد.


نتیجه گیری

در اینجا بحث ما درباره روشهای قطعی بازشناسی الگوها پایان می پذیرد. گرچه تا نقطه تکمیل مطلب فاصله بسیار است، امید می رود که این بحث زمینه اطلاعاتی کافی برای مباحث آینده ما درمورد روشهای محاسباتی شبکه های عصبی فراهم آورد.

۱_ error function