داده­کاوی

//داده­کاوی

داده­کاوی

در سالهای اخیر داده­کاوی برروی سریهای زمانی توجه بسیاری را به خود جلب کرده است. شاید بتوان گفت از میان تمام تکنیکهای به کار برده شده برروی سریهای زمانی، خوشه­بندی پر استفاده­ترین تکنیک می­باشد. خوشه­بندی سریهای زمانی می­تواند به دلائل مختلفی مانند یافتن الگوهای پنهان در داده­ها و جستجوی شباهتها انجام شود.

سریهای زمانی معمولاً دارای ابعاد طولانی هستند که این امر کار پردازش آنها را چه از نظر حافظه و چه از نظر زمان با مشکل روبرو می­سازد. اما خوشبختانه به دلیل وابستگی زیاد بین مقادیر متوالی یک سری زمانی، تکنیکهای کاهش ابعاد داده راهکار مناسبی برای حل مشکل ابعاد آنها می­باشد. با توجه به اینکه موضوع مورد بررسی ما خوشه­بندی است، ما به بررسی تأثیر پنج روش مختلف کاهش ابعاد داده در خوشه­بندی به وسیله الگوریتم k-means پرداخته و با انجام آزمایشات وسیع به این نتیجه رسیدیم که خوشه­بندی برروی درصد بسیار کمی از مهمترین مؤلفه­های استخراج شده از داده­ها می­تواند به نتایجی بسیار نزدیک به خوشه­بندی برروی داده­های اصلی منجر شود. همچنین با ایجاد دو تغییر اساسی در روش Random Projection، روش جدیدی به نام Sample Based Projection برای کاهش ابعاد داده ارائه کردیم که در آزمایشات انجام شده، عملکرد خوبی از خود به نمایش گذاشت بطوری که وقتی ابعاد داده­های کاهش یافته را کوچک (مثلاً کمتر از 8) در نظر گرفتیم، از پنج روش دیگر بجز روش Principle Component Analysis بهتر عمل کرد.

در ادامه الگوریتمی به نام AKU-kMeans برای خوشه­بندی سریهای زمانی ارائه کرده­ایم که چه از نظر زمان اجرا و چه از نظر معیار ICV (که از آن برای ارزیابی خوشه­بندی استفاده کرده­ایم) بهتر از الگوریتم k-means عمل می­کند. در روش پیشنهاد شده، الگوریتم k-means برروی داده­های  بُعدی انجام می­شود که  عددی کوچک مانند 1، 2 و یا 4 می­باشد. سپس بطور متوالی ابعاد داده­ها از  به  افزایش یافته و الگوریتم k-means برروی داده­های کاهش یافته جدید که دارای دقت بیشتری هستند انجام می­شود. این روند آنقدر ادامه می­یابد تا خوشه­بندی بهتری پیدا نشود.

از آنجایی که خوشه­بندی یکی از مسائل بهینه­سازی به شمار می­آید از الگوریتم ژنتیک نیز می­توان برای حل آن استفاده نمود. تا کنون چندین روش برای خوشه­بندی داده­ها با استفاده از الگوریتم ژنتیک ارائه شده است اما در هیچکدام از آنها توجهی به ابعاد داده­ها نشده است. ما با به کار گیری ایده مطرح شده در الگوریتم AKU-kMeans، یک الگوریتم ژنتیک برای خوشه­بندی سریهای زمانی ارائه کردیم.

کلمات کلیدی: داده­کاوی، خوشه­بندی، سریهای زمانی، الگوریتم ژنتیک، کاهش ابعاد داده

۱۳۹۲-۱۲-۲۸ ۰۷:۵۳:۰۷ +۰۳:۳۰اسفند ۲۸ام, ۱۳۹۲|عمومی دسته بندی ها|بدون ديدگاه

ثبت ديدگاه

پرداخت

1-پرداخت آنلاین
برای پرداخت آنلاین از لینک زیر استفاده کنید
پرداخت آنلاین
2- پرداخت آفلاین
برای پرداخت آفلاین مبلغ مورد نظر را به یکی از شماره کارت
6037997245888723بانک ملی