• پاک سازی داده ها: در این مرحله داده های غیر معتبر از مجموعه داده های آموزشی خارج می شوند. داده های دارای نویز، اطلاعات ناکامل و … نمونه هایی از داده هایی هستند که با ید پاکسازی در مورد آنها انجام گردد.
  • یکپارچه سازی داده ها: در این مرحله، منابع چندگانه داده ای با هم ترکیب می شوند.
  • انتخاب داده ها : داده های مرتبط به فرایند Data Mining از سایر داده ها جدا می شود. این مبحث را می توان بخشی از فرایند کاهش اطلاعات نیز دانست.
  • تبدیل داده ها: داده ها به قالبی قابل استفاده برای Data Mining در می آیند. از اعمالی که در این مرحله صورت می گیرد ، می توان به خلاصه سازی و یا محاسبه مقادیر تجمعی اشاره کرد.
  • Data Mining: بخش اصلی فرایند که در آن با استفاده از روش ها و تکنیکهای خاص ، استخراج الگو های دانش صورت می گیرد.
  • ارزیابی الگوها: تشخیص الگو های صحیح مورد نظر ، از سایر الگو ها در این مرحله انجام می شود. صحت الگوها بر اساس یک سری معیار های جذابیت سنجیده می شود.
  • بازنمایی دانش: در این بخش به منظور ارائه دانش استخراج شده به کاربر ، از یک سری ابزارهای بصری سازی استفاده می گردد.