اصطلاح پیش پردازش به تمام عملیاتی دلالت دارد که نیاز است روی نمونه های زمانی سیگنال گفتار قبل از استخراج ویژگی ها انجام شود. برای مثال با توجه به تفاوت محیط های ضبط , بعضی از انواع نرمالیزه کردن(هنجارسازی ها) انرژی باید برای تمام سخنان انجام شود. به منظور یکنواخت کردن اثر انتشار گفتار در هوا یک فیلتر پیش تاکید برای پردازش سیگنال گفتار قبل از استخراج ویژگی ها استفاده می شود. تابع انتقال فیلتر پیش تاکید معمولا توسط فرمول زیر ارائه می شود[۱۰۴]

H(z)=1-0.97z-1                                     (۲)

که به منظور صاف کردن

علاوه بر آن به منظور کاهش موجهادر طیف گفتار, هر فریمی

 

 

استخراج کردن ویژگی های گفتاری مناسب از ویژگی های زمانی از پیش پردازش شده, برخی پس پردازش ها ممکن است قبل از اینکه بردارهای ویژگی برای آموزش یا آزمودن طبقه بندی کننده استفاده شوند لازم باشد. برای مثال, ویژگی های استخراج شده ممکن است از واحدهای متفاوتی باشند و بنابراین مقادیر عددیشان ترتیب های متفاوتی از اندازه را دارند.به علاوه, برخی از آنها ممکن است مغرضانه باشد. از آنجاییکه ماتریس کواریانس داده آموزشی ممکن است نامساعد باشد,این می تواند باعث برخی مشکلات عددی در اموزش برخی طبقه بندی کننده ها مانند مدل مخلوط گوسی (GMM)شود. بنابراین,هنجارسازی(نرمالیزه کردن) ویژگی ممکن است در چنین حالت هایی لازم باشد.

 

همچنین مرسوم است که تکنیک های کاهش بعد در کارهای بازشناسی عاطفی گفتار به منظور کاهش

دو رویکرد برای کاهش ابعاد وجود دارد: انتخاب ویژگی و استخراج ویژگی( که

در انتخاب ویژگی,هدف اصلی پیدا کردن زیر مجموعه ای از ویژگی ها که به بهترین طبقه بندی ممکن بین کلاسها دست یابد. توانایی دسته بندی یک زیرمجموعه از ویژگی

 

از طرف دیگر, اهداف تکنیکهای استخراج ویژگی در یافتن یک نگاشت مناسب خطی به غیر خطی از فضای ویژگی های اصلی به فضای دیگری با کاهش ابعاد است در حالیکه اطلاعات طبقه بندی مربوطه را تا حد ممکن حفظ می کند. خواننده می تواند به [۵۸,۳۴] برای یک مرور عالی بر تکنیک های کاهش بعد رجوع کند.

روش استخراج ویژگی تحلیل مولفه های اصلی(PCA)به طور گسترده ای در زمینه بازشناسی عواطف گفتار استفاده شده است .[۱۴۱,۱۴۳,۱۳۰,۷۱]در [۲۵]مشاهده شده است که افزایش تعداد مولفه های اصلی کارایی طبقه بندی را بهبود می دهد

این به این معناست که به کار بردن PCA ممکن است یک بهبودی را در کارایی طبقه بندی

در حالیکه کارایی PCA

در [۱۴۱,۱۴۲] گزارش شده است کهPCA

یک تعبیر واضح آن است که ویژگی های صوتی و پایگاه داده های عاطفی متفاوتی در این مطالعات استفاده شده است.

 

LDAهمچنین برای کارهای بازشناسی عاطفی گفتار [۱۴۱,۱۴۳]به کار می رود با وجود اینکه آن محدودیت هایی دارد که کاهش می دهد ابعادی که باید کمتر از تعداد کلاسها باشد [۳۴].در [۱۱۶], تکنیک LDAبرای مقایسه بیش از ۲۰۰ ویژگی گفتاراستفاده می شود. طبق این مطالعه, نتیجه می شود که ویژگی های مرتبط با گام ۶۹٫۸۱% دقت بازشناسی را در مقابل ۳۶٫۵۸% که ویژگی های مرتبط با انرژی فراهم می آورند به همراه می آورد. نتیجه بر خلاف آن چیزی است که در [۱۰۱] بدست آمده که آن نیجه گیری کرده که