به کارگیری اطلاعات جانبی(پس پردازش)

در اين مرحله با استفاده از اطلاعات جانبي(نظير مجموعه لغات معتبر، اطلاعات آماري مربوط به رخداد حروف، اطلاعات دستوري و معنايي) سعي در بهبود نتايج حاصل از مرحله بازشناسي مي گردد. تا قبل از اين مرحله، هيچگونه اطلاعات معناشناختي در طول مراحل پردازشي مورد استفاده قرار نگرفته بود. مرحله پيش پردازش سعي در «تمیزکردن» تصوير سند به نحو مقتضي دارد و به علت عدم دسترسي به اطلاعات مفهومي، ممكن است باعث حذف برخي از اطلاعات مهم تصوير گردد. فقدان اطلاعات معنايي در مرحله قطعه بندي مي تواند به نتايج حادتر و غيرقابل برگشتي بينجامد؛ چرا كه خروجي اين مرحله، تعيين كنندةمرز الگوهاي ورودي مي باشد. بنابراين واضح است كه در صورت فراهم شدن اطلاعات معناشناختي، دقت نتايج بازشناسي به نحو چشمگيري افزايش مي يابد. مروري بر تحقيقات اخيراً انجام شده در زمينه بازشناسي حروف نشان مي دهد كه در صورت استفاده از اطلاعات شكلي بدون به كارگيري اطلاعات معناشناختي، افزايش دقت قابل توجهي نخواهيم داشت. در نتيجه، يكپارچه كردن اطلاعات معنايي و شكلي در كليه بلوك هاي سيستم هاي « اُسي آر » به منظور بهبود نرخ بازشناسي صحيح، ضرورت دارد.

ساده ترين راه براي اين منظور، استفاده از يك فرهنگ لغات براي اصلاح خطاهاي جزئي است. اين كار توسط يك برنامه واژه پرداز (با قابليت خطاياب املايي ) كه املاي كلمات را كنترل و چندين پيشنهاد براي اصلاح املاي كلمات نامأنوس ارائه مي كند، انجام مي گيرد.