قاعده فراگیری پرسپترون چندلایه را «قاعده کلی دلتا» یا «قاعده پس انتشار» گویند. این عناوین در سال ۱۹۸۶ توسط رومل هارت، مک کللند و ویلیامز پیشنهاد شد و این آغاز تولد دوباره شبکه‌های عصبی بود . بعدها معلوم شد که نتایج مشابهی نیز قبلاً در سال ۱۹۸۲ توسط پارکر منتشر شده و همچنی وربس در سال ۱۹۷۴ کار مشابهی انجام داده است . این طبیعت علم است . گروه‌های متفاوت در حوزه‌های وسیع نمی توانند از تمامی پیشرفت‌ها در حوزه‌های دیگر مطلع شوند و در نتیجه تکرار تلاش ها گریز ناپذیر خواهد بود . به هر صورت این افتخار به آن‌ها تعلق می‌گیرد که اولین گروهی بودند که نه تنها قاعده فراگیری پرسپترون را به طور مستقل کشف کردند بلکه با ترکیب آن‌ها پرسپترون چند لایه‌ای را ایجاد کرده و مورد مطالعه قرار دادند . کتاب آن‌ها به نام « پردازیش توزیع شده موازی» هنوز یکی از مهم‌ترین کتاب‌های این حوزه علمی است .

نحوه عمل پرسپترون چند لایه‌ای مشابه پرسپترو تک لایه‌ای است . بدین صورت که الگویی به شبکه عرضه می‌شود و خروجی آن محاسبه می‌گردد ، مقایسه خروجی واقعی و خروجی مطلوب باعث می گردد که ضرایب وزنی شبکه تغییر یابد به طوری که در دفعات بعد خروجی درست تری حاصل شود . قاعده فراگیری روش میزان کردن ضرایب وزنی شبکه را بیان می‌کند . دیدیم که قاعده ساده فراگیری پرسپترون تک لایه‌ای در مورد پرسپترون چند لایه‌ای کارگر نیست . لیکن استفاده از تابع سیگموند بدان معنی است که واحدهای میانی تا اندازه‌ای نسبت به خروجی های مدل آگاهی دارند . به طوری که می توان ضرایب وزنی آن‌ها را برای کاهش میزان خطا تنظیم کرد .

قاعده فراگیری پرسپترون چند لایه‌ای قدری پیچیده تر از قاعده قبلی است . بهترین راه درک آن بررسی رفتار شبکه هنگام آموزش الگوهای عرضه شده می‌باشد . وقتی به شبکه آموزش ندیده‌ای الگویی را عرضه می‌کنیم ، خروجی‌ای تصادفی تولید می‌کند . ابتدا باید تابع خطایی را تعریف کنیم که تفاوت خروجی واقعی و خروجی مطلوب را نشان دهد . برای موفق شدن در آموزش شبکه باید خروجی آن را به تدریج به خروجی مطلوب نزدیک کنیم . به عبارت دیگر باید میزان تابع خطا را به طور دائم کاهش دهیم . برای این منظور ضرایب وزنی خطوط ارتباطی واحدها با استفاده از قاعده کلی دلتا میزان می شود . قاعده دلتا مقدار تابع خطا را محاسبه کرده و آن را به عقب از یک لایه به لای پیشین آن انتشار می‌دهد. عبارت « پس انتشار» به این علت است . ضرایب وزنی هر مورد واحدهای لایه خارجی ساده زیرا خروجی واقعی و مطلوب آن‌ها را می دانیم ، ولی در مورد لایه میانی چندان روشن نیست. این گمان می‌رود که ضرایب وزنی واحدهای پنهان که به واحدهای مرتبط آن‌ها خروجی تقریباً صحیحی دارند تغییر یابد . در واقع ریاضیان نشان می‌دهد که ضرایب وادها باید به تناسب میزان خطای واحدی که به آن متصل‌اند تغییر کند . بنابراین می‌توان با انتشار خطا به عقب ضرایب وزنی خطوط ارتباطی تمام لایه‌ها را به درستی میزان کرد . به این طریق تابع خطا کاهش و شبکه آموزش می‌یابد .