درآمدی بر گرامر های ترکیبی در پردازش زبان های طبیعی

//درآمدی بر گرامر های ترکیبی در پردازش زبان های طبیعی

درآمدی بر گرامر های ترکیبی در پردازش زبان های طبیعی

 

دانشگاه آزاد اسلامی

واحد قزوین

دانشکده برق، رایانه و فناوری اطلاعات

 

Categorial combinatorial Grammar(CCG)

 

گرامرهای ترکیبی

نگارش:

استاد راهنما:

پاییز 1390

به نام خدا

درآمدی بر گرامر های ترکیبی در پردازش زبان های طبیعی

 

چکیده
چارچوب خانواده گرامر ترکیبی شامل مجموعه ای متنوع از عبارات ترکیبی که دارای اصول یکسان هستندمشروط بر اینکه از لحاظ لغوی دریک مرتبه بالا وشفافیت معنایی باشد.قواعدترکیب شونده منجر به از بین رفتن محدودیت قوانین در یک زبان خاص می شود. مشخصه های گرامر ترکیبی را می توان به صورت مجموعه ای از مقوله های اساسی، مجموعه ای از مقوله های مشتق شده،  برخی از قواعد نحوی توصیف الحاق و طبقه بندی از نتیجه الحاق در نظرگرفت .علاوه بر این  هر عنصر لغوی حداقل به یک گروه نسبت داده شده است که دارای دو گروه اولیه N و S است .

 

مقدمه
انواع مختلف از گرامرها در تعریف نحو زبان طبیعی استفاده می شود.ازجمله گرامرهای ترکیبی که از نقطه نظر معنایی مناسب ترین گرامر درنظر گر فته می شوند.این گرامرها به طورخلاصه CCG مطرح می شوند.

 بخشی از کارهایی که دراین زمینه انجام شده عبارتنداز:درسال 1988   استدمن روی  گرامر ترکیبی وساختارهای زبان طبیعی ،درهمین سال هنک زیوال دررابطه با گرامرهای ترکیبی فعالیت کرده درسال 1990,ویژی شانکر ودیوید ویردرزمینه تجزیه گرامرهای ترکیبی ،درسال 2000 فرانک تریچسل  تئوری زبان شناسی ،درسال 2002 جیسون بالیدریچ وجان کراف در حوزه اتصال گرامرهای ترکیبی ومعناشناسی منطقی وهم چنین درسال 2003 روی گرامرهای ترکیبی چندبعدی نیز تحقیقات کرده انددر همین سال جیسون بالیدریچ درزمینه استخراج لغات خاص درگرامرهای ترکیبی  فعالیت داشته ،درسال 2003 استدمن روابط گرامری وتئوری پارامتریک فرهنگ لغت در CCG را بررسی کرده، درسال 2004 مایل وایت کارایی تفهیم ساختارهای مربوط در گرامرهای ترکیبی فعالیت داشته است.

دراین مقاله ابتداشرح مختصری از قوانین وقواعد گرامرهای ترکیبی  ساده و گرامرهای ترکیبی شی گرا آورده شده ویکی از کاربرد های این گرامر درمورد ترجمه متن صحبت شده وبا ذکر یک مثال در این زمینه روی یک مجموعه جملات فرضی به پایان رسیده است.

گرامرهای ترکیبی(CCG (

 

     اشیاء دستوری گرامر ترکیبی اقلامی هستند که ممکن است عناصر اتمیک باشدیا توابع خطی استاندارد که آرگومان های این عناصرراجستجو می کند عبارات این کلمات به صورت جفت کلماتی که با عملگر خاص زیرنمایش داده می شود.یک نمونه ساده درزیر آورده شده:

    مقررات اساسی مربوط به گروه ها به صورت (<) رو به جلو ، (>) رو به عقب، عبارت است از:

با توجه به قوانین و گروه های داده شده در (1) می توانیم جملات ساده ای مانند ed saw ann رابه صورت زیر نتیجه بگیریم به دلیل شفافیت معنایی یک فرم منطقی برای جمله می تواند به صورت زیر باشد.

هم چنین با بهره گیری از قواعدبیشترروی ترکیب b می توان عبارت T را جایگزین کردوباتعویض ترکیبات منطقی می توان چندین اشتقاق مجزا

راتشکیل داد.برای مثال قوانین روبه جلو وروبه عقب برای هردو ترکیب ونوع برآورد آن :

قوانین شرکت پذیری دراشتقاق ها برای ساخت اجزاء غیراستاندارد برای گرامرهای شناخته شده بسیار مهم است برای مثال با اشتقاق های مکرر از

قانون (2) می توان :

توجه شود قوانین ترکیبی ،نوع اشتقاق یکسان وثابت دارندبنابراین این اشتقاق دقیقاً فرم منطقی یکسانی مانند (2) راتولید کند.

یکی از بزرگترین موفقیت های گرامرهای ترکیبی این است که می تواند وابستگی نامحدودساختار نحوی را در یک روش اشتقاق تفسیر کند.

انواع لغاتی که دارای وابستگی هستند درتعامل با قواعدترکیبی به پدیده های بیشماری تعمیم داده می شود.برای مثال عبارت(c) از قانون (1)نه تنها عبارت” “ed saw ann مشتق می شود بلکه عبارت “that I think that ed saw”  هم مشتق می شود.

قوانین معرفی شده در بالا همگی هارمونیک هستندیعنی این قوانین زمانی مفید هستند که می خواهیم اجزاء معین یک جمله را بارعایت درست موقعیت آن حرکت دهیم برای مثال در انگلیسی قید بین فعل و مفعول قرار می گیردبرای رسیدن به این مهم قوانینی موردنیاز است که قیدوفعل را ترکیب کند قبل از اینکه از شناسه مفعولی استفاده شود.

گرامرترکیب دارای دو جایگشت القاء قواعدترکیب است که دقیقاً قابلیت های موردنیاز رافراهم می سازد.

همانطور که از شکل این قواعد دیده می شود عملگر اولیه ازدو قسمت تشکیل شده به شیوه ای که آن را بین عملگر ثانویه ونشانوند (z ) آن قرار می دهداین همان چیزی است که برای عبارت شماره (5) موردنیاز است.

آن دسته از گرامرهایی که فقط شامل ترکیبات کاربردی جلورو،وقب رو هستند گرامر های محض (pure categorical grammar)نامیده می شود اگرچه می توانند به کمک ترکیبات اضافی توسعه داده شوند.برای مثال گرامرهای ترکیبی از ترکیب type-raising وfunctional composition بدست آمده اند .

Type-raising

قابلیت تبدیل انواع ترکیبات بنیادی وپایه ای به انواع کاربردی وتابعی مانندزیر:

به موجب آن عبارت اسمی  مقدماتی به جمله تبدیل می شود. این قانون یک نمونه type-raising جلورو را نمایش می دهد.

این raising هم چنین subject type-raising نامیده می شود.زیرا عبارت اسمی یک subject  هست که به تابع رسیده.

زیرنویس T روی بردار اشتقاق ‘⇒’  نوع عملگر رابیان می کند وعلامت”>T”   در اشتقاق type-raising را از functional composition متمایز می کند.

مثال 2b  قانون شماره (1) دررشته اشتقاق “birds fly” را نشان می دهد.

به طور مشابه (2a) یک اشتقاق رشته یکسان رانشان می دهدکه type-raising رابه کار نبرده است.

کلمه “birds”  وابسته به نوع ترکیب پایه ای عبارت اسمی درهردو(2a) و(2b)  می باشد و”fly” وابسته به نوع تابعی s\np می باشد.در (2a) کاربرد  عقب روتابع s\np به آرگومانش روی سمت چپ نتیجه s می باشد ودر(2b) نوع ترکیب عبارت اسمی فاعل “birds”توسط قانون type-raising جلوروبه یک تابع به فرم s/(s\np) تبدیل شده آرگومان s\np  تابع جدید،نوع ترکیب” fly” می باشد یک کاربرد تابع جلورو می تواند تولید جمله باشد. type-raising جلورو در(2b)    بوسیله کاربرد تابع جلورودنبال شده است.نتیجه یکسانی مانند عملگر تابع عقب رو در(2a) راتولید می کند. type-raisingآرگومان عبارت اسمی رابه جمله تغییر می دهد که تابعی روی جمله می باشد که عبارت اسمی آن را به عنوان آرگومان می پذیرد.

متناوباً عملکرد تابع s/(s\np) ممکن است وابسته به کلمه “birds” واژه نامه باشد مانند زیر:

 

این پیوند به تنهایی از پیوند عبارت اسمی ویا  اسم  نتیجه گرفته شده طبق این رویکرد قوانینی مانند قانون (1) تنها رابطه یا اتصال بین دستور زبان np و s/(s\np) با انواع متصل شده به “birds” در فرهنگ لغت را توصیف می کند.

اگر انواع raised وابسته به اسامی در فرهنگ لغت باشند آنگاه type-raising درطی یک اشتقاق عمل نمی کند.و انواع متفاوتی در فرهنگ لغت ایجاد می کند:

  • پردازش موازی : تناوب انجمن ها ،اشتقاق های متناوب همزمان را هدایت می کند
  • پردازش سریال : هیوریستیک ها ممکن است بر طبق مطابق چیزی عمل کنند که اگر

“birds” یک کلمه درجمله مانند فاعل جمله باشد نوع و s/(s\np)اولویت داده شده وآزمایش شده قبل از اینکه عبارت اسمی تکرار شود.

type-raising در زبان هایی نظیر لاتین وژاپنی ممکن است یک نشانوند واژه ای باشد.در این زبان ها فاعل جمله بوسیله نشانوند حالت فاعلی مشخص می شود.این واژک به لغت متصل می شود با یک تابعی که اسم را به تابعی که آرگومان آن فعل باشد نگاشت می کند.

زبانهایی مانند انگلیسی وچینی هم چنین نیاز به واژک های نشانوند دارند این واژک موقعیت عبارت اسمی نسبت به فعلی که نقش این واژک راانجام می دهد می باشد. برای مثال عبارت اسمی که قبل از فعل در یک جمله ساده انگلیسی می آید فاعل می باشد.

در حقیقت بوسیله جانشین کردن (عبارت فعلی) برای آرگومان s\np تابعی روی عبارت فعلی می تواند ساخته شود این جانشینی حاصل تابعی است که می تواند به صورت s\vp  نوشته شود.

فاعل قانون type-raising درمثال (1) یک مورد خاصی است که درقانون زیر آمده:

x فاعل جمله هست وبه صورت نرمال ازنوع عبارت اسمی است عبارت اسمی با x معرفی شده و T با s  معرفی شده

هم چنین یک عقب رو  شبیه جلورو وجود دارد که برطبق قانون زیرعمل می کند :

همان محدودیت هایی که در رابطه (4) بر روی xوT وجود دارد در این رابطه هم وجود دارد علاوه بر x، عبارت اسمی  ممکن است یک نوع جمله و یاpp که مکمل افعال است باشد.

Functional Composition

ویژگی های اساسی که اغلب برای گرامرهای ترکیبی ذکر می شود عبارتنداز:

  • type-raising
  • Composition Functional

اگر دامنه یک تابع با طیف تابعی دیگر مطابقت داشته باشداین دوتابع را می توان باهم ترکیب کرد

درترکیب جلورو دوتابع دامنه تابع اول طیفی برای تابع دوم می شود نتیجه این ترکیب یک تابع جدید با طیف تابع اول ودامنه تابع دوم است . ترکیب جلورو مانند قانون زیر عمل می کند :

فرم تابعی Y/X نوع نحوی آن را نشان می دهد ،ترکیب کلمات با انواع نحوی توسط فرم تابعی

Y/Zو Z/Xارائه شده است . مثال زیر نحوه عملکرد جلورو دراشتقاق رشته “birds kike bugs” نشان می دهد:

 

نمونه ای از قانون ترکیب جلورو (6) درزیر آمده :

شکل (1) درخت اشتقاق مثال7 را نشان می دهد :

شکل (2) درخت اشتقاق همان رشته نشان می دهد با این تفاوت که type-raising و

Functional composition  استفاده نشده است .

با مقایسه این دو شکل معلوم می شود که به کمک functional composition یک رشته به صورت مرحله به مرحله تولید شده.

در اشتقاق پله ای باحرکت در طول رشته از چپ به راست هرکلمه ازرشته ، درون اشتقاق گنجانده شده به ترتیبی که هر کلمه با کلمه قبلی اش ترکیب شده وشامل تمام کلماتی است که تاکنون با آنها برخورد داشته است.

در شکل (1) فعل “like” با “bird” ترکیب شده سپس با “buge” ترکیب شده ویک رشته راتولید کرده.

یعنی عبارت اسمی با s\np   ترکیب شده سپس با دیگرعبارت اسمی  ترکیب شده و رشته مذکور را تولید کرده .

اشتقاق استفاده شده در شکل (2) به صورت پله ای نبوده برهمین اساس فعل “like” نمی تواند با “bird” ترکیب شود تا زمانیکه “like” با “buge” توسط اشتقاق جلورو ترکیب شود.

در اشتقاق شکل (1) ترکیب اسمی به دنبال فعل می آید واین در ساختار گرامرهای متعارف مستقل از متن دارای اعتبار نیست وترکیب غیر استاندارد تلقی می شود با این وجود در گرامرهای ترکیبی به صورت استاندارد هستند.

object type-raising

این یک حالت خاصی از type-raising عقب رو می باشد .

درقانون عقب رو (5) اگر s به جای T جایگزین شود و x  هم عبارت اسمی باشد آن گاه قانون زیر به دست می آید :

زمانیکه این قانون جهت ارتقاء عبارت اسمی استفاده شود منجر به اشتقاق رشته “birds like buge”شده که در شکل زیر نمایش داده شده :

اشتقاق رشته” the cat gives dogs a chase” درشکل (4) نمایش داده شده که نمونه ای از اشتقاق عقب رو می باشد

 

کاربرد گرامر ترکیبی

یکی از کاربرد های گرامر ترکیبی استفاده از آن در ترجمه متن می باشد.

یک نمونه ازقانون نحوی برای گرامرهای ترکیبی عبارتنداز:

اگر α یک عبارت از گروه B و βاز گروه (A/B) باشد آنگاه الحاق βα  متعلق به گروه Aمی باشد

CCG1 شامل اشیاء زیر می باشد:

  • شیء Tim که به صورت عبارت اسمی می باشد
  • شی ء swims     که اگر یک عبارت اسمی به سمت چپ آن الحاق شود یک جمله ساخته

می شود
ازجمله کاربردهای گرامرترکیبی استفاده از آن برای ترجمه جملات زبان طبیعی به کمک قوانین  Asp  است.

1.بیشتر پرندگان پرواز می کنند.
2. پنگوئن ها جزء پرندگان هستند.
3. پنگوئنها شنا می کنند.
4 .پنگوئن  پرواز می کنند.
5.تیمتی یک پنگوئن است.
6. تیم پرنده است.
در جملات بالا، بر اساس منطق درجه اول است اولین جمله ای به طور پیش فرض بیان می کند که پرندگان پرواز می کنند جمله دوم نشان دهنده یک رابطه است،جملات سوم و پنجم بیانیه های مختلف از خصوصیت پنگوئن هاست دو جمله آخر درمورد افراد می باشد.

یکی از رویکردهای مختلف برای توسعه ترجمه جملات زبان طبیعی استفاده از منطق مرتبه اول می باشد. برای راحتی به مجموعه جملات بالا حرف L   را انتساب می دهیم برای اینکه بدانیم این جملات چگونه می توانند توسط قوانین Asp ترجمه راانجام دهند با گرامر ترکیبی برای مجموعه L نکات زیر ذکر شده است.گرامرترکیبی برای L  شامل سه گروه اساسی زیر می باشد:

  • N  اسامی
  • NP برای عبارات اسمی
  • S برای جمله
  • NP(obj.) برای عبارت اسمی (به نمایندگی از اشیاء)

گرامرترکیبی یک رابطه دوطرفه می سازد یعنی دوگروه aوb می دهد که a/bوa\b از آن مشتق می شود.

قوانین نحوی برای گروه αβ به صورت زیر است:

الحاق راست: اگر α گروه B و β گروه (A/B) باشد آنگاه الحاق βα  متعلق به گروه Aمی باشد.

الحاق چپ :اگر α گروه B و β گروه (A\B) باشد آنگاه الحاق αβ  متعلق به گروه Aمی باشد.

هم چنین یک کلمه می تواند به چندین گروه انتساب داده شود. درجدول زیر گروه هایی برای هرکلمه در زبان L  داده شده است :

این زبان توسط گرامر ترکیبی گسترش داده شده که مجموعه جملاتی از گروه S است.جملات ذکرشده در L می تواند در گروه S نشان داده شود برای مثال مشتقات جمله “بیشترپرندگان پرواز می کنند ” درزیر انجام شده .

“بیشتر پرندگان پرواز می کنند” جزء گروه s/(s\p)  است (کاربرد قانون الحاق راست)

“بیشتر پرندگان پرواز می کنند” جزء گروه s (کاربرد قانون الحاق چپ  s/(s\p)  )

نمودار گرافیکی این اشتقاق در زیر نمایش داده شده است:

منابع

[1]  Jason M. Baldridge & Geert-Jan Kruijff,June 30,2004   “ Course Notes on Combinatory Categorial Grammar”

[2]  Jason Baldridge ICCS  and  Geert-Jan M. Kruijff , 2004  “Multi-Modal Combinatory Categorial Grammar”

 

[3]  Chita Baral and Juraj Dzifcak  and  Tran Cao Son  “Using Answer Set Programming and Lambda Calculus to Characterize Natural

Language Sentences with Normatives and Exceptions”

 

[4]  Linguistics 484 Notes: Combinatory Categorial Grammar – Introduction    “Combinatory Categorial Grammar”

 

[5]  http://fa.wikipedia.org/

 

۱۳۹۲-۸-۱۷ ۱۲:۰۵:۱۶ +۰۳:۳۰آبان ۱۷ام, ۱۳۹۲|Categories: عمومی|بدون ديدگاه

ثبت ديدگاه

پرداخت

1-پرداخت آنلاین
برای پرداخت آنلاین از لینک زیر استفاده کنید
پرداخت آنلاین
2- پرداخت آفلاین
برای پرداخت آفلاین مبلغ مورد نظر را به یکی از شماره کارت
6037997245888723بانک ملی