2-1-۳-۲-۲-۱.درختِ بل36
2-1-۳-۲-۲-۲. افراز گراف38
2-1-۳-۳. روش‏های مبتنی بر پیکره40
2-1-۳-۴. روش‏های جایگزین44
2-1-۳-۴-۱. روش هم‏آموزی44
2-1-۳-۴-۲. مدل احتمالاتی مرتبه اول46
2-1-۳-۴-۳. رتبه‏بندی47
2-1-۳-۴-۴. فیلدهای تصادفی شرطی49
2-1-۳-۴-۵. خوشه‏بندی51
2-1-۴. جمع‏بندی56
فصل 2: بخش دوم57

در این سایت فقط تکه هایی از این مطلب(به صورت کاملا تصادفی و به صورت نمونه) با شماره بندی انتهای صفحه درج می شود که ممکن است هنگام انتقال از فایل ورد به داخل سایت کلمات به هم بریزد یا شکل ها درج نشود-این مطالب صرفا برای دمو می باشد

ولی برای دانلود فایل اصلی با فرمت ورد حاوی تمامی قسمت ها با منابع کامل

اینجا کلیک کنید

2-2-۱. پیکره نشانه گذاری شده توسط اطلاعات هم‏مرجع58
2-2-۲. پیکره بیژن‏خان59
2-2-۳. پیکره لوتوس60
2-2-۴.شیوه‏های نشانه‏گذاری پیکره لوتوس62
2-2-۴-۱. نشانه‏گذاری انواع موجودیت‏ها62
2-2-۴-۱-۱. موجودیت شخص64
2-2-۴-۱-۲. موجودیت سازمان64
2-2-۴-۱-۳. موجودیت مکان66
2-2-۴-۱-۴. موجودیت سیاسی66
2-2-۴-۲.کلاس هر موجودیت68
2-2-۴-۲-۱.غیر ارجاعی69
2-2-۴-۲-۲.ارجاعی69
2-2-۴-۲-۲-۱.ارزیابی به شکل منفی69
2-2-۴-۲-۲-۲.ارجاعی خاص70
2-2-۴-۲-۲-۳.ارجاعی عمومی70
2-2-۴-۲-۲-۴.ارجاعی زیر مشخص شده70
2-2-۴-۳.انواع اشاره/سطوح اشاره71
2-2-۴-۳-۱.اشاره ساده72
2-2-۴-۳-۱-۱.محدوده اشاره72
2-2-۴-۳-۱-۲. هسته اشاره72
2-2-۴-۳-۱-۳.انواع اشاره ساده72
2-2-۴-۳-۲.ساختارهای پیچیده74
2-2-۴-4-۲-۱.ساختارهای عطف بیان یا بدل75
2-2-۵.جمع‏بندی75
فصل 3: الگوریتمهای پیشنهادی76
3-۱. رده بندی دودویی76
3-1-1.جدا کننده‏های خطی77
3-1-1-1 پرسپترون78
3-1-1-2 ماشین بردار پشتیبان80
3-1-1-3 درخت تصمیم85
3-۲.خوشه‏بندی88
3-2-1 .الگوریتم‏های افراز بسته‏ای89
3-2-1-1 .خوشه‏بندی سلسله مراتبی پایین به بالا90
3-2-1-2 .آموزش الگوریتم خوشه‏بندی سلسله مراتبی93
3-3.جمع‏بندی96
فصل 4: سیستم ارزیابی97
4-۱.مقدمه97
4-۲.سیستم شناسایی اشاره لوتوس98
4-2-1 .بانک اطلاعاتی98
4-2-2.سیستم شناسایی اشاره102
4-3.تشخیص اشاره‏های هم مرجع103
4-3-1 ویژگی‏ها104
4-3-2.الگوریتم یادگیری105
4-3-3.معیار ارزیابی107
4-3-4.نتیجه ارزیابی110
4-3-4-1.نتایج بدست آمده110
4-3-4-.2چالش‏ها و تحلیل خطا112
4-4.جمع‏بندی115
فصل 5 :نتیجه گیری و پیشنهادها116
5-۱.نتیجه‏گیری116
5-2.پیشنهادها118
فصل .6 منابع121
فهرست جدول‏هاعنوانصفحهجدول 1-۱: مقایسه ویژگی‏های دو ارتباط هم‏مرجع وپیشایند۱1
جدول 2-۱: فاکتورهای متداول برای تشخیص مرجع مشترک23
جدول 2-۲: برخی از ویژگی‏های ارائه شده در تحلیل مرجع مشترک30
جدول 2-۳: معرفی برخی از پژوهش‏هایی که از خوشه‏بندی استفاده کرده‏اند55
جدول 2-4: مشخصات مربوط به انواع موجودیت‏ها62
جدول2-5: زیر گروه‏های موجودیت مشخص64
جدول2-6: زیر گروه‏های موجودیت سازمان65
جدول 2-7: زیر گروه‏های موجودیت مکان 66
جدول 2-8: زیر گروه‏های موجودیت سیاسی67
جدول 2-9: حالت‏های خاص موجودیت‏های سیاسی68
جدول 2-10: انواع طبقه‏بندی اشاره71
جدول 4-1: بانک اطلاعاتی سیستم کشف اشاره: جدول واژگان100
جدول 4-2: بانک اطلاعاتی سیستم کشف اشاره: جدول اشاره‏ها101
جدول 4-3: فهرست ویژگی‏های به کار رفته در تشخیص مرجع مشترک106
جدول 4-4: حالت‏های ممکن نتایج یک ماشین یادگیر108
جدول 4-5: نتایج ارزیابی الگوریتم‏های پایه مورد بررسی110
جدول 4-6: نتایج ارزیابی الگوریتم SVM با هسته‏های متفاوت111
جدول 4-7: نتایج ارزیابی الگوریتم شبکه عصبی با مدل‏های متفاوت112
فهرست شکل‏هاعنوانصفحهشکل1-۱. انواع روابط ممکن میان دو عبارت اسمی 12
شکل1-۲. میزان ارتباط میان حوزه‏ها با انواع دانش‏های زبان‏شناسی و واژگانی۱6
شکل2-۱. نمونه‏ای از نمونه‏های مثبت و منفی که توسط ۴.5C تولید شده است31
شکل2-۲. درختِ بل به ازای سه عبارت اسمی 37
شکل2-3. شمایی از نشانه‏گذاری پیکره بیژن‏خان60
شکل2-4. شمایی از نشانه‏گذاری اشاره‏های هم مرجع در پیکره لوتوس62
شکل3-۱. شمایی از داده‏های خطی و غیر خطی جدایی‏پذیر77
شکل3-۲. الگوریتم پرسپترون میانگین‏دار80
شکل3-3. نمونه‏ای از یک درخت تصمیم‏گیری86
شکل3-4.الگوریتم C5 88
شکل3-5. مثالی از نمودار دندوگرام در تشخیص عبارت‏های اسمی هم‏مرجع92
شکل3-6. الگوریتم خوشه‏بندی سلسله مراتبی پایین به بالا 93
شکل3-7.الگوریتم آموزش خوشه‏بندی حریصانه 94
شکل3-8.الگوریتم بروزرسانی 96
شکل4-1 :شمای کلی از جداول این بانک اطلاعاتی لوتوس99
شکل4-2 :شمای کلی سیستم شناسایی اشاره102
شکل4-3 :شمایی از نمایش خروجی سیستم نمایش اشاره102
شکل4-4: شمایی از نمایش خروجی سیستم نمایش واژگان103
شکل4-5: شمایی از نمایش خروجی تعیین نمونه‏های مثبت و منفی107
شکل4-6: نمودار مقایسه الگوریتم‏های پایه مورد بررسی111

فهرست علائم و اختصارات
ACEAutomatic Content Extraction ADRAddress Sub Entity AIArtificial IntelligenceANAAnaphorANTAntecedentAPPApposition Construction mention type ARAnaphora Resolution BARBare Sub Entity BNDBoundary Sub Entity CLSCelestial Sub Entity CLUSCluster Sub Entity COMCommercial Sub Entity CONTContinent Sub Entity CRCoreference ResolutionDISDistrict Sub Entity EDUEducational Sub Entity EMExpectation Maximization ENTEntertainment Sub Entity GENGeneral Entity classGOVGovernment Sub Entity GRGroup Sub Entity HLSHeadless nominal mention type IEInformation ExtractionINDIndividual Sub Entity IRInformation RetrievalJPEGeo political Entity LOCLocation Entity MDMention Detection MEDMedia Sub Entity MLMachine Learning MTMachine Translation MUCMessage Understanding NAMName mention NAMMHName which is head of mention NAMPOSPost modifier mention of name head NATNation Sub Entity NEGNegative Quantified Entity classNERNamed Entity RecognitionNGOVNon-government Sub Entity NOMHNominal which is head of mentionNOMHNominal mention NOMPOSPost modifier mention of nominal head NPNoun phraseORGOrganization Entity PERPersons Sub Entity POPPopulation Sub Entity PROPronominal mention PTVPortative Construction mention type RBFNRadial Basis Function NetworkREFRefential Entity classREGRegion Sub Entity RELReligious Sub Entity SPCSpecific Entity class SPESpecial Sub Entity SPOSport Sub Entity STATstate Sub Entity SVMSupport Vector MachineTLTTitle Sub Entity USPUnderspecified referential Entity class WATWater body Sub Entity WHOWH_Question Words and specific mention type
فصل اول
۱-۱.مقدمه و بیان مسئله
امروزه رایانه در تمام لایه‏های زندگی بشر نفوذ کرده است. بطوریکه استفاده از فناوری رایانه در حوزه زبان‏شناسی، بیش از پیش احساس می‏شود. «پردازش زبان طبیعی1»شاخه‏ای از علم «هوش مصنوعی2» است که به ماشینی کردن فرآیند زبان شناسی سنتی می‏پردازد. به این ترتیب با استفاده از رایانه می‏توان «زبان گفتاری ونوشتاری» را پردازش نمود، به طوریکه رایانه‏ها نیز قادر باشند زبان انسان را درک کرده و بتوانند از زبان طبیعی به عنوان ورودی وخروجی استفاده کند. به این ترتیب یک رایانه، درهنگام دریافت ورودی، نیاز به «درک» و درهنگام ارسال خروجی، نیاز به «تولید» زبان طبیعی دارد. ]81[
در زمینه پردازش زبان طبیعی پژوهش‏هایی مانند طبقه‏بندی متون3، برچسب‏گذاری ادات سخن4، تعیین و ابهام‏زدایی از معانی واژگان5 و… انجام شده است که تنها بر روی یک حوزه خاص تمرکز داشته‏اند و در نتیجه راه حل‏هایی جزئی در راستای اهداف کلی پردازش زبان طبیعی محسوب می‏‏‏شوند. تمامی این حوزه‏های جزئی باید حل شوند تا در نهایت رایانه بتواند همانند انسان واژگان و جملات را پردازش کرده و یا آنها را بسازد.
وظایف زبان طبیعی را می‏توان به ریز کاربردها6 و کلان کاربردها7 افراز نمود. به طور کلی تا کنون تحقیقات انجام شده بیشتر بر روی پردازش‏هایی در سطح واژه و یا جمله (مانند برچسب گذاری ادات سخن، ابهام زدائی از مفهوم واژگان، شناسایی موجودیت‏های نامدار8 و … ) و یا در سطح کل متن (تشخیص هرزنامه9، رده بندی متون و…) متمرکز شده اند؛ برخی از کاربرد‏ها نیز مانند استخراج اطلاعات10، تشخیص مرجع مشترک11 و ماشین ترجمه12 در سطح بینابین قرار گرفته‏اند. ]27[بدیهی است که در توسعه یک کاربرد سطح بالاتر همانند تعیین ویژگی‏های معنایی متون، انواع متفاوتی از ویژگی‏های سطح پایین‏تر (مانند ویژگی‏های لغوی13 و نحوی14) نیز لازم است، اما به لطف سیستم‏های جدید که تا حد زیادی به روش‏های آماری یادگیری ماشین بستگی دارند، دیگر در آنها، به تمامی‏‏‏ ویژگی‏های سطح پایین‏تر نیازی نیست. علت اینکه روش‏های یادگیری ماشین توانسته‏اند با وجود سادگی، به موفقیت قابل توجهی دست یابند این است که اطلاعات آماری پایه، دانشی را فراهم می‏آورد که برای بسیاری از کاربرد‏ها کافی بوده و می‏‏‏‏تواند به کارائی قابل توجهی منجر شود. با این وجود، باید توجه داشت که روش‏های آماری محدود است و هرگز نمی‏توانند درک کاملی از محتوای معانی یک متن را فراهم آورند.
از طرفی دیگر، با فراهم شدن اطلاعات و قدرت محاسباتی بیشتر، سیستم‏‏هایی که واژگان و جملات درست را از غلط تشخیص می‏دهند، به طور گسترده‏ای در حال توسعه هستند. به عنوان مثال، در زبان انگلیسی برچسب گذاری ادات سخن به صحتی برابر با ۹۸%، شیوه‏های تجزیه کردن15 به صحتی برابر با ۹۰%، و شناسایی موجودیت‏های نامدار به صحت ۹۱% رسیده اند. [78,55,38[.
بسیاری از پژوهشگران معتقدند که استخراج اطلاعات به عنوان یکی از مهمترین کاربردهای پردازش زبان طبیعی محسوب می‏شود، که مجموعه‏ای از تکنیک‏های رده‏بندی16، خوشه‏بندی17 و قوانین وابستگی18 است و خروجی استخراج اطلاعات شامل، شناسایی موجودیت‏ها19 ، تعیین نوع وگروه آنها، طبقه بندی ارتباط میان موجودیت‏ها و همچنین استخراج رویدادهایی که در آن مشارکت دارند، می‏باشد.[71[ در نهایت می‏توان گفت که خلاصه سازی، بازیابی اطلاعات20، داده‏کاوی21، پرسش و پاسخ22 و درک زبان23 از جمله کاربردهای این سیستم هستند.
تمرکز اصلی این پژوهش بررسی فرآیند تشخیص مرجع مشترک به عنوان یکی از فرآیندهای مهم استخراج اطلاعات است؛ در تشخیص مرجع مشترک تمام عبارت‏های اسمی‏‏‏ که به یک موجودیت واحد در دنیای واقعی اشاره دارند، تعیین می‏گردند. هدف نهایی این پایان‏نامه شناسایی اشاره‏های هم مرجع شامل ضمیر و اسم اشاره در متون پارسی می‏باشد. برای تحقق این هدف نیاز به انجام پیش پردازش‏هایی بر روی متون خام می‏باشد تا داده‏های مورد نیاز برای ورود به فرآیند تحلیل مرجع مشترک فراهم شوند. فرض ما بر این است که خروجی حاصل از فرآیند کشف اشاره24 به عنوان یک پیش پردازش می‏تواند در کنار سایر پیمانه‏های پیش پردازشی مانند تجزیه‏گر، شناسایی موجودیت‏های نامدار و… بر بهبود عملکرد تحلیل مرجع مشترک موثر واقع شود. [23،38،53،83]
به هر ترتیب شناسایی عبارت‏های اسمی‏‏‏ هم‏مرجع از مهمترین زیر وظایف استخراج اطلاعات می‏باشند که بهبود عملکرد آن موجب بهبود عملکرد کلی سیستم استخراج اطلاعات و سایر سیستم‏های مرتبط با آن خواهد شد.
واحد مورد بررسی در حوزه تشخیص مرجع مشترک، متن می باشد که پس از اجرای ماژول‏هایی متفاوت، متن مورد نظر به عبارت های اسمی یا به عبارت بهتر به اشاره تبدیل می‏شود. روش‏های موجود در این حوزه، به دو دسته روش‏های زبان‏شناسی25 و روش‏های یادگیری ماشین26 تقسیم می‏‏‏شوند. [76[ در روش اول، ابتدا به ازای هر عبارت اسمی‏‏، مراجع کاندیدا تعیین می‏‏‏شود و سپس با به کارگیری مجموعه‏ای از قواعد زبان‏شناسی، برخی از کاندیداها حذف شده و کاندیداهای باقیمانده نیز امتیازدهی می‏‏‏شوند و در‏نهایت کاندیدایی به عنوان مرجع برگزیده می‏‏‏شود که بیشترین امتیاز را کسب کرده باشد. مسئله اصلی در این روش این است که کسب اطلاعات زبان‏شناسی مورد نیاز، فرآیندی زمان‏بر، پرهزینه و پر خطاست. البته با پیدایش پیکره‏های27 زبان‏شناسی و موفقیت روش‏های یادگیری ماشین در سایر حوزه‏ها، روش‏های زبان‏شناسی جای خود را به روش‏های یادگیری ماشین دادند. در یادگیری ماشین، به محاسبات زبان‏شناسی پیچیده و سطح بالای روش‏های زبان‏شناسی نیاز نیست به طوریکه با استفاده از دانش اندکی در زمینه زبان‏شناسی نیز می‏توان به نتایج خوب و قابل توجهی دست یافت.
از سوی دیگر، امروزه اغلب پژوهشگران فرآیند تشخیص مرجع مشترک را به دو مرحله تقسیم می‏‏‏ کنند. (۱) کشف و شناسایی اشاره؛ برای شناسایی عبارت‏های اسمی‏‏‏ که به موجودیت28 ها در دنیای واقعی اشاره دارند، (۲) شناسائی اشاره‏هایی که به یک مرجع واحد اشاره دارند. به این ترتیب در مرحله اول، اکثر عبارت‏های اسمی‏‏‏ تحت عنوان اشاره29 و در قالب چهار گروه اصلی ضمایر30، اسامی‏‏‏ خاص31، اسامی‏‏‏ عام32 و غیر اشاره‏ها33 قرار می‏گیرند،[8،910،16،48،53،72] سپس این فرآیند مشخص می‏‏‏‌کند که هر اشاره به کدام موجودیت در دنیای واقعی اختصاص دار[26]می‏‏‏توان گفت که فرآیند کشف اشاره، توسعه یافته‏ی فرآیند شناسایی موجودیت‏های نامدار می‏باشد که علاوه بر شناسایی اسامی‏‏‏ خاص، به شناسایی اسامی‏‏‏ عام و ضمایر نیز می‏پردازد. [،23،72،81،113،114]از آنجائیکه بررسی فرآیند‏های شناسایی اشاره و تحلیل مرجع مشترک به طور همزمان خارج از حوزه‏ی این پایان‏نامه است، ما عبارت‏های اسمی‏‏‏ را در قالب انواع اشاره‏های گفته شده در پیکره‏ای تحت عنوان لوتوس برچسب‏گذاری می‏نمائیم و نتیجه‏ی آن را برای تحلیل مرجع مشترک به کار خواهیم برد.
چارچوب کلی این پایان‏نامه به این صورت می‏باشد: در بخش دوم این فصل گذری کوتاه بر انواع روابط میان دو عبارت اسمی‏‏‏ و به خصوص ارتباط‏های هم‏مرجعی خواهیم داشت. سپس در بخش اول فصل دوم، روش‏های ارائه شده برای تشخیص مرجع مشترک را مورد بررسی و مطالعه قرار می‏دهیم و در بخش دوم آن، به نحوه ایجاد پیکره‏ای مناسب برای کشف اشاره و تحلیل مرجع مشترک خواهیم پرداخت. در فصل سوم، به الگوریتم‏های مناسب برای این پایان‏نامه را معرفی می نمائیم. سیستم پیشهنادی برای شناسایی اشاره‏های ارجاع شده در فصل چهارم معرفی خواهد شد و همچنین در این فصل الگوریتم‏های یادشده را مورد ارزیابی قرار می‏دهیم. در نهایت در فصل پنجم نیز به نتیجه گیری و پیشنهاد کارهای آتی در ادامه‏ی این پژوهش خواهیم پرداخت.
1-2.بررسی ارتباط هم‏مرجعی
یکی از ‏ویژگی‏های خاص گفتمان این است که می‏توان در یک متن آزادانه در مورد یک یا چند موجودیت صحبت کرد و برای اشاره به هر موجودیت از انواع مختلف عبارت‏ها مانند ضمیر (او)، اسم عام (دانشمند)، اسم خاص (لطفعلی عسگر زاده) و یا یک عبارت اسمی‏(بنیان‏گذار منطق فازی) بهره برد تا به این ترتیب از تکرار عبارت‏ها کاسته و شیوایی مطلب نیز افزایش یابد. همین ویژگی موجب می‏شود که زنجیره‏ها‏ی بالقوه‏ای از تمام عبارت‏های اسمی‏که به یک موجودیت واحد در متن ارجاع دارند، ایجاد گردد. (مانند: او، دانشمند، لطفعلی عسگر زاده، بنیان‏گذار منطق فازی که به شخص پرفسور زاده اشاره دارند).
یکی از اهداف مهم استخراج اطلاعات، شناسایی این زنجیره‏ها در متن است که در فرآیند تحلیل مرجع‏مشترک انجام می‏پذیرد. برای شروع، مثال ۱ را در نظر بگیرید34:
مثال۱: (سیستم آبیاری گلاب) ۱Ant, در روز سه شنبه رونمایی شد. (این سیستم)۱Ana, محصول اندیشه‏ی (دکتر سارا شکری)۲Ant, است. (او) Ana,2، ( یک پژوهشگر)Ana در (شرکت آبیاری لاله)۳ است.
اگر فرض کنیم که پیمانه‏های نشانه‏گذاری تا کشف اشاره به عنوان پیش پردازش‏هایی بر روی متن اجرا شوند، با اجرای این پیمانه‏ها، انواع عبارت‏های اسمی‏موجود در متن (سیستم آبیاری، این سیستم، دکتر سارا شکری، او، یک پژوهشگر و شرکت آبیاری لاله) تعیین و نشانه‏گذاری می‏شوند. سپس با اجرای پیمانه تشخیص مرجع‏مشترک، ارتباطات میان این عبارت‏ها و اطلاعات نهفته در مورد موجودیت‏های شرکت کننده در متن آشکار می‏شود. به عنوان نمونه، می‏دانیم «او» و «سارا شکری» (با اندیسِ۲) به یک فرد مشخص و همچنین «سیستم آبیاری گلاب» و «این سیستم» (با اندیسِ۱) نیز به یک سیستم مشخص اشاره می‏کنند.
استفاده از اصطلاح موجودیت در تحلیل مرجع‏مشترک، این سؤال را مطرح می‏کند که چه چیزهایی موجودیت محسوب می‏شوند؟ تاکنون گروه‏بندی‏های متعددی برای انواع موجودیت‏ها ارائه شده است، به عنوان نمونه35ACE، یک تقسیم بندی هفت موجودیتی برای انواع موجودیت‏ها (شخص، سازمان، مکان، سیاسی، تسهیلات، سلاح و خودرو) و تعداد زیادی زیرگروه (به عنوان مثال شخص: فرد، گروه) و کلاس برای هر موجودیت پیشنهاد کرده است و[۶۴] که اغلب پژوهشگران همه این موجودیت‏ها و یا گاهی اوقات برخی از آن‏ها را مورد مطالعه و بررسی قرار می‏دهند.
یکی از ‏ویژگی‏های تحلیل مرجع‏مشترک این است که علاوه بر انواع موجودیت‏های رایج، می‏توانیم در حوزه‏ها‏ی متفاوت از تعاریف پیش فرض خود نیز برای موجودیت‏ها نیز استفاده نماییم. همین ویژگی موجب شده است تا برخی از پژوهشگران مانند[97] به تحلیل مرجع‏مشترک در متون پزشکی پرداخته و بررسی موجودیت‏هایی مانند انواع دارو، بیماری، ژن وغیره را هدف پژوهش خود قرار دهند.
با توجه به آنچه تا‏کنون گفته شد، انتظار می‏رود که با بررسی مراجع مشترک در مثال ۱، عبارت «یک پژوهشگر» نیز به همراه «او» و «سارا شکری» در یک زنجیره واحد قرار گیرد، اما خروجی پیمانه تحلیل مرجع‏مشترک چنین نیست. هر چند از نظر ما این ارتباط کاملاً بدیهی است اما واقعیت این است که عبارت «یک پژوهشگر» به عنوان ارجاع به موجودیت شخص (در مثال ۱: سارا شکری) که در دنیای واقعی زندگی می‏کند در نظر گرفته نمی‏شود، چون منظور از «یک پژوهشگر» می‏تواند هر شخص دیگری نیز باشد. در این حالت فرآیند دیگری تحت عنوان تحلیل پیشایند می‏تواند ارتباط میان «یک پژوهشگر» و «سارا شکری» را تشخیص دهد.
همان طور که مشاهده شد، تحلیل مرجع‏مشترک و تحلیل پیشایند دو مفهوم نزدیک به هم می‏باشند به طوری که عموماً به موازات تحلیل مرجع‏مشترک، با تحلیل پیشایند روبرو می‏شویم و حتی برخی به اشتباه این دو عبارت را معادل یکدیگر می‏پندارند. با وجود اینکه این دو پیمانه از بسیاری از جهات با یکدیگر مشابه هستند، اما از جهاتی نیز با یکدیگر تفاوت دارند، و عدم توجه به این مسئله موجب سردرگمی‏و ایجاد ابهام در تحلیل متن می‏گردد.در این بخش، هدف ما بررسی هرکدام از این فرآیند‏ها‏ و مطالعه برخی از شباهت‏ها‏ و تفاوت‏ها‏ی میان این دو فرآیند می‏باشد.

شما می توانید تکه های دیگری از این مطلب را با جستجو در همین سایت بخوانید

1-۲-۱.هم‏مرجع در مقابل پیشایند
برای اینکه بخواهیم یک سیستم تحلیل مرجع‏مشترک و یا یک سیستم تحلیل پیشایند را انتخاب کنیم لازم است ابتدا دو پدیده زبان‏شناسی پیشایند36 و هم‏مرجع37 را به خوبی بشناسیم. شباهت‏ها و تفاوت‏های میان آن‏ها را درک کنیم. همان طور که پیش‏تر نیز اشاره شد، اغلب دو عبارت پیشایند و هم‏مرجع را به عنوان دو عبارت نزدیک یا گاهاً مترادف می‏شناسند به طوری که در بسیاری از پژوهش‏ها این دو اصطلاح را به جای هم استفاده می‏کنند[59،85،90]
نخستین بار ارتباط میان عبارت‏های اسمی‏توسط کلرک38 در سال ۱۹۷۵ مطرح شد که آن‏را تحت عنوان پل‏زنی پیشایند مطرح می‏کرد. [43] پس از آن هیرست39 در سال ۱۹۸۱، عبارت پیشایند را بیشتر به منظور تفسیر مخفف‏ها در متن به کار برد. هیرست معتقد بود پیشایند یک ابزار ساخت، در گفتمان است که با استفاده از آن یک مخفف به یک یا چند عبارت غیر مخفف که پیش از آن در متن آمده‏اند، اشاره می‏کند تا به این ترتیب با استفاده از عبارت‏های پیشین، عبارت مخفف تفسیر شود. مفهوم پیشایند با یک جفت عبارت همراه است که عموماً عبارت ارجاع‏دهنده را با عنوان «تالی40» و عبارت مفسر را با عنوان «مقدم41» یا «مرجع» می‏شناسیم. هیرست این دو عبارت ارجاع دهنده و مرجع را با هم «هم‏ارجاع42 » و فرآیند شناسایی یک مقدم برای یک تالی، را «تحلیل43» می‏نامد.[ 34]
در سال 1998 نیز هیرسکمن44 و چینکور45 اصطلاح هم‏مرجع را کنفرانس تشخیص پیام46 یا به اختصار MUC استفاده کردند[24،59] آنها و بسیاری از پژوهشگران دیگر، زمانی دو عبارت را با یکدیگر هم‏مرجع در نظر می‏گیرند که هر دو عبارت دقیقاً به یک موجودیت در دنیای واقعی اشاره داشته باشند. البته این پژوهشگران تفاوتی میان دو رابطه‏ی هم‏مرجعی و پیشایندی در نظر نگرفته بودند، تا اینکه این مسئله با انتقاد ون47 و کیبل48 مواجه شد به طوری که آن‏ها این دو اصطلاح را از دیدگاهی دیگر مورد بررسی قرار دادند و برخی از نقاط مشترک و تفاوت های آنها را مطرح نمودند.[۵۸]
1-۲-۱-۱.ارتباط هم‏مرجع:
ارتباط میان دو عبارت اسمی‏مانند ۱a و ۲a زمانی به عنوان ارتباط هم‏مرجع در نظر گرفته می‏شود که هر دو عبارت اسمی‏ به عنوان ارجاع‏هایی مشخص، یک موجودیت فرا زبان‏شناسی واحد را تفسیر نمایند. به واسطه‏ی این تعریف نیاز است تا به طور جداگانه مرجع هرکدام از عبارت اسمی‏Reference(ai) شناسایی شود. در نهایت یک ارتباط هم‏مرجعی به صورت ذیل خواهد بود :
(۱) عبارات اسمی‏۱a و ۲a با یکدیگر هم‏مرجع هستند اگر و تنها اگر Reference(a1)= Reference(a2) باشد.
مثال ۲: (باراک اوباما)۱Ant,، به سوریه سفر کرد. (او) ۱Ana, گفت…
جدول 1-۱: مقایسه ویژگی‏ها‏ی دو ارتباط هم‏مرجع و پیشایندهم‏مرجعیپیشایندی۱) یک رابطه هم‏مرجعی یک رابطه‏ی هم ارزی است به عنوان نمونه «او» و «باراک اوباما» هر دو به یک موجودیت اشاره دارند.۱)یک رابطه‏ی پیشایندی، متقارن نیست. به این معنا که اگر ۱a به عنوان مقدم برای 2a در نظر گرفته شود عبارت اسمی‏۲ a نمی‏تواند متقابلاً نقش مقدم را برای عبارت اسمی‏۱a ایفا نماید.
۲)رابطه هم‏مرجعی یک رابطه‏ی متقارن است، به این معنا که اگر «او» با «باراک اوباما» هم‏مرجع است «اوباما» نیز با «او» هم‏مرجع می‏باشد.۳)ارتباط میان عبارت‏های اسمی‏هم‏مرجع، متعدی است به این معنا که اگر «او» با «باراک اوباما» هم‏مرجع است و «او» نیز با «رئیس جمهور آمریکا» هم‏مرجع باشد بنابراین حتماً «باراک اوباما» نیز با «رئیس جمهور آمریکا» هم‏مرجع می‏باشد.۲)رابطه‏ی پیشایندی یک جفت از عبارت‏های اسمی‏را در نظر می‏گیرد به طوری که در این رابطه‏یک عبارت نقش مفسر و دیگری نقش ارجاع دهنده را دارند. بنابراین به طور ذاتی این رابطه غیرمتعدی می‏باشد. ۴) یک ارتباط هم‏مرجعی یک ارتباط فرا متنی است به این معنا که تفسیر هیچ کدام از عبارت‏های اسمی‏هم‏مرجع به محتوای متن وابسته نمی‏باشد. به عبارت دیگر، دو عبارت هم‏مرجع لزوماً برای تفسیر به یکدیگر وابسته نیستند.۳)این رابطه به محتوای متن حساس است به این دلیل که تالی یا عبارت ارجاع‏دهنده برای اینکه مفهوم باشد نیاز به مفسر یا تفسیر دارد.۵)یک رابطه‏ی هم‏مرجعی خالص می‏تواند در تحلیل مرجع‏مشترک در متون متقاطع به کار رود.۴)معمولاً تالی یا عبارت ارجاع‏دهنده در یک رابطه‏ی پیشایندی، به دیگر اجزای تشکیل‏دهنده در همان جمله و یا نزدیک‏ترین اظهارات ممکن در گفتمان اشاره دارد.۶) برخی از عبارت‏های اسمی‏ذاتاً با یکدیگر هم‏مرجع هستند به عنوان مثال «پرفسور زاده» و «بنیان گذار منطق فازی»، این دو عبارت هر کجا که باشند به یک موجودیت به نام «پرفسور زاده» اشاره خواند داشت. به عبارت دیگر چنین ارتباطی یک ارتباط هم‏مرجعی خالص نامیده می‏شود۵) یک تالی تنها نیاز به یک مفسر دارد تا آن‏را تفسیر نماید بنابراین اگر چندین مفسر برای آن در متن وجود داشته باشد مناسب‏ترین و نزدیک‏ترین آن‏ها انتخاب خواهد شد.۷)بیشتر برای استخراج اطلاعات در خصوص یک یا چند موجودیت در متن به کار می‏رود.۶) به درک بهتر متن و رفع ابهام برخی از واژگان در متن کمک می‏کند.1-۲-۱-۲.ارتباط پیشایندی:
یک ارتباط پیشایندی49، از یک جفت عبارت اسمی‏(۱aو۲a) تشکیل می‏شود به طوری که عبارت اول نقش مفسر را برای عبارت دوم ایفا نماید. بنابراین یک ارتباط پیشایندی به صورت ذیل تعریف می‏شود:
(2)عبارت اسمی‏اول(۱a) به عنوان مقدم برای عبارت اسمی‏دوم (۲a) در نظر گرفته می‏شود اگر و تنها اگر ۲a برای تفسیرش به ۱a وابسته باشد
مثال ۳: هنگامی‏که پسر وارد (اتاق)Ant شد، (درب)Ana به طور خودکار بسته شد.
همان‏طور که در مثال۳ مشاهده می‏شود، دو عبارت اسمی‏فوق با یکدیگر هم‏مرجع نمی‏باشند اما دارای یک مرجع گفتاری مشابه هستند یا به تعبیر [۶2] با یکدیگر هم‏واژگان50 هستند. در این مثال، عبارت اسمی‏«درب» به عبارت اسمی‏«اتاق» وابستگی دارد (به عبارت بهتر، منظور از «درب»، دربِ اتاق ذکر شده است نه دربِ ساختمان یا دربِ خودرو یا هر دربِ دیگری)
در جدول1-۱ برخی از ‏ویژگی‏های هر کدام از روابط پیشایندی و هم‏مرجعی را قرار داده‏ایم. توجه به این ویژگی‏ها به درک بهتر نقاط تشابه و اختلاف این دو رابطه کمک فراوانی می‏نماید.
همچنین باید اضافه کنیم که دو عبارت اسمی ‏می‏توانند به طور هم‏زمان هم رابطه‏ی هم‏مرجعی و هم رابطه‏ی پیشایندی داشته باشند. البته این بدین معنا نیست که هرگاه دو عبارت اسمی ‏با یکدیگر هم‏مرجع باشند، با یکدیگر ارتباط پیشایندی نیز داشته باشند و یا بالعکس.
شکل 1-۱: انواع روابط ممکن میان دو عبارت اسمیشکل 1-۱، ارتباط میان دو عبارت اسمی ‏را با در نظر گرفتن چند حوزه مشخص نمایش می‏دهد. ما این حوزه‏ها را با توجه به مفاهیم هم‏مرجعی و پیشایندی تفسیر خواهیم نمود. دو عبارت اسمی‏در صورتی که با یکدیگر مرتبط باشند، می‏توانند هم دارای ارتباط هم‏مرجعی و هم دارای ارتباط پیشایندی باشند. مانند آنچه در مثال۴ آمده است.
مثال ۴: (علی کریمی)Ant,1 در نیمه دوم، ۲ گل به ثمر رساند. به طوری که به عنوان (محبوب‏ترین بازیکن پرسپولیس)Ana.1 در این بازی تشویق شد.
در میان عبارت‏های اسمی‏ای که دارای چنین ارتباط دو‏جانبه‏ای هستند می‏توان به برخی از ضمایر و مراجع آن‏ها نیز اشاره کرد. البته مثال‏های ۵ و ۶ نشان می‏دهند که همه ضمایر و مراجعشان در این رابطه صادق نیستند.
مثال ۵: )هر سگیAnt( زندگی )خودشAna( را دارد.
مثال ۶: اگر (یک خانه)Ant داشتم (آن)Ana را به تو اجاره می‌دادم.
در مثال ۵، ارتباط میان «هر سگی» و «خودش» یک ارتباط پیشایندی از نوع «ارتباط دهنده51» یا «با‏هم‏آیی» می‏باشد؛ و یا در مثال ۶، «یک خانه» در دنیای واقعی وجود خارجی ندارد. بنابراین طبق تعریفِ ارتباطِ هم‏مرجعی، «یک خانه» نمی‏تواند به عنوان هم‏مرجع برای «آن» در نظر گرفته‏شود.[76] همان طور که در شکل 1-۱ مشاهده می‏شود، عبارت‏های اسمی‏که از نوع پیشایندی هستند اما ارتباط هم‏مرجعی ندارند در حوزه پیشایند‏های «ارتباط‏دهنده» قرار می‏گیرند [80،87] اغلب پژوهشگران این نوع پیشایند را زمانی به کار می‏برند که در جفت عبارت (مقدم و تالی)، عبارت مقدم به وضوح در متن ظاهر نشده باشد و با استفاده از برخی از موجودیت‏هایی که قبلاً در متن اشاره شده است می‏توان وجود آن‏ها را اثبات کرد. مثال ۳، یک نمونه مناسب برای این نوع از پیشایندها می‏باشد. در این مثال ارتباط میان دو عبارت «درب» و «اتاق» از نوع مرونیمیک52 است به این معنا که «درب» جزئی از «اتاق» محسوب می‏شود.53
یکی دیگر از انواع ارتباط پیشایندی، پیشایند صفر54 است. مثال ۷ نمونه‏ای از این ارتباط را نشان می‏دهد.
مثال ۷: (دو جاده به سمت اصفهان)Ant می‏رود، (یکی اتوبانی و سریع)Gap1 و (دیگری خاکی و خطرناک)Gap2 است.
در حقیقت پیشایندهای صفر، یکی از انواع پیشایندهای کاهش یافته می‏باشند به این ترتیب که لزوماً به صورت عبارت‏های اسمی‏ نیستند بلکه به صورت یک شکاف در یک عبارت ظاهر می‏شوند.[35] در مثال۷ منظور از «اتوبانی و سریع» و «خاکی و خطرناک»، دو جاده‏ای است که به سمت اصفهان می‏روند. هدف از تحلیل پیشایندهای صفر، شناسایی چنین روابطی است.
یکی از حالتهای ارتباط پیشایند صفر، ضمایر صفر55 می‏باشد که تحلیل آن در برخی زبان‏ها مانند ژاپنی[92]، اسپانیایی[62] و حتی پارسی بسیار حیاتی است. در این نوع از پیشایندها، یکی از ارکان در جفت(مقدم،تالی) حذف می‏شود. نمونهای از این نوع پیشایند، مثال ۶ می‏باشد که منظور از گوینده چنین است: «اگر من یک خانه داشتم آن‏را به تو اجاره می‏دادم».
در نهایت دو عبارت اسمی‏می‏توانند تنها از نوع هم‏مرجع خالص56باشند. ما این ارتباط را با مثال «پرفسور زاده»، «پدر منطق فازی» و «بنیان‏گذار منطق فازی» تفسیر می‏نماییم. همان طور که می‎دانید هر سه عبارت مذکور به شخص«پروفسور لطفعلی عسگر‏زاده» اشاره دارند اما اگر عبارت اسمی‏اول، یعنی «پرفسور زاده» در متن عنوان نشود، باز هم می‏دانیم که عبارت‏های اسمی‏ «پدر منطق فازی» و «بنیان‏گذار منطق فازی» با یکدیگر هم‏مرجع هستند. نمونه‏ی دیگری از یک ارتباط هم‏مرجعِ خالص، ارجاع انواع عبارت‏های اسمی‏به «باراک اوباما»، در پاراگراف‏ها، مکالمات با حتی متون متمایز است. اغلب نمونه‏هایی از روابط هم‏مرجع خالص در مستندات متقاطع مشاهده می‏شود. با تکیه بر این مفهوم برخی از پژوهشگران مانند [88] به تحلیل مرجع‏مشترک در متون متقاطع پرداخته‏اند.
نکته‏ی دیگر اینکه، در همه پژوهش‏هایی که برای شناسایی مرجع ضمیر در زبان‏هایی مانند انگلیسی انجام شده است، همیشه مرجع ضمیر پیش از ضمیر قرار می‏گیرد. اما در زبان پارسی این امکان وجود دارد که مرجع یک ضمیر پس از آن قرار گیرد. مثال ۸ ، نمونه‏ای از زبان پارسی می‏باشد که این مسئله را نشان می‏دهد.
مثال ۸: سی.ان.ان به آمریکا و جهان چنان شوکی وارد کرد که حتی (خود)Ana,1( ترنر)Ant,1 نیز آن‏را باور نمی‏کرد.
بطورکلی، آنچه مبرهن است برای شناسایی و بررسی هر کدام از روابط پیشایندی و یا هم‏مرجعی، نیاز به دانش‏های واژگانی و زبان‏شناسی در زبان مورد نظر می‏باشد. به طوری که هر چقدر یک رابطه هم‏مرجعی بیشتر پیشایندی باشد به دانش زبان‏شناسی بیشتری نیاز دارد. در همین راستا، شکل 1-۲، میزان ارتباط میان حوزه‏ها‏ی گفته شده را با هر کدام از انواع دانش‏های زبان‏شناسی و واژگانی نمایش می‏دهد.
شکل 1-۲: میزان ارتباط میان حوزه‏ها‏ با انواع دانش‏های زبان‏شناسی و واژگانی1-۲-۲.تحلیل پیشایند:
یکی از وظایف مهم پردازش زبان طبیعی است که موجب کاهش ابهام عبارت‏های اسمی‏ به کار رفته در متن می‏شود. به طور کلی این فرآیند وابستگی و پیوند میان دو عبارت تالی و مقدم را به گونه‏ای تشخیص می‏دهد که عبارت مقدم، عبارت تالی را تفسیر نماید.
1-۲-۳.تحلیل مرجع‏مشترک:
با توجه به آنچه گفته شد، تحلیل مرجع‏مشترک، به فرآیند مرتبط کردن تمام عبارت‏هایی گفته می‏شود که به یک موجودیت واحد در دنیای واقعی اشاره دارند. این عبارت‏های اسمی‏هم‏مرجع، با هم تشکیل یک زنجیره واحد را می‏دهند که شامل ضمایر صفر تا اسامی‏خاص خواهد بود. تمام اعضای تشکیل دهنده‏ی این زنجیره باید از نظر تعداد، جنس و… با یکدیگر هم تراز باشند.
1-۲-۴.تقابل تحلیل مرجع‏مشترک و تحلیل پیشایندی:
با توجه به آنچه تا کنون درباره دو مفهوم تحلیل مرجع‏مشترک و تحلیل پیشایند گفته شد، این دو وظیفه با وجود شباهت زیادی که با یکدیگر دارند، دو وظیفه مجزا محسوب می‏شوند. بدین‏ترتیب که با به کارگیری فرآیند تحلیل مرجع‏مشترک، سیستم می‏تواند تمام اطلاعاتی که در مورد یک موجودیت در متن وجود دارد را شناسایی نماید. از طرفی دیگر تفسیر درست پیشایندها در متون به رفع ابهامات موجود در متن می‏انجامد؛ لذا استفاده از این دو وظیفه با در نظر گرفتن حوزه‏ها‏ی تشابه و اختلاف آن‏ها به درک و استخراج اطلاعات مفید در متن کمک فراوانی خواهد نمود. در این بخش با استفاده از مثال‏هایی لزوم اجرای این دو فرآیند را در کنار یکدیگر بررسی می‏کنیم.
پس از شناخت فرآیندهای تحلیل مرجع‏مشترک و تحلیل پیشایند و اینکه یک سیستم چه انتظاراتی را باید برآورده نماید، لازم است تا روال کار را برای اجرای هر فرآیند را مشخص نماییم. استفاده از الگوریتم‏های یادگیری، از پرکاربردترین روش‏های ارائه شده برای شناسایی روابط مثبت و منفی در مرجع‏مشترک و پیشایند می‏باشد. به این ترتیب که الگوریتم با استفاده از برخی ویژگی‏ها (مانند [105]( آموزش می‏بیند تا روابط مثبت و منفی را پیش‏بینی نماید57. البته شایان ذکر است که برخی از ویژگی‏ها برای این دو فرآیند مشترک و برخی دیگر متفاوت می‏باشد. به عنوان مثال ویژگی تطابق رشته‏ای58 از جمله مواردی است که برای تحلیل مرجع‏مشترک بسیار مورد توجه قرار گرفته است اما در فرآیند تحلیل پیشایند کاملاً بی معنا است( دو عبارت یکسان چگونه می‏توانند یکدیگر را تفسیر نمایند). به عبارت دیگر فرض بر این است که دو عبارت اسمی‏که در یک متن تکرار می‏شوند به احتمال خیلی زیاد هم‏مرجع هستند.
مثال ۹: دیروز دو تیم محبوب «الف» و «ب» به مصاف یکدیگر رفتند. تیم «الف»، در نیمه اول بسیار درخشید به طوری که طرفداران این تیم به پیروزی تیمشان امیدوار بودند. اما دیری نپایید که تیم «ب» روال بازی را به نفع خود تغییر داد که منجر به شادمانی طرفداران این تیم شد.
همان طور که در مثال ۹ مشاهده می‏شود، عبارت اسمی‏«طرفداران این تیم» در خطوط ۲ و ۳ عیناً تکرار شده است. بنابراین طبق ویژگی تطابق رشته‏ای در فرآیند تحلیل مرجع‏مشترک این دو عبارت با یکدیگر هم‏مرجع در نظر گرفته خواهند شد، اما واقعیت این است که این دو عبارت با یکدیگر هم‏مرجع نیستند. به عبارتی قرار گرفتن این دو عبارت در یک زنجیره واحد یکی از خطاهای تحلیل مرجع‏مشترک محسوب می‏شود. در حالی که استفاده از فرآیند تحلیل پیشایندی موجب رفع این خطا خواهد شد. این کار به این ترتیب انجام خواهد گرفت که عبارت «طرفداران این تیم» در خط ۳ با اولین و نزدیک‏ترین مفسر خود یعنی «تیم ب»، تشکیل یک جفت تالی و مقدم را می‏دهند و به همین ترتیب «طرفداران این تیم» در خط ۲ با «تیم الف» جفت خواهد شد. این مثال نمونه‏ایست که در آن دقتِ59 تحلیل پیشایندی از تحلیل مرجع‏مشترک پیشی می‏گیرد.
طبق آنچه در فرآیند تحلیل پیشایندی رایج است. هنگام شناسایی مقدم برای هر عبارت تالی، حرکت از تالی به سمت عبارت‏های اسمی‏ماقبل آن انجام خواهد شد تا به این ترتیب، جفت عبارت‏های (مقدم و تالی) شناسایی شوند. همان طور که پیش از این اشاره شد، فرآیند تشخیص مرجع ضمیر نیز از همین رویکرد پیروی می‏نماید، با این تفاوت که در برخی موارد مقدم (در اینجا منظور مرجع ضمیر است) بعد از تالی قرار می‏گیرد (مانند مثال ۸). بنابراین حرکت الگوریتم (راست به چپ) نمی‏تواند به شناسائی مرجع صحیح برای ضمیر مورد نظر منجر شود. در حالی که اجرای وظیفه‏ی تحلیل مرجع‏مشترک، با شناسایی عبارت‏های هم‏مرجع، تا حد زیادی این مشکل را برطرف خواهد نمود. حرکت الگوریتم در تحلیل مرجع‏مشترک نیز از راست به چپ خواهد بود با این تفاوت که نقطه‏ شروع آن می‏تواند انتهای متن باشد، هر عبارت اسمی‏جدید که با عبارت‏های پیش از خود هم‏مرجع باشد به زنجیره‏های موجود اضافه می‏شود، در غیر این صورت خودش تشکیل زنجیره‏ای جدید را خواهد داد. در چنین حالتی فراخوانی60 و دقت در تحلیل مرجع‏مشترک نسبت به تحلیل پیشایندی پیشی می‏گیرد.
به همین ترتیب نیز راهکار‏ها‏ی ارائه شده برای هر کدام از این فرآیندها تا حدودی با یکدیگر متفاوت می‏باشد. به عنوان نمونه یک رویکرد در فرآیند تحلیل پیشایندی افراز پس از آموزش الگوریتم یادگیری است که تنها به منظور افرازِ جفت‏های (مقدم و تالی) صورت می‏گیرد. به این ترتیب که پس از ایجاد نمونه‏ها‏ی مثبت و منفی که عموماً توسط یک رده‏بند ایجاد می‏شوند، نزدیک‏ترین و مناسب‏ترین مقدم برای تالی مورد نظر مشخص می‏شود. در مقابل برخی پژوهشگران برای تحلیل مرجع‏مشترک را یک فرآیند دومرحله‏ای در نظر می‏گیرند؛ در مرحله‏ی اول به جای استفاده از دو اصطلاح تالی و مقدم، اصطلاحاتی مانند «قابل برچسب61» و یا «اشاره» جایگزین می‏شود. هر اشاره می‏تواند خروجی فرآیند کشف و شناسایی اشاره باشد. توجیه این جایگزینی این است که ما در تحلیل مرجع‏مشترک به مفاهیم مفسر یا ارجاع دهنده نیاز نداریم و به جای آن اصلاحِ مستقلِ اشاره را جایگزین می‏نماییم. هر اشاره به عنوان یک ارجاع به هر گروه از موجودیت‏ها در نظر گرفته می‏شود و می‏تواند یکی از انواع اسم عام، اسم خاص و حتی ضمیر (یا شبه ضمیر) باشد. همچنین سایر عبارت‏های موجود در متن که برای تحلیل مرجع‏مشترک کاربرد ندارند، به عنوان خارج ‏از اشاره62 در نظر گرفته می‏شوند. در مرحله‏ی دوم نیز فرآیند تحلیل عبارت‏ها‏ی اسمی‏هم‏مرجع انجام خواهد شد.
1-3.جمع‏بندی:
در این فصل، تحلیل مرجع مشترک را به طور دقیق تر مورد بررسی قرار دادیم، آنچه مشخص است این فرآیند به دنبال پیدا کردن ارتباطات هم‏مرجع در متن می‏باشد. در پژوهش‏ها‏ی انجام شده گاهی یک ارتباط هم‏مرجع با ارتباط مشابه دیگری به نام ارتباط پیشایندی مترادف محسوب می‏شود. حتی گاهی ما یک ارتباط را هم‏مرجع می‏پنداریم که هم‏مرجع نیست.
از آنجائیکه ما برای انجام تحلیل مرجع مشترک در زبان پارسی نیاز به پیکره‏ای با برچسب گفتمان خواهیم داشت، لازم بود تا این ارتباطات را به طور دقیق بشناسیم. تا بر اساس آن بتوانیم پیکره‏ای با روابط صحیح ایجاد نمائیم. به علاوه این شناخت می‏تواند به انتخاب راهکار‏های مناسب برای فرآیند تحلیل مرجع مشترک نیز کمک شایانی داشته باشد و در نهایت نیز شناخت روابط و راهکارهای مناسب برای تشخیص هر کدام از انواع روابط میان عبارت‏های اسمی مرتبط با هم، می تواند به ایجاد یک سیستم چند گذری، مانند آنچه لی 2011، بنسکو2012 ارائه داده اند کمک کند. [41،80]به این ترتیب که در هر گذر، یکی از انواع و حالت‏های موجود مورد بررسی و تحلیل قرار گیرد و در نهایت با اجماع نتایج حاصل شده، فرایند تحلیل اتمام یابد.

دسته بندی : پایان نامه

پاسخ دهید