خرید و دانلود فصل دوم پایان نامه پیکره متنی موازی و تعریف آن با فرمت docx در قالب 24 صفحه ورد بصورت کامل و جامع با قابلیت ویرایش

 

 


پیکره، مجموعه‌ای است از مواد متنی یا گفتاری که بر اساس مجموعه مشخصی از معیارهای از پیش تعیین شده گردآوری شده است. پیکره قابل خوانش توسط ماشین است به عبارتی دیگر دیجیتالی است، دامنه مشخصی دارد و محدود (دارای نهایت) است. پیکره برای پژوهش‌های زبانی مورد استفاده قرار می‌گیرد. از آنجایی که در این پژوهش کاربردهای متنی ترجمه ماشینی مدنظر است، منظور از پیکره، پیکره متنی می‌باشد؛ اما از این پس جهت سهولت تنها از لفظ پیکره به جای پیکره متنی استفاده می‌کنیم.

 

 

 

فهرست مطالب
2-1. پیکره 14
2-1-1. پیکره موازی 15
2-1-2. پیکره تطبیقی 17
2-2. همترازی 18
2-2-1. همترازی در سطح سند 19
2-2-2. همترازی در سطح جمله 19
2-2-3. همترازی در سطح کلمه (همترازی لغوی) 21
همترازی لغوی با استفاده از مدل‌های آی‌بی‌ام 22
2-3. ارزیابی ترجمه ماشینی 23
2-3-1. بلو 23
2-3-2. متریک NIST 24
2-3-3. نرخ خطای کلمه 24
2-3-4. نرخ خطای ترجمه (TER) 25
3. مروری بر تحقیقات انجام شده 28
3-1. مقدمه 28
3-2. ساخت پیکره موازی از روی متون هم‌ترجمه 28
3-3. استخراج جملات موازی از وب 30
3-4. استخراج جملات موازی از پیکره‌های تطبیقی 32
3-5. تشخیص جملات موازی با استفاده از طبقه‌بند آنتروپی بیشینه 34
3-6. ساخت پیکره موازی انگلیسی – فارسی 36
منابع