Skip Navigation Links
ترجمه ماشینی فارسی به انگلیسی
تیم های ثبت نام شده
نام تیموابستگینام مسئول تیمنام خانوادگی مسئول تیمکشور
PersianGulfدانشگاه آزاد اسلامی واحد تهران مرکزیmehranziabaryIran Islamic Republic of
تیم های پذیرفته شده
1

هدف از این مسابقه ترجمه خودکار زبان فارسی به انگلیسی و بالعکس است. برنامه هر یک از تیم‌ها می‌بایست متون دریافتی به هر یک از زبان‌ها را به زبان دیگر ترجمه نماید.

شرح مسابقه

هدف از مسابقه ترجمه ماشینی، به چالش کشیدن دقت سیستم های ترجمه ماشینی طراحی شده توسط شرکت کنندگان و بررسی صحت ترجمه انجام شده توسط آنها می‌باشد. این مسابقه در دو سطح «پیکره باز» و «پیکره ثابت» برگزار می‌گردد.

۱- سطح پیکره ثابت:

در سطح «پیکره ثابت» تیم‌ها موظف‌اند صرفا از پیکره‌‌ی آموزشی که تیم برگزاری در اختیار آنها قرار می‌دهند استفاده کنند. با این حال استفاده از ابزار‌های کمکی مانند برچسب زننده‌ی POS، ریشه‌یاب کلمات و مانند آن منعی ندارد. تیم‌ها موظف به اعلام هرگونه ابزار کمکی استفاده شده در سیستم توسعه یافته توسط آنها هستند.

۲- سطح پیکره باز:

در سطح «پیکره باز»، علاوه بر پیکره‌ی آموزشی که در اختیار آنها قرار خواهد گرفت، هر پیکره‌ی آموزشی دیگری را که بتوانند بدست بیاورند نیز می‌توانند مورد استفاده قرار دهند.

هر کدام از این دو سطح، در دو بخش انگلیسی به فارسی و فارسی به انگلیسی برگزار می‌شود.

با توجه به حجم بالای محاسبات و مصرف بالای منابع در سیستم‌های ترجمه ماشینی، پیکره‌های آموزشی یک ماه قبل از روز مسابقه از طریق وبسایت مسابقات در اختیار تیم‌ها قرار داده می‌شود و در روز مسابقه فایل‌های آزمایشی در اختیار تیم‌ها قرار می‌گیرد.

داده‌های آموزشی و آزمایشی

فایل‌های‌ آموزشی

فایل‌های آموزشی شامل یک یا چند پیکره موازی می‌باشند. در این پیکره‌ها، یک فایل برای زبان فارسی و یک فایل برای زبان انگلیسی وجود دارد. در هرسطر از این فایل‌ها، جملاتی هم‌ترجمه وجود دارد. هم ترازی سطح جملات و یا عبارات در  این جملات وجود ندارد. و هم‌ترازی، صرفا در سطح جملات قابل استنتاج می‌باشد. برای مثال:

en.txt

There is a tree in this street.

Where do you want to go this weekend?

.

.

fa.txt

در این خیابان یک درخت وجود دارد.

آخر هفته به کجا می‌روی؟

.

.

 

فایل‌های آزمایشی:

فایل‌های آزمایشی نیز مشابه فایل‌های آموزشی است، در بخش فارسی به انگلیسی و یا انگلیسی به فارسی تعدادی جمله‌ی زبان مبدا، در هر سطر، در یک فایل در اختیار تیم‌های شرکت کننده قرار داده می‌شود. تیم‌ها موظف هستند در یک فایل دیگر نتایج حاصل از ترجمه جملات را در سطر مربوطه به آن جمله قرار دهند.



کمیته فنی :

    آقای مهندس ودادیان

    آقای مهندس تراب زاده

کمیته داوران:

گروه هوش مصنوعی دانشکده کامپیوتر دانشگاه امیر کبیر



برای دسترسی به مجموعه داده آزمایشی مسابقه "ترجمه ماشینی فارسی به انگلیسی" بروی لینک کلیک نمائید.

-------------------------------------------------------------------------------------------------------------------------

کلیه تیم‌های شرکت کننده در این مسابقه موظف به رعایت کلیه قوانین عمومی مسابقات هوش مصنوعی امیرکبیر هستند.

  1. استفاده از کدهای آماده تابع قوانین عمومی مسابقات هوش مصنوعی امیرکبیر می‌باشد.
  2. محدودیتی در مورد زبان برنامه نویسی مورد استفاده وجود ندارد.
  3. شرکت­کنندگان بایستی برنامه خود را پیش از شرکت در مسابقه آموزش دهند و در روز مسابقه تنها به اجرای آن بپردازند

نحوه دریافت اطلاعات فنی تیم ها به همراه موارد درخواستی اعلام خواهد شد.

ارزیابی

ارزیابی تیم‌ها شامل دو بخش علمی و عملی است.

ارزیابی عملی:

در ارزیابی عملی تیم‌ها دقت ترجمه هر یک از تیم‌ها بر اساس معیارهای مختلف ارزیابی شده و در نهایت نمره‌ای از صفر تا هفتاد به هر یک از تیم‌ها داده می‌شود.

معیار سنجش دقت گروه‌ها، سه معیار متداول BLEU، Translation Error Rate(TER) وWord Error Rate(WER) می‌باشد.

معیار BLEU: در این معیار ترجمه، هر چه تعداد N-Gram های مشترک موجود درجمله‌ی ترجمه شده با جمله و یا جملات مرجع بیشتر باشد میزان دقت بالاتر می‌رود. به طور کلی در این معیار، هرچه هم‌وقوعی بیشتر باشد، ترجمه بهتری داشته‌ایم. هرN-Gram، ترتیبی از N کلمه متوالی با در نظر گرفتن بزرگی و یا کوچکی حروف است. برای بررسی دقت BLEU از ابزار mteval استفاده می‌شود. لازم به ذکر است نیازی تغییر فرمت فایل خروجی به فرمت SGML (مورد نیاز برایmteval) نیست و این کار توسط تیم برگزار کننده انجام می‌گردد.

معیار WER: این معیار فاصله levenshtein کلمات بدست آمده از ترجمه را با کلمات موجود در جمله و یا جملات مرجع را به عنوان هزینه ترجمه در نظر می‌گیرد.

معیار TER: این معیار، بر اساس تعداد تبدیل های لازم برای تبدیل جمله ترجمه شده به جمله مرجع، کیفیت ترجمه را ارزیابی می‌کند.

 

ارزیابی علمی:

   در اين قسمت، کدها و گزارش فني تيم­هاي شرکت کننده توسط داوران بررسي مي­گردد. متن گزارش فني بايد مرتب، کامل و دقيق باشد. روش مورد استفاده نيز بايد خلاقانه و با پشتوانه علمي باشد. روش‌هاي گزارش شده مي­بايست به طور کامل در برنامه تيم­ها پياده­­سازي شده باشد. تيم‌هاي شرکت کننده مي‌بايست علاوه بر گزارش فني، ارائه شفاهي نيز از کار خود به عمل آورند.

   در این مرحله، تیم­ها بر اساس داوری صورت گرفته، امتیازی بین صفر تا 30 دریافت خواهند کرد و جمع امتیاز ارزیابی عملی و ارزیابی علمی تیم های برتر را مشخص خواهد کرد.

ورودی و خروجی

ورودی: تنها ورودی برنامه تیم‌ها در این مسابقه آدرس و نام فایل‌هایی است که قرار است ترجمه شوند.

خروجی: برنامه هر يک از تيم‌هاي شرکت­کننده بايد به ازاء هر یک از فایل‌های ورودی یک فایل خروجی ایجاد کند که در هر سطر آن ترجمه یکی از سطرهای فایل ورودی به زبان مقصد درج شده باشد.



31/5/94 اعلام موارد درخواستی از تیم ها

31/5/94 بارگذاری داده های آموزشی برای استفاده تیم ها





1 2
آخر بعدی
حامیان
     

 


حامیان