نوع مقاله : مقاله پژوهشی
نویسنده
استادیار مطالعات ترجمه، گروه زبان انگلیسی، دانشگاه حضرت معصومه (س)، قم، ایران
چکیده
ازآنجاییکه تطابق ترجمهها با اصول و ویژگیهای خطی زبان مقصد یکی از ابعاد مهم کیفیت آنهاست، در این مطالعه تبعیّت ترجمههای انگلیسی-به-فارسی پنج سامانة برخط (در ژانر متون مطبوعاتی) با دستورالعملهای دستور خط مصوب فرهنگستان زبان و ادب فارسی و اصول نگارش نویسههای سجاوندی بررسی شد. برای این منظور چندین متن برگرفته از متون انگلیسی منتشره در روزنامههای انگلیسیزبان جمعآوری شد و توسط پنج سامانه برخط (چتجیپیتی، دیپسیک، گوگل ترنسلیت، مایکروسافت ترنسلیتر و ریورسو) به فارسی ترجمه شد. با بررسی دقیق ترجمهها بهصورت کلمه به کلمه بر مبنای دستورالعملهای دستور خط مصّوب، مجموعاً 16 نوع خطای رسمالخطی و سجاوندی در ترجمهها شناسایی گردید، که به سه دستة عمده تقسیم گردیدند: خطاهای (نیم)فاصلهگذاری بین اجزاء کلمات و ترکیبات، خطاهای نگارش نویسههای ثانوی و خطاهای فاصلهگذاری نویسههای سجاوندی. طبق نتایج، گوگل، مایکروسافت و ریورسو تمامی این خطاها را تولید کرده بودند. دیپسیک و جتجیپیتی نیز بهترتیب 4 و 12 نوع از این خطاها را در برونداد خود داشتند. بهعلاوه، نتایج نشان داد که عملکرد هیچیک از سامانهها کاملاً یکدست نیست بهطوریکه گاهی یک سامانة واحد یک ترکیب یا نویسه واحد را صحیح نگارش کرده بود و گاهی ناصحیح. همچنین، مشخص شد که خطاها مشابهت بسیار بالایی با خطاهای رسمالخطی موجود در متون انسانی دارند. علت این امر آن است که متونی که برای آموزش سامانههای ترجمه استفاده میشود عموماً متون تکزبانه یا دوزبانة منبعبازی هستند که توسط نویسندگان و مترجمان در بسترها و بافتهای مختلف تولید شدهاند. با توجه به استفادة روزافزون از سامانههای ترجمه، این خطاها میتوانند بهمرور به رسمالخط احاد جامعة فارسیزبان نفوذ کنند و تلاشهای معیارسازی خط توسط فرهنگستان زبان را تحت تأثیر قرار دهند. یک راهحل رفع این مشکل آن است که سامانههای مجزا یا تجمیعشدهای توسط متولیان این سامانهها (یا توسعهدهندگان مستقل) ایجاد شود تا قبلاز تحویل ترجمه به کاربر نهایی آن را از منظر سازگاری با دستور خط مصوب و اصول نگارش نویسههای سجاوندی بررسی و پسویرایش نماید.
کلیدواژهها
موضوعات
عنوان مقاله [English]
Investigation of the correspondence between the translations produced by ChatGPT, DeepSeek, Google Translate, Microsoft Translator and Reverso, and the approved orthography of the Academy of Persian Language and Literature
نویسنده [English]
- Gholamreza Medadian
Assistant Professor of Translation Studies, English Language Department, Hazrat-e Masoumeh University, Qom, Iran
چکیده [English]
Given that adherence to the orthographic principles and conventions of the target language constitutes a significant dimension of translation quality, this study investigated the compliance of English-to-Persian journalistic translations generated by five online machine translation (MT) systems with guidelines of the approved orthography of the Academy of Persian Language and Literature (APLL) and standard usage rules for punctuation marks. To this end, several texts were extracted from English newspapers and were translated into Persian by five systems (ChatGPT, DeepSeek, Google Translate, Microsoft Translator, and Reverso). Through meticulous, word-by-word reading and analysis of the translations in the light of the guidelines of the Approved orthography and usage rules for punctuation marks, a total of 16 distinct categories of orthographic and punctuation errors were identified in the machine-generated translations. These were later classified into three main types: (1) errors in the use of non-breaking or half-space (Nim-Faslé) within word elements and elements of compound words, (2) errors in the orthography of secondary Persian characters, and (3) errors in the correct spacing of punctuation marks. Google, Microsoft, and Reverso produced instances of all error types. DeepSeek and ChatGPT exhibited 4 and 12 types of these errors in their outputs, respectively. Furthermore, the results indicated that none of the systems demonstrated complete consistency in performance so that a given compound or character was at times rendered correctly and other times incorrectly. It was, also, discerned that the identified errors bear a significant resemblance to orthographic errors prevalent in human-generated texts. This phenomenon is attributable to the predominantly open-source monolingual and bilingual corpora used for training these online systems, which comprise texts authored and translated by diverse individuals across varied contexts and registers. Considering the increasing reliance on online MT systems, such orthographic and punctuation errors possess the potential to gradually permeate into the texts generated by Persian-speaking communities, potentially undermining the APLL's ongoing orthographic standardization efforts. One proposed solution for this problem entails the development, either by the MT providers themselves or independent developers, of dedicated or integrated auxiliary systems designed to scrutinize and post-edit translations prior to final user delivery, specifically evaluating their conformity with the approved orthographic guidelines and standard punctuation conventions.
کلیدواژهها [English]
- orthography errors
- approved orthography
- ChatGPT
- Google Translate
- Microsoft Translator
- Reverso