نوع مقاله : مقاله پژوهشی

نویسنده

استادیار مطالعات ترجمه، گروه زبان‌ انگلیسی، دانشگاه حضرت معصومه (س)، قم، ایران

10.22059/jolr.2025.400687.666934

چکیده

از‌آنجایی‌که تطابق ترجمه‌ها‌ با اصول و ویژگی‌های خطی زبان مقصد یکی از ابعاد مهم کیفیت آنهاست، در این مطالعه تبعیّت ترجمه‌های انگلیسی-به-فارسی پنج سامانة برخط (در ژانر متون مطبوعاتی) با دستورالعمل‌های دستور خط مصوب فرهنگستان زبان و ادب فارسی و اصول نگارش نویسه‌های سجاوندی بررسی شد. برای این منظور چندین متن برگرفته از متون انگلیسی منتشره در روزنامه‌های انگلیسی‌زبان جمع‌آوری شد و توسط پنج سامانه برخط (چت‌جی‌پی‌تی، دیپ‌سیک، گوگل ترنسلیت، مایکروسافت ترنسلیتر و ریورسو) به فارسی ترجمه شد. با بررسی دقیق ترجمه‌ها به‌صورت کلمه به کلمه بر مبنای دستورالعمل‌های دستور خط مصّوب، مجموعاً 16 نوع خطای رسم‌الخطی و سجاوندی در ترجمه‌ها شناسایی گردید، که به سه دستة عمده تقسیم گردیدند: خطاهای (نیم)فاصله‌گذاری بین اجزاء کلمات و ترکیبات، خطاهای نگارش نویسه‌های ثانوی و خطاهای فاصله‌گذاری نویسه‌های سجاوندی. طبق نتایج، گوگل، مایکروسافت و ریورسو تمامی این خطاها را تولید کرده بودند. دیپ‌سیک و جت‌جی‌پی‌تی نیز به‌ترتیب 4 و 12 نوع از این خطاها را در برونداد خود داشتند. به‌علاوه، نتایج نشان داد که عملکرد هیچ‌یک از سامانه‌ها کاملاً یک‌دست نیست به‌طوری‌که گاهی یک سامانة واحد یک ترکیب یا نویسه واحد را صحیح نگارش کرده بود و گاهی ناصحیح. همچنین، مشخص شد که خطاها مشابهت بسیار بالایی با خطاهای رسم‌الخطی موجود در متون انسانی دارند. علت این امر آن است که متونی که برای آموزش سامانه‌های ترجمه استفاده می‌شود عموماً متون تک‌زبانه یا دوزبانة منبع‌بازی هستند که توسط نویسندگان و مترجمان در بسترها و بافت‌های مختلف تولید شده‌اند. با ‌توجه ‌به استفادة ‌روزافزون از سامانه‌های ترجمه، این خطاها می‌توانند به‌مرور به رسم‌الخط احاد جامعة فارسی‌زبان نفوذ کنند و تلاش‌های معیارسازی خط توسط فرهنگستان زبان را تحت تأثیر قرار دهند. یک راه‌حل رفع این مشکل آن است که سامانه‌های مجزا یا تجمیع‌شده‌ای توسط متولیان این سامانه‌‌ها (یا توسعه‌دهندگان مستقل) ایجاد شود تا قبل‌از تحویل ترجمه به کاربر نهایی آن را از منظر سازگاری با دستور خط مصوب و اصول نگارش نویسه‌های سجاوندی بررسی و پس‌ویرایش نماید.

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

Investigation of the correspondence between the translations produced by ChatGPT, DeepSeek, Google Translate, Microsoft Translator and Reverso, and the approved orthography of the Academy of Persian Language and Literature

نویسنده [English]

  • Gholamreza Medadian

Assistant Professor of Translation Studies, English Language Department, Hazrat-e Masoumeh University, Qom, Iran

چکیده [English]

Given that adherence to the orthographic principles and conventions of the target language constitutes a significant dimension of translation quality, this study investigated the compliance of English-to-Persian journalistic translations generated by five online machine translation (MT) systems with guidelines of the approved orthography of the Academy of Persian Language and Literature (APLL) and standard usage rules for punctuation marks. To this end, several texts were extracted from English newspapers and were translated into Persian by five systems (ChatGPT, DeepSeek, Google Translate, Microsoft Translator, and Reverso). Through meticulous, word-by-word reading and analysis of the translations in the light of the guidelines of the Approved orthography and usage rules for punctuation marks, a total of 16 distinct categories of orthographic and punctuation errors were identified in the machine-generated translations. These were later classified into three main types: (1) errors in the use of non-breaking or half-space (Nim-Faslé) within word elements and elements of compound words, (2) errors in the orthography of secondary Persian characters, and (3) errors in the correct spacing of punctuation marks. Google, Microsoft, and Reverso produced instances of all error types. DeepSeek and ChatGPT exhibited 4 and 12 types of these errors in their outputs, respectively. Furthermore, the results indicated that none of the systems demonstrated complete consistency in performance so that a given compound or character was at times rendered correctly and other times incorrectly. It was, also, discerned that the identified errors bear a significant resemblance to orthographic errors prevalent in human-generated texts. This phenomenon is attributable to the predominantly open-source monolingual and bilingual corpora used for training these online systems, which comprise texts authored and translated by diverse individuals across varied contexts and registers. Considering the increasing reliance on online MT systems, such orthographic and punctuation errors possess the potential to gradually permeate into the texts generated by Persian-speaking communities, potentially undermining the APLL's ongoing orthographic standardization efforts. One proposed solution for this problem entails the development, either by the MT providers themselves or independent developers, of dedicated or integrated auxiliary systems designed to scrutinize and post-edit translations prior to final user delivery, specifically evaluating their conformity with the approved orthographic guidelines and standard punctuation conventions.

کلیدواژه‌ها [English]

  • orthography errors
  • approved orthography
  • ChatGPT
  • Google Translate
  • Microsoft Translator
  • Reverso