Document Type : Research Paper

Authors

1 Associate Professor, Department of Linguistics, University of Tehran

2 PhD student, Department of Linguistics, University of Tehran

Abstract

The present study clarifies the difference between orthographic words and their phonological correspondents in Persian writing system via computing orthographic depth of Persian writing system. In this article, first, the relationship between orthographic forms of the words and their phonological correspondents is formalized by using context free and context sensitive grapheme-phoneme rules. Then, the phonological bases of diacritics are studied. Finally, a method for computing orthographic depth of Persian writing system is introduced regardless of linguistic knowledge. The results indicate that it is possible to reduce the depth of Persian writing system by phonological, morphological and syntactic knowledge of the native speakers.
 

Keywords

- مقدمه

رویکرد غالب در مطالعۀ نظام­های نوشتاری، چگونگی پیوند دادن زبان با نشانه­های نوشتاری است. در سال­های اخیر نظام نوشتاری به عنوان حوزه­ای مجزا در مطالعات زبانشناسی از اهمیت خاصی برخوردار شده است و مطالعات بسیاری در زمینۀ نظام­های نوشتاری گوناگون انجام شده است که از میان آنها می­توان به تحقیقات کارینه مگردومیان (2004 ) تجزیه و تحلیل ساختواژی روش حالت­های محدود در فارسی ، مریم دانای طوس(1384) اثرات شفافیت و تیرگی خط فارسی بر مهارت زبانی خواندن کودکان طبیعی و خوانش­پریش رشدی فارسی زبان، تیم بوکوالتر[1] ( 2004) مسائلی دربارۀ خط عربی و تحلیل­های ساختواژی مربوط به آن، آنتال ون دن بوش[2]، الن کانتنت[3] ، والتر دلمانز[4] و بأتریس دخلدر[5] (1994) تجزیه و تحلیل عمق نوشتاری زبان­های مختلف با استفاده از الگوریتم داده­- محور، الینرگیبسون[6]، انه پایک[7]، هری اوسر[8] و مارشا همند[9] (1962)- نقش انطباق نگاره-واج در فهم کلمات، ریچرد ونزکی[10] (2004) در جستجوی نظام نوشتاری جامع و رابرت ترمل[11] (1990) تطابق مختلف نگاره-واج در کلمات ناآشنای چندهجایی، اشاره کرد. به دلیل وجود انبوه اطلاعات موجود در محیط­های گوناگون از جمله محیط­های رایانشی مانند اینترنت و رسانه­ها مانند روزنامه و مجلات ،حجم کلماتی که در واژگان ذهنی­ وجود ندارند و برای اولین بار با آنها مواجه می­شویم ( کلمات خارج از واژگان[12] ) افزایش می­یابد. حجم قابل­توجهی از این کلمات ، نام­های تجاری هستند که حرف­گردانی[13] شده­اند مانند کلمۀ < ناسیونال> برای برخی دیگر فرهنگستان زبان فارسی معادل فارسی معرفی کرده است مانند کلمۀ  < رایانه > که معادل کلمۀ < کامپیوتر> می­باشد. این کلمات جدیدالورود در متون فارسی را می­توان از دو دیدگاه مطالعه کرد: 1) روانشناسی زبان و 2) پردازش متن فارسی از دیدگاه تبدیل نوشتار به گفتار. روانشناسی زبان در جستجوی یافتن پاسخ برای این مسئله است که علیرغم نبود این کلمات در واژگان ذهنی، چگونه گویشوران یک زبان قادر به تلفظ کلماتی که برای اولین بار با آنها مواجه می­شوند، هستند و علت وجود شباهت­ها درنحوۀ تلفظ این کلمات میان افرادی که در یک طبقۀ تحصیلاتی قرار می­گیرند چیست. هدف این مقاله مطالعۀ مسائل مربوط به خط فارسی از نظر پردازش متن فارسی از دیدگاه تبدیل نوشتار به صورت واجی و سپس به صورت آوایی است. از آنجائی­که کلمات جدیدالورود در واژگان تعریف نشده­اند، در پردازش متن فارسی از دیدگاه تبدیل نوشتار به صورت واجی و سپس به صورت آوایی، باید روشی پیش­بینی شود که بوسیلۀ آن بتوان تلفظی برای این کلمات ارائه داد. نگارنده با استفاده از مفهوم نگاره[14] فاصلۀ بین صورت نوشتاری کلمات فارسی و صورت آوایی را تبیین می­کند و از طریق ارائه روش ریاضی بخش­بندی قطعه­های نوشتاری و فرمول ، که برای اولین بار نگارنده این روش را معرفی می­کند، به محاسبه عمق خط[15] فارسی می­پردازد. عبارت «عمق خط» بر میزان فاصله­ای که یک نظام نوشتاری از یک نظام آوانگاشتی آرمانی دارد دلالت می­کند. هر قدر این فاصله کمتر باشد و عدد به­دست­آمده به یک نزدیک­تر باشد، نظام نوشتاری مورد نظر سطحی­تر است و برعکس هر قدر این فاصله بیشتر باشد، نظام نوشتاری مورد نظر عمیق­تر است. طبق محاسبات بعمل­آمده، عمق خط فارسی زیاد است و به منظور تبدیل نوشتار به صورت واجی و سپس صورت آوایی، باید از اطلاعات زبانی موجود در خط فارسی بهره­مند شد. حاصل چنین پ‍‍‍ژوهشی می­تواند در طراحی یک وا‍ژگان مناسب برای یک نظام تبدیل نوشتار به گفتار فارسی مفید باشد.

     در تحقیق حاضر ابتدا  به تفاوت میان حرف[16] و نگاره و مبانی واج­شناختی نگاشت نگاره به واج در زبان فارسی ، به منظور مطالعۀ اطلاعات واجی موجود در نظام نوشتاری زبان فارسی، پرداخته می­شود. سپس در بخش سوم مفهوم عمق خط معرفی می­شود. بخش چهارم محاسبۀ عمق خط فارسی و مباحث مربوط به آن می­باشد و در نهایت بخش پنجم نتیجه­گیری مقاله خواهد بود.

 

2- حرف و نگاره

با وجود مفهوم «حرف» در نظام نوشتاری، در تحقیق حاضر از مفهوم «نگاره» استفاده می­شود. نگاره، کوچکترین واحد نوشتاری است که میان یک جفت کمینۀ نوشتاری تمایز ایجاد می­کند، (راجرز[17] 2005: 10 ) . در حالیکه مفهوم «حرف» به مجموعه نگاره­هایی اطلاق می­شود که برای نمایش همخوان­ها و بعضی از واکه­ها به کار می­رود و به لحاظ سنتی «الفبا» نامیده می­شوند. با طرح مفهوم نگاره می­توان گفت اعداد، علائم نقطه­گذاری و علائم زیروزیری[18] نیز نگاره محسوب می­شوند. به عنوان مثال جفت­های کمینۀ نوشتاری مانند .<تار> و < نار> تنها در تعداد نقطه­ها از هم متمایز می­شوند; اگر یک نقطه از قطعۀ نوشتاری < تار> کم شود تبدیل به قطعۀ نوشتاری < نار> می­شود. علائم زیروزبری مانند «تنوین»، «مد» و «تشدید» نیز نگاره محسوب می­شوند. به عنوان مثال در جفت­های کمینۀ نوشتاری < بنا> و < بنّا>، < اجر> و < آجر>، < حکماً> و < حکما>، به ترتیب، حضور یا عدم حضور نگاره­های تشدید، مد و تنوین چنین جفت­های کمینه­ای را ایجاد کرده­ است. بنابراین برای تبدیل نوشتار به گفتار یا حرف به آوا باید از مفهوم نگاره استفاده کرد تا بتوان چنین تمایزاتی را نشان داد؛ در حالی­که  اگر تنها به مفهوم «حرف» اکتفا شود، نمی­توان چنین تمایزاتی را نشان داد. به عنوان مثال < ا > یک حرف است اما < أ> حرف نیست بلکه یک نگاره است که به رشتۀ آوایی /aʔ/ نگاشته می­شود مانند : <تأیید> /taʔjid/ ؛ همچنین است نگارۀ <خو> در ابتدای کلمه که در بسیاری از موارد به واج /x/ نگاشته می­شود مانند: <خواب>  /xɒb/ . بنابراین، به کار بردن مفهوم «نگاره» در کنار مفهوم «حرف» به این دلیل است که هدف تبدیل نوشتار به صورت واجی و سپس صورت آوایی است. مفهوم «نویسه»[19] به رمزرایانه­ای مربوط می­شود که برای بازنمایی نگاره­ها و پردازش آنها در حافظۀ رایانه از آن استفاده می­شود. از آنجایی­که تحقیق حاضر رویکردی واج­شناختی به خط فارسی دارد ذکر انواع نگاره در نظام نوشتاری لازم به نظر می­رسد. در نظام­های نوشتاری نگاره­ها را می­توان به انواع: نگاره­های آزاد[20]، نگاره­های وابسته[21]، نگاره­های همخوانی[22]و نگاره­های واکه­ای[23] تقسیم کرد. نگاره­های آزاد به طور مستقل ظاهر می­شوند و در بیشتر موارد قابل انطباق با حروف هستند. به عنوان مثال در نظام نوشتاری زبان فارسی در کلمۀ  <امید> نگاره­های < ا>، <م>، < ی> و < د> نگاره­های آزاد محسوب می­شوند زیرا در بافت­های دیگر ( در کلمات دیگر) هر کدام از این نگاره­ها به طور مستقل ظاهر می­شوند. نگاره­های وابسته، که در بعضی از نظام­های نوشتاری از جمله نظام نوشتاری زبان فارسی وجود دارند، نگاره­هایی هستند که تنها در ترکیب با دیگر نگاره­ها ظاهر می­شوند و به طور مستقل در خط ظاهر نمی­شوند. به عنوان مثال نگارۀ مد < ~> در نظام نوشتاری زبان فارسی به تنهایی ظاهر نمی­شود و حتماً همراه با نگارۀ الف< ا>به صورت <آ> ظاهر می­شود. نگاره­های وابسته نوعاً اختیاری­اند اما در بیشتر موارد حضورشان باعث رفع ابهام از هم­نگاره­ها[24] می­شود. نگاره­های همخوانی برای نمایش همخوان­های موجود در نظام واجی به کار می­روند مانند: نگارۀ <پ> که برای نمایش همخوان /p/‌ به کار می­رود. نگاره­های واکه­ای برای نمایش واکه­های موجود در نظام واجی به کار می­روند مانند: نگارۀ فتحه < >. نگاره­های واکه­ای اغلب اختیاری­اند اما حضورشان باعث رفع ابهام از هم­نگاره­ها می­شود.  بیشتر زبان‌شناسان معتقدند در یک نظام نوشتاری آرمانی، رابطۀ یک به یک میان نگاره و واج وجود دارد. اما به دلیل نگاشت­های چند­به­یک یا یک­به­چند بین نگاره­ها و واج­ها، وجود یک نظام نوشتاری آرمانی بعید به نظر می‌رسد. در نظام نوشتاری زبان فارسی واکه‌های کوتاه معمولاً نمود نوشتاری ندارند و تنها تعداد انگشت‌شماری نگاره وجود دارد که برای نشان دادن واکه‌های کوتاه در خط به کار می‌روند؛ از جمله «های بیان حرکت»  (< ه >) که برای نشان دادن واکۀ کوتاه /e/ یا /a/ به­ کار می‌رود؛ مانند <به> و <نه>؛ و حرف <و>  که می‌تواند نمود نوشتاری واکۀ کوتاه /o/ باشد؛ مانند <تو>. از دیگر مسائلی که در نظام نوشتاری زبان فارسی حائز اهمیت است، وجود علائم زیروزبری[25] است که به عنوان نگاره­های وابسته محسوب می‌شوند. در نظام نوشتاری زبان فارسی 11 علائم زیروزبری وجود دارد که می‌توان آنها را در پنج طبقۀ واج‌شناختی دسته‌بندی کرد.

 

2-1-طبقه­بندی نگاره­های زیروزبری در نظام نوشتاری زبان فارسی

2-1-1- واکه­­سازی[26]: علائم زیروزبری فتحه یا زبر< >، ضمه یا پیش< >کسره یا زیر < >، مد < ~> و الف مقصوره< ا>در این طبقه قرار می‌گیرند. نتیجۀ واج‌شناختی ترکیب این علائم با نگاره‌های آزاد این است که آن نگارۀ آزاد توسط این علائم واکه­سازی می­شود.

نگارۀ همخوانی که با فتحه، کسره و ضمه تلفیق می‌شود به ترتیب بوسیلۀ واکه‌های کوتاه /a/، /e/ و /o/ آواسازی می‌شود. از کسره می‌توان به عنوان پرکاربردترین علامت زیروزبری در واکه­سازی نام برد که کلمات را برای ساختن سازه‌های بزرگتر نحوی – که ساختار اضافه[27] نامیده می‌شود – به هم وصل می‌کند. این نوع کسره، کسرۀ اضافه خوانده می‌شود.

در برخی موارد به منظور ابهام‌زدایی از هم نگاره‌ها و در نتیجه فهم بهتر متن می‌توان از واکه­سازی واکۀ کوتاه استفاده کرد. به عنوان مثال در یک متن اقتصادی، قطعۀ نوشتاری <ارزش> می‌تواند دو معنی کاملاً متفاوت داشته باشد: <ارزِش>/Ɂarzeʃ/  (اسم) و <ارزَش>  /Ɂarzaʃ/(اسم + ضمیر ملکی سوم شخص مفرد)؛ این مثال کاربرد نگارۀ وابستۀ فتحه و کسره را در رفع ابهام از هم‌نگارۀ <ارزش> نشان می‌دهد.

     نوع دیگر واکه­­سازی که در متون فارسی نمونه‌های فراوانی از آن یافت می‌شود، واکه­سازی نگارۀ «الف» <ا> است که در بیشتر موارد در جایگاه ابتدائی قطعۀ نوشتاری قرار می‌گیرد و به شکل مد< ~> بالای نگارۀ  الف < ا>  ظاهر می‌شود < آ> که در واقع نمود نوشتاری واکۀ بلند پسین افتاده /ɒ/ است؛ بنابراین، نشانۀ <آ > توالی واجی /Ɂɒ/ است

الف مقصوره <ا> در بالای حرف <ی> در جایگاه انتهایی دنبالۀ نوشتاری، نوع دیگر واکه­سازی است که تنها در کلمات قرضی عربی یافت می‌شود؛ در این صورت نگارۀ همخوانی قبل از <ی> بوسیلۀ /ɒ/ واکه­سازی می‌شود. مثال­های  <عیسی> در مقابل <عیسی'>، <موسی> در مقابل <موسی'> و <یحیی> در مقابل <یحیی'> نشان می‌دهند که الف مقصوره <ا> یک نگارۀ وابسته است.

 

2-1-2- تنوین[28]: ترکیب علائم زیروزبری دو زبر < >، دو پیش < > و دو زیر <> با یک نگارۀ همخوانی، تنوین نامیده می‌شود. نتیجۀ واج‌شناختی چنین ترکیبی، واکه­سازی نگارۀ همخوانی بوسیلۀ یک واکۀ کوتاه و همخوان خیشومی /n/ است؛ بنابراین، ترکیب‌های <اً> /an/ ، <اٍ> <en/ و < اُ>  /on/ ساخته می‌شوند. رایج‌ترین نوع تنوین در متون فارسی، دو زبر <اً> است که به انتهای اسم یا صفت اضافه می‌شود و در نتیجه قیدهای واژگانی ساخته می‌شوند. برای اثبات وابسته بودن نگارۀ دو زبر < > می‌توان به تعداد زیادی از جفت‌های کمینۀ نوشتاری اشاره کرد مانند: <عرفاً> /Ɂorfan/ در مقابل <عرفا>/Ɂorafɒ/ ، <عقلاً> /ɁaGlan/ در مقابل <عقلا>/ɁoGalɒ/ ، <فرداً>  /fardan/ در مقابل <فردا/fardɒ/  . بنابراین، در چنین مواردی اگر دو زبر- جایی که حضور آن الزامی است- حذف شود، ابهام واژگانی را در تبدیل نگاره به واج ایجاد می‌کند و یا به عبارت دیگر، به میزان عمق خط فارسی افزوده می­شود. حال آنکه در مورد بعضی قیود دیگر چنین مسأله‌ای صدق نمی‌کند؛ به عبارتی دیگر در صورت عدم حضور دو زبر، ابهام واژگانی رخ نمی‌دهد و تنها باعث تفاوت در تلفظ یک کلمه می‌شود مانند: <حقاً> /haGGan/ و <حقا>/haGGɒ/ ، <ابداً>   /Ɂabadan/ و <ابدا> /Ɂabadɒ/ ،<اصلاً> /Ɂaslan/  و <اصلا> /Ɂaslɒ/. همانگونه که ذکر شد نوع دیگر تنوین دو پیش < > است که تنها در تعداد معدودی از کلمات قرضی عربی دیده می‌شود مانند<مضافٌ‌الیه> و<مشارٌ‌الیه>. دو زیر <> و دیگر علائم زیروزبری عربی تنها در متون مذهبی یافت می‌شوند.

 

2-1-3-تشدید:[29] ترکیب علامت زیروزبری تشدید <>- که در عربی «شدّا» نامیده می‌شود- با یک نگارۀ‌ همخوانی آزاد، تشدید خوانده می‌شود. نتیجۀ واج­شناختی چنین ترکیبی، یک بار تکرار آن نگارۀ همخوانی آزاد است و در نتیجه آن همخوان به لحاظ آواشناسی کشیده تلفظ می‌شود. برای اثبات وابسته بودن نگارۀ تشدید >ـّـ< در نظام نوشتاری زبان فارسی می‌توان به جفت‌های کمینۀ نوشتاری زیر اشاره کرد:

<کمّی>  /kammi/در مقابل <کمی> /kami/ ، <سرّی>  /serri/ در مقابل <سری>  /seri/، <حلّال>  /hallɒl/ در مقابل <حلال> /halɒl/.

 

2-1-4-خوشه­نویسی[30]: ترکیب علامت زیروزبری سکون <> با یک نگارۀ همخوانی آزاد، خوشه­سازی نامیده می‌شود. نتیجۀ واج­شناختی چنین ترکیبی خوشه­سازی آن نگارۀ همخوانی است. در خط فارسی قطعه­های نوشتاری وجود دارند که در آنها حضور یا  عدم حضور سکون <> فت کمینۀ نوشتاری ایجاد می‌کند مانند: <سبْک> /sabk/ در مقابل <سبک> /sabok/ ، <سمْت> /samt/ در مقابل <سمت> /semat/ . بنابراین، نگارۀ سکون  <> یک نگارۀ وابسته است.

ذکر نمود نوشتاری کلمات دارای سکون نشان می‌دهد که سکون  <> بر روی یک نگارۀ همخوانی- که خوشه­سازی در مورد آن صورت گرفته است- نقش تعیین مرز جایگاه پایانه را در هجا به عهده دارد؛ بنابراین، سکون  <> ابزار نوشتاری دیگری برای حل مسألۀ ابهام هم­نگاره‌ها در متن است.

 

2-1-5-همزه­­سازی[31]: ترکیب علامت زیروزبری همزه <ء> با <ه> غیرملفوظ، همزه­سازی نامیده می‌شود. <ه> غیرملفوظ نگاره­گونه‌ای[32] است از <ه> در جایگاه پایانی قطعۀ نوشتاری که برای نشان دادن واکۀ /e/ به کار می‌رود و همزۀ بالای <ه> نشان دهنده توالی [je] است؛ بنابراین، نشانۀ <ء> توالی آوایی [eje] است. علامت زیروزبری همزه <ء> یک نگارۀ وابسته محسوب می‌شود که برای نشان دادن واژه­بست[33] اضافه به کار می‌رود – که در نحو فارسی برای متصل کردن کلمات در ساختار  اضافه به کار می‌رود . بنابراین، عدم حضور همزه <ء> می‌تواند ابهام نحوی ایجاد کند و در تبدیل نوشتار به گفتار مشکل ایجاد کند. در مثال­های: الف) «خاله او را دید» و ب) «خالۀ او را دید»

در جملۀ الف <خاله> فاعل و در جمله ب <خاله> نقش مفعول را دارد. بنابراین، عدم حضور همزه <ء> می‌تواند ابهام نحوی ایجاد کند.

شکل دیگر رایج نمود کسرۀ اضافه در متون فارسی، چسباندن شکل مجزای نگارۀ آزاد <ی> به آخر کلمه برای ساختن ساخت اضافه است مانند <خاله‌ی>. بنابراین، برای نشان دادن ترکیب <ه> غیرملفوظ و کسرۀ اضافه، سه شکل ممکن نوشتاری در متون فارسی یافت می‌شود: <ء > ، <ـه‌ی> و <ـه ‌ی>.

شکل دوم <ـه‌ی> ، توالی است از <ـه> و <ی> که برای نگه داشتن شکل <ه> آخر <ـه> نویسۀ نیم­فاصله ZWNJ (U+200c) [34]بعد از <ه> اضافه می‌شود تا از اتصال <ه> به <ی> جلوگیری شود ( اسفهبد[35]  2004: 8). شکل سوم <ـه ‌ی> همان توالی است و تفاوت آن با شکل دوم این است که یک فاصله بین <ه> و <ی> درج شده است. به طور کلی می‌توان گفت این سه شکل نوشتاری برای یک دنبالۀ نوشتاری که متشکل از ستاک و وند است به کار می‌رود و در واقع بر حسب شکل نگارۀ آخر ستاک و اولین نگارۀ وند ایجاد می‌شوند. ( مگردومیان 2004). برای مثال برای توالی <کتاب> - که ستاک است- و <ها> - که وند است - سه شکل نوشتاری وجود دارد: <کتابها>، < کتاب‌ها> و <کتاب‌ ها>.

 

2-1-6-حروف مرکب[36]: در فارسی، حروف مرکب متشکل از دو نگاره است که به صورت یک واحد نوشته می‌شوند. ترکیب‌های متعددی از ترکیب نگاره‌های آزاد با  نگاره‌های وابسته در فارسی وجود دارند اما در صورتی حرف مرکب خوانده می‌شوند که فرهنگ لغت فارسی آنها را همانند یک حرف منفرد در الفبا بیاورد. بر اساس چنین معیاری در خط فارسی دو حرف مرکب واقعی وجود دارد که در عربی هم وجود دارند (الامام[37] 2003). ؛ الف <ا> با مد <~>در بالای آن< آ> و لام و الف <لا> ،< آ > اولین نگاره در ترتیب الفبایی فرهنگ لغت فارسی است که نشان دهندۀ انفجاری چاکنایی /Ɂ/ و مد< ~> بالای آن نشان­دهندۀ واکه بلند /ɒ/ است. اما در فرهنگ لغت فارسی هیچ نگارۀ واحدی[38]برای حرف مرکب <لا >وجود ندارد و به صورت توالی <ل> و <ا> تعریف می‌شود، مانند <لال>، <سلام>. در فارسی حروف مرکب دیگری هم وجود دارد: <أ>‌ ، <ؤ> و <ئـ> و < ۀ >. سه شکل اول (<أ>‌ ، <ؤ> و <ئـ>) نگاره­گونه‌های همزه هستند و بنابراین، نگارۀ مجزا در نظر گرفته نمی‌شوند؛ اما <ۀ> که نشان دهندۀ توالی آوایی [eje] است و همزۀ بالای <ه> نشان­دهندۀ کسرۀ اضافه است، حرف مرکب محسوب می‌شود؛ در حالی­که در فرهنگ لغت فارسی هیچ نگارۀ واحدی برای آن وجود ندارد و به صورت توالی <ه> و همزۀ بالای آن تعریف می‌شود.

 

2-2-ارتباط نگاره و واج

به منظور مطالعۀ دقیق نظام نوشتاری زبان فارسی، ارتباط میان نگاره و واج نیز باید بررسی شود. در نظام نوشتاری زبان فارسی چند نوع ارتباط میان نگاره و واج وجود دارد:

 

2-2-1- ارتباط نگاره و واج: یک­به­یک

ب>>  → /b/؛  ج>> → /dʒ/؛  <خ>  → /x/؛   

د>>→  /d/ ؛<ر>→ /r/ ؛ش>> → /ʃ/ ؛ف>> → /f/ ؛ک>      > → /k/ ؛<ل > → /l/ ؛<م > → /m/ ؛ن>> → /n/ ؛پ>       > → /p/ ؛چ>>  → /tʃ/ ؛<ژ > → /ʒ/ ؛<گ>  → /g/

 

2-2-2- ارتباط نگاره و واج: چندبه­یک

<ط ، ت> → /t/ ؛<ص ، ث ، س> → /s/ ؛<ذ ، ز ، ض ، ظ> → /z/ ؛   <غ ، ق> → /G/ ؛ <ه ، ح> → /h/ ؛< همزه ،ع> → /Ɂ/

2-2-3- ارتباط نگاره و واج: یک­به­چند

<ا>→ {/ɒ/,/Ɂ/,/Φ/} ؛و >  <{/v/, /u/,/o/} ؛

<<ی → {/j/,/i/,/ɒ/}

رابطۀ میان <ا>و /Ɂ/ بحث برانگیز است. هر واکۀ ابتدایی در خط فارسی روی کرسی<ا>قرار می­گیرد. شکل‌های نوشتاری واکه‌های بلند ابتدایی یعنی: (/i/ ، /u/ ، /ɒ/) به  ترتیب به صورت< ای> ، <او >و< آ >هستند. اما از آنجایی که هیچ حرف مازادی در نظام نوشتاری فارسی برای نشان دادن واکه‌های کوتاه به کار برده نمی‌شود، <ا> ابتدایی به صورت [Ɂa] ، [Ɂe] و یا [Ɂo] تلفظ می‌شود. بعضی از نویسندگان برای ابهام‌زدایی ارزش واجی <ا>  ابتدایی یا هر حرف دیگری که بدنبالش واکۀ کوتاه بیاید، از نگاره­های وابسته فتحه < > ، کسره <> و ضمّه <> در بالا یا پایین  الف <ا> استفاده می‌کنند که نتیجۀ آن نویسه‌های <اَ> ، <اِ> و <اُ> است. شایان ذکر است که در بسیاری از کلمات قرضی عربی وجود <ا> ابتدایی به صورت <اِ> یا <اَ> جفت کمینه ساخته است. به عنوان مثال: قطعه‌های حاوی <اَ> در جایگاه ابتدایی‌شان، اسم جمع مکسر هستند و قطعه‌هایی که در ابتدایشان >اِ< است به عمل فعل مربوط می‌شوند مانند  <اَخبار>  /Ɂaxbɒr/و< اِخبار> /Ɂexbɒr/ (عمل به اطلاع‌رسانی) ،<اَسناد>   /Ɂasnɒd /و <اِسناد>  /Ɂesnɒd /، <اَشکال>  /aʃkɒl/و <اِشکال>     /Ɂeʃkɒl /. از آنجایی که در متون فارسی چنین مواردی بدون نمود فتحه یا کسره ظاهر می‌شوند، تنها در بافت نحوی می‌توان از آنها ابهام‌زدایی کرد.

ساختار دیگر در نظام نوشتاری زبان فارسی توالی حرفی< خو > است. در زبان‌شناسی تاریخی زبان فارسی در این­که­ آیا <خو> یک نشانۀ نوشتاری برای واج موجود در زبان فارسی میانه است /xw/ - یا توالی دو واج /x/ و /w/ اتفاق نظر وجود ندارد، ( پیسوویچ[39] ،1985: 121-2). در فارسی معاصر کلماتی وجود دارند که با <خوا> شروع می‌شوند و در آنها حرف <و> تلفظ نمی‌شود. بنابراین، <خوا> - در جایگاه ابتدایی- در این کلمات به صورت [xɒ] تلفظ می‌شود. به طور کلی می­توان گفت تلفظ <خوا>در جایگاه ابتدایی به دو صورت است: 1- [xɒ] : که رایج‌ترین کلماتی که در آنها <خوا>  به صورت [xɒ] تلفظ می­شود ، شکل‌های تصریف شدۀ فعل <خواستن>  و اسم <خواب> است. 2- [xavɒ] : رایج‌ترین کلمه در این دسته، کلمه <خواص> است.

 

3- عمق خط

عمق خط ناظر بر ارتباط میان زبان و نوشتار  بنابراینح شود!!!!!!!!!!!!!!!!!!!؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟

 است (راجرز،2005 : 177). با گذشت زمان تغییراتی در زبان رخ می­دهد اما این امکان وجود دارد که نظام نوشتاری تغییر نکند ؛ این مسأله باعث افزایش عمق خط می­شود. در نظام نوشتاری سطحی، نگاره­ها نمایندۀ واج­ها هستند مانند خط فنلاندی، در حالیکه در نظام نوشتاری عمیق ، نگاره­ها نمایندۀ ­واژواج­ها هستند[40]؛ در چنین نظامی نشانه­های کمتری برای نمایش واج­ها به کار برده می­شود. از دیگر عواملی که باعث افزایش عمق خط می­شود، وجود تکواژگونه­هایی از یک تکواژ است که نگارش یکسان اما تلفظ متفاوتی دارند؛ به عنوان مثال در زبان انگلیسی تکواژگونه­های /ʧaɪld/  و  /ʧɪld/‌ به­ترتیب در دو کلمۀ  child  وchildren ‌ ، تکواژگونه­های / saʊɵ/ و  / sʌδ/ در دو کلمۀ south  و southern  باعث افزایش عمق خط انگلیسی می­شوند زیرا هر جفت تکوا‍ژ‍ صورت نوشتاری یکسان ولی تلفظ­های متفاوت دارند.

تاکنون روشهایی برای محاسبۀ عمق خط در زبانهای گوناگون پیشنهاد شده است که از آن جمله می­توان به روشی که اسپروت[41] (2000) برای محاسبۀ عمق خط انگلیسی ارائه داده است، اشاره کرد. وی تعداد 1169 کلمه را از یک فرهنگ لغت انتخاب کرده که املاء انگلیسی آمریکایی و نمود واجی مربوط به تلفظ انگلیسی آمریکایی معیار آن کلمات نیز آورده شده است. علاوه بر ذکر نمود واجی موجود در فرهنگ لغت که در واقع نمود روساختی محسوب می­شود، اسپروت بر اساس مدل اس­پی­ای[42] چامسکی[43] و هله[44]  (1968) نمود زیرساختی مربوط به آن کلمات را نیز بازسازی کرده است. وی تعدادی قاعده هم تحت عنوان قاعدۀ عمیق و قاعدۀ سطحی به کار برده است که از نظر تعداد با هم متفاوتند. بنابراین، در مورد هر کلمه در فهرست مذکور با توجه به قواعد عمیق و قواعد سطحی دو نمود واجی سطحی  و عمیق ارائه شده است و با توجه به تفاوت چشم­گیر نمودهای عمیق و سطحی، وی چنین نتیجه­گیری می­کند که نظام نوشتاری زبان انگلیسی عمیق در نظر گرفته می­شود. اسپروت نظام نوشتاری زبان روسی را نیز عمیق در نظر می­گیرد. وی چنین استدلال می­کند که در خط روسی به منظور ارائه تلفظ صحیح، خواننده باید از اطلاعات وا‍ژگانی و بافتی که کلمات در آن به کار برده شده­اند، استفاده کند.

 

4- عمق خط فارسی

 خط فارسی از نقطه نظر اطلاعات واجی موجود در آن تا حدی مطالعه شده است، اما روشی برای محاسبۀ عمق خط فارسی ارائه نشده است. در این بخش نگارنده روشی را برای تعیین عمق خط فارسی ارائه می­دهد. برای تعیین عمق خط فارسی، از تعبیر شهودی «دوری از یک­‌به­‌یک بودن» استفاده می‌شود و به‌ازای هر قطعه نوشتاری مشخصی که داده ‌شده، تعداد حالت‌های ممکن خوانده شدن آن قطعه و سهم آن در «عمیق کردن» پیکره محاسبه می‌شود. برای صورت‌بندی مسئله، فرض کنید پیکرۀ مرجع C داده شده باشد. مجموعۀ همۀ قطعه­های نوشتاری موجود در C با S نشان داده می­شود. به این ترتیب، مثلاً «مهر» عضوی از S است. در حالی که صورت‌های مختلفی از آن (مانند مِهر ، مُهر و مَهر) در C یافت می‌شوند.

• فراوانی قطعه­ای مانند s از عضوهای S با ν(s) نشان داده می­شود، و به صورت حاصل­‌جمع همه فراوانی‌های همه صورت‌های تلفظی s در C تعریف می‌شود.

• به ازای هر قطعه مانند s در S ، تعداد حالت‌های قابل قبول خواندن s با α(s) نشان داده می­شود و به صورت تعداد تلفظ‌های مختلف قطعه نوشتاری s در پیکره تعریف می‌شود (به عنوان مثال، 3 = (مهر) α) .

• به ازای هر قطعه مانند s در S ، تعداد حالت‌های «ممکن» تلفظ s با π(s) نشان داده می­شود و به صورت تعداد تلفظ‌های ممکن قطعه s تعریف می‌شود (به عنوان مثال، 12= (مهر) π) که شامل : /mehr/, / mohr/, / mahr/, / mehar/, / mehor/,  /meher/, / mohar/, / moher/, / mohor/ , / mahar/, / maher/ , / mahor/ می­باشد.

به این ترتیب، نسبت  میزان «ابهام» در تلفظ قطعه s ] = دوری از یک­‌به­‌یک بودن رابطۀ قطعه و تلفظ آن[ را نشان می‌دهد (به عنوان مثال، این نسبت برای <مهر >برابر 4 است، در حالی که برای< راز >برابر 1 است). به همین ترتیب، عبارت  سهم قطعه s را در کل ابهام نشان می‌دهد و در نتیجه، اندازه ابهام کل پیکره برابر است با

در فرمول فوق، مخرج کسر مجموع همۀ حالت­های خوانده شده قطعه­های نوشتاری موجود در پیکره می­باشد. به عنوان مثال، ممکن است در پیکره قطعۀ نوشتاری  <مهر >1000 بار با تلفظ /mohr/ ظاهر شده باشد، 2000 بار با تلفظ  /mehr/.  بنابراین برای همۀ قطعه­های نوشتاری موجود در پیکره، حالت­های تلفظی ظاهر شده مربوط به هر کدام درنظر گرفته می­شود. در پیکره برای محاسبه تعداد حالت­های «ممکن» تلفظ قطعه نوشتاری داده‌شده، می‌توان از این نکته استفاده کرد که  از آنجائی­که به لحاظ واج­شناختی در هر هجا / بخش،  یک واکه وجود دارد، بنابراین اگر بدانیم که چطور می‌توان یک قطعه را «بخش» کرد، تعداد حالت‌های ممکن تلفظ کل قطعه برابر است با حاصلضرب تعداد حالت‌های ممکن تلفظ هرکدام از «بخش»ها. اما، چون روش مشخصی برای تعیین این بخش‌ها وجود ندارد، مسئله تحویل می‌شود به تعیین مواضع احتمالی بخش کردن. اشکال کار این است که صِرف شکل پشت‌هم قرار گرفتن همخوان‌ها معیار مشخصی برای بخش­کردن قطعه به‌دست نمی‌دهد ـــ حتی قطعه‌هایی مانند >خرد< هم هستند که در زبان، هم به‌عنوان کلمه‌ای یک‌بخشی ظاهر می‌شوند و هم به‌عنوان کلمه‌ای دوبخشی. درواقع، تنها قاعدهٔ «قطعی» این است که همخوانی که بلافاصله پیش از واکه‌ای بلند قرار دارد، حتماً شروع بخشی جدید است (مثلاً، <الهام>، لزوماً به‌صورت <ال‍ + ‍هام> می‌شکند، هرچند که خود <ا> و<ل> ابتدای قطعه ممکن است به <ا + ل‍>  بشکند یا مجموعاً در یک بخش قرار گیرد <ال‍>). پس برای پیدا کردن مواضع «قطعی» بخش کردن، باید واکه‌های بلند را پیدا کنیم. اشکال کار، این است که نگاره­های <ی> و <و> می‌توانند نشانة همخوان /j/ برای نگارة<ی> و همخوان /v/ برای نگارة <و>، واکة کوتاه /o/ برای نگارة <و> یا واکة بلند /i/ برای نگارة <ی> و واکة بلند /u/ برای نگارة<و> باشند و باید این موضوع را هم در شمارش لحاظ کرد.

در نظام نوشتاری زبان فارسی تنها واکه­های بلند و همخوان­ها نمایش داده می­شوند. از آنجا که نوع واکة بلند ( <ا>، <ی>، <و> )  تأثیری در محاسبه تعداد هجاها ندارد، در محاسبه هرکدام از همخوان­ها را با c و هرکدام از واکه­های بلند با a نمایش داده می­شوند. به‌این ترتیب، قطعة نوشتاری <الهام> /Ɂelhɒm/ به cccac تبدیل می‌شود (به درج «بست چاکنایی» در ابتدای قطعه توجه کنید). از آنجا که همخوان قبل از واکة بلند در محاسبۀ تعداد حالت­های ممکن تلفظ قطعه تأثیری ندارد و با واکة بعدی در یک هجا قرار می­گیرد ، c قبل از a و خود a را با هم به صورت یک A نمایش داده می­شوند. همچنین از آنجایی­که همخوان پایان قطعۀ نوشتاری­ نیز تغییری در محاسبۀ تعداد حالت­های «ممکن» تلفظ آن قطعۀ نوشتاری ندارد ، همخوان پایانی با C نمایش داده می­شود تا از همخوا­ن­های دیگر متمایز شود. به‌این ترتیب، به‌ازای قطعة< الهام> (که به cccac تبدیل می‌شود) به ccAC می‌رسیم و قطعة نوشتاری <عقل> هم به ccC تبدیل می‌شود.

برای محاسبۀ تعداد حالت­های ممکن  تلفظ قطعه‌ای که واکۀ بلند ندارد، باید به این مسئله توجه کرد که همخوان پایانی در تعیین تعداد حالت­ها نقشی ایفا نمی­کند، بنابراین، قطعه‌ای مانند «عقل» در حقیقت دارای دو همخوان تعیین‌کنندهٔ تعداد حالت­های ممکن تلفظ این قطعۀ نوشتاری است. اگر Sn را تعداد تلفظ­های ممکن چنین قطعه‌ای در نظر بگیریم که در آن n تعداد cهای این قطعه است، به‌ازای قطعه­ای متشکل از یک c، مانند <در>، با در نظر گرفتن احتمال حضور سه واکۀ کوتاه بعد از همخوان اول در تلفظ نتیجه می‌شود که

3=1S.  بنابراین، سه حالت تلفظی ممکن برای این قطعۀ نوشتاری وجود دارد. به‌ازای قطعه‌ای متشکل از دو c، مانند <خرس>، با در نظر گرفتن احتمال حضور سه واکۀ کوتاه بعد از همخوان اول و احتمال حضور سه واکۀ کوتاه و ساکن بعد از همخوان دوم ، 12 حالت تلفظی ممکن وجود خواهد داشت؛ پس

12=4×3=2S و برای قطعه­ای متشکل از سه c ، مانند <کشتم>، اگر در تقطیع هجایی c اول را یک هجا در نظر بگیریم ( که به­طور بالقوه می­تواند با سه واکه­ی کوتاه همراه شود) و بقیهٔ قطعه را به طور مجزا به عنوان  قطعه­ای دیگر ( که به  2S حالت خوانده می‌شود)  در نظر بگیریم ، 36 حالت به‌دست می‌آید و اگر دو c اول را یک هجا  و بقیۀ قطعه را هم یک قطعه در نظر بگیریم، 9 حالت دیگر به حالت­های قبل اضافه می­شود. به‌این ترتیب، در کل 45 حالت تلفظی ممکن برای چنین قطعه­هایی  می­توان تصور کرد که یعنی45=9+36=3S در حالت کلی، به‌دلیل الگوی هجایی زبان فارسی، نمی‌توان هجایی داشت که از بیش از سه c متوالی تشکیل شده باشد؛ پس بسته به این­که چه تعدادی از cهای ابتدایی در هجای اول قرار می‌گیرند می‌توان نوشت:

3Sn-3+Sn-23+  Sn-13=Sn

حال قطعه­ای را تصور کنید که در آن به غیر ازتعدادی c، A هم وجود دارد. در این­صورت یا A خودش یک هجا محسوب می­شود و بقیۀ قطعه n تا c است و یا A روی یک یا دو c بعد از خود اثر می‌گذارد و آن­ها را ساکن می­کند؛ بنابراین، درمورد قطعه­ای مانند «بناپارت» مراحل تقطیع هجایی به این صورت خواهد بود:

  ccacacc          بناپارت

  cAAcC       با حذف cهای قبل از a و بی­تأثیر بودن c پایانی در شمردن حالت­ها

بنابراین، با در نظر گرفتن این­که سه واکۀ کوتاه می­تواند با c اول همراه شود ( 3=1S) و جدا کردن A به عنوان یک هجا (که فقط به یک حالت خوانده می‌شود) و AcC به عنوان مرز شروع هجا یا هجاهایی دیگر، نهایتاً به

12=(1+3)×3 حالت ممکن تلفظی می‌رسیم.

پیکرهٔ مورد استفاده در این تحقیق متنی بود تحت عنوان >مرغ آتش­خوار< از کتاب فارسی پنجم دبستان که فراوانی، تعداد تلفظ­های ممکن و تعداد تلفظ­های قابل قبول قطعه­های نوشتاری موجود در این پیکره محاسبه شد. به عنوان مثال برای جمله « یک روز یکی از بزرگان از سفری برگشته بود» موارد فوق بدین صورت محاسبه شد:

تعداد حالت­های قابل قبول تلفظی

تعداد حالت­های ممکن تلفظی

فراوانی

قطعۀ نوشتاری

1

3

1

یک

1

13

4

روز

1

3

5

یکی

1

3

19

از

1

45

1

بزرگان

2

57

1

سفری

1

711

1

برگشته

2

13

11

بود

 و در فرمول ارائه شده (یعنی  که قبلاً دیدیم) برای اندازه­گیری سهم هر کدام از قطعه­ها در ابهام متن قرار داده شدند و در نهایت، اندازة ابهام کل پیکره با توجه به فرمول  به‌دست آمد. نتیجه دور از انتظار، عدد 7/87 است که نشان می‌دهد ارتباط نظام نوشتاری زبان فارسی با زبان گفتاری، به‌میزان قابل توجهی از «تناظر یک ‌به‌ یک» دور است و به‌این ترتیب، نظام نوشتاری زبان فارسی را باید عمیق در نظر گرفت.

محدودیت­های حاکم بر این محاسبه شامل لحاظ نکردن تشدید و کسرۀ اضافه می­باشد، سؤال مطرح در این مبحث این است که آیا در نظر گرفتن این موارد تأثیری در نتیجه­گیری نهایی مبنی بر درنظر گرفتن نظام نوشتاری زبان فارسی به عنوان نظامی عمیق دارد؟ در پاسخ به این سؤال باید گفت عدد 7/87 آنقدر از عدد یک دور است که لحاظ کردن مواردی از قبیل کسرۀ اضافه و تشدید باعث بالاتر رفتن این عدد و در نهایت افزایش بیشتر عمق نظام نوشتاری زبان فارسی می­شود. زیرا تایپیست­ها از تایپ نگاره­های وابسته معمولا خودداری می­کنند. با در نظر گرفتن چنین عمق زیادی برای خط فارسی، این سؤال مطرح می­شود که چگونه گویشوران زبان فارسی قادر به خواندن خط فارسی هستند؟ به نظر می­رسد در فرآیند خواندن، گویشوران زبان فارسی از اطلاعات زبانی خود استفاده می­کنند و بدینوسیله عمق خط فارسی را کم می­کنند. این اطلاعات زبانی شامل اطلاعات تکواژی، قواعد حرف­نویسی مربوط به اضافه شدن وندها به ستاک که در مرز تکواژها عمل می­کنند، آشنایی با صورت نوشتاری و تلفظ کلماتی که منشأ عربی دارند استفاده از قیاس با تلفظ­ها و صورت­های نوشتاری در واژگان ذهنیشان است.

بنابراین می­توان نتیجه گرفت که عدد 7/87 که بدون لحاظ کردن چنین اطلاعات زبانی بدست آمده- یک حد بیشینه برای عمق خط فارسی است و گویشوران زبان فارسی با استفاده از اطلاعات زبانی عمق خط فارسی را کم می­کنند.

 

 

 

5- نتیجه­

در این بخش سعی بر آن است که به سؤال مطرح­شده در تحقیق پاسخ داده شود. همانگونه که ذکر شد در یک نظام نوشتاری آرمانی، رابطۀ یک­­به­یک میان نشانه­های نوشتاری و واج­ها وجود دارد. برای بررسی میزان نزدیکی نظام نوشتاری زبان فارسی به نظام نوشتاری آرمانی ابتدا نظام نوشتاری زبان فارسی به تفصیل بررسی شد. با توجه به عدم حضور واکه­های کوتاه در نظام نوشتاری زبان فارسی، وجود علائم زیروزبری که نگاره­های وابسته محسوب می­شوند، رابطۀ­ نگاره و واج ( چند­به­یک و یک­به­چند) و وجود ساختار<خو> که به صورت [xɒ] و یا [xavɒ] تلفظ می­شود و محاسبۀ به عمل آمده برای تعیین عمق خط فارسی( عدد 7/87  که بسیار دور از عدد یک است)، می­توان گفت نظام نوشتاری زبان فارسی، نظامی عمیق است و بدین ترتیب از نظام نوشتاری آرمانی دور است. عدد بدست­آمده از محاسبۀ عمق خط فارسی بدون در نظر گرفتن اطلاعات زبانی است که گویشوران زبان فارسی در فرآیند خواندن استفاده می­کنند و همانگونه که ذکر شد، عدد حاصل یک حد بیشینه است و گویشوران زبان فارسی با استفاده از اطلاعات زبانی مانند اطلاعات تکواژی، آشنایی با صورت نوشتاری وندهای تصریفی و اشتقاقی، دانستن قواعد حرف­نویسی مربوط به اضافه شدن وندها به ستاک که در مرز تکواژها عمل می­کنند، آشنایی با صورت نوشتاری و تلفظ کلماتی که منشأ عربی دارند و استفاده از قیاس با کلمات موجود در واژگان ذهنی خود، سعی در کم کردن عمق خط فارسی دارند تا بدین­ترتیب بتوانند کلمات نوشتاری را که اولین بار با آنها مواجه می­شوند، بدرستی بخوانند. همچنین سیستم­های نوشتار به گفتار از این رهگذر قادر خواهند بود کلمات نوشتاری را که در واژگان خود ندارند، بدرستی به رشته واج­ها تبدیل کنند. نویسندگان در تحقیقات آتی خود با استفاده از اطلاعات واجی، ساخت­واژی و نحوی در نظام نوشتاری فارسی به مطالعه کاهش عمق خط فارسی خواهند پرداخت تا از این رهگذر بتوان بازشناسی صورت واجی نوواژه­ها را تبیین کرد.



[1].Tim Buckwalter

[2].Antal Van den Bosch

[3].Alain Content

[4].Walter Daelemans

[5].Beatrice de Gelder

[6].Eleanor J. Gibson

[7].Anne Pick

[8].Harry Osser

[9].Marcia Hammond

[10].Richard Venezky

[11].Robert  L. Trammel

[12].out of vocabulary words

[13].transliteration

[14].grapheme

[15].orthographic depth

[16].letter

[17].Rogers

[18].diacritics

[19].character

[20].free  graphemes

[21].bound  graphemes

[22].consonantal  graphemes

[23].vowel  graphemes

[24].homographs

[25].diacritics

[26].vocalization

[27].Ezafe construction

[28].nunation

[29].gemination

[30].non-vocalization

[31].hamzetization

[32].allograph

[33].enclitic

[34].Zero-width non-joiner

 نشانه کنترل کننده­ایست که در محل اتصال تکواژ به ستاک به­کار برده می­شود تا تکواژ و ستاک به هم وصل شوند و یک کلمه نوشتاری بسازند

[35].Esfahbod

[36] ligature

[37] El-Imam

[38] single unicode character

[39].Pisowicz

[40].morphophoneme

[41].Sproat

[42].SPE

[43].Chomsky

[44].Halle

دانای طوس، مریم. 1384. اثرات شفافیت و تیرگی خط فارسی بر مهارت زبان خواندن کودکان طبیعی و خوانش­پریش رشدی فارسی زبان. رساله دکتری، دانشگاه تهران.
 
Buckwalter,T. 2004. Issues in Arabic orthography and morphology analysis. In computational approaches to Arabic script-based languages in conjunction with COLING 2004. Switzerland.
El_Imam,Y. 2003. Phonetization of Arabic: rules and algorithms. Computer speech and language.18(2004):339-373. Elsvier Ltd. 
Esfahbod,B. 2004. Persian computing with unicode.          
In
25th internationalization and unicode conference,            
Washington, DC.
Gibson, E.J., A. Pick, H. Osser, and M. Hommond, 1962. The role of grapheme-phoneme correspondence in the perception of words. The American journal of psychology, Vol.75, No.4: 554-570.  
Megerdoomian, K. 2004. Finite state morphological analysis of Persian. In computational approaches to Arabic script-based languages. Switzerland.
Pisowicz, A. 1985. Origins of the new and middle Persian            phonological system.   Nakladem Uniwersytetu Jagiellonskiego.
Rogers,H. 2005. Writing systems: A linguistics approach. MA: Blackwell  textbooks in linguistics. Blackwell publishing.
Sproat,R. 2000. A computational theory of writing systems.    Cambridge University Press. Stanford, CA.    
 Trammel, R.L. 1990. Varieant grapheme-phoneme correspondences in unfamiliar polysyllabic words. Language and speech. 33(4): 293-323.
 Van den Bosch, A., A. Content, W. Daelemans, and B. De Gelder, 1994. Analysing orthographic depth of different languages using data-oriented algorithms. In 2nd international conference on quantitative linguistics. Moscow.
Venezky, R.L. 2004. In Search of the perfect orthography. Written language and literacy :139-163. Amsterdam. John Benjamins publishing company.