نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانش آموخته کارشناسی ارشد گروه زبان‌شناسی رایانشی، مرکز زبان‌ها و زبان‌شناسی، دانشگاه صنعتی شریف

2 دانش آموخته دکتری زبان‌شناسی، دانشگاه تهران

3 استادیارگروه رایانه، دانشگاه علامه طباطبائی

چکیده

ساخت اضافه همواره در نظریه‎های مختلف زبان‎شناسی نظیر آوایی، ساختواژی و نحوی حائز اهمیت بوده است و زبان‎شناسان ایرانی تاکنون تحلیل‎های متفاوتی از این ساخت به دست داده‎اند. عدم تظاهر کسرۀ اضافه در نوشتار، ابهامات بسیاری را در تحلیل و درک متون فارسی موجب شده است و برنامه‌های مختلف پردازش زبان اعم از برچسب‌زن اجزای کلام، تشخیص موجودیت‌های نام‌مند، تشخیص کلمات هم‌مرجع، تبدیل متن به گفتار، ترجمة ماشینی، تجزیة نحوی جملات و غیره را با چالش‌های بسیاری روبرو ساخته است. به همین روی، شناسایی جایگاه این عنصر از مهم‎ترین چالش‎های پردازش متون زبان فارسی به‎شمار می‎رود. پژوهش حاضر می‎کوشد تا به شیوه‎ای تحلیلی و پیکره‎بنیاد و از منظر دستور وابستگی به بررسی ساخت اضافه بپردازد. از آنجا که دستور وابستگی به لحاظ سادگی، استفاده کم از فضای حافظه رایانه و تسریع در امر پردازش در مطالعات پردازش متن در حوزة زبان‎شناسی رایانشی از اهمیت چشمگیری برخوردار است، بهترین پایگاه نظری را برای این دست مطالعات فراهم می‌آورد. به همین سبب، پژوهش حاضر در تلاش است تا با استفاده از این دستور روشی قاعده‌مند جهت تشخیص کلمات حاوی نشانۀ کسرۀ اضافه در متون فارسی ارائه دهد. بدین منظور، با ارائة کلیة ساخت‌های نمونه‌ای که حاوی نشانة اضافه هستند و از پیکرة وابستگی زبان فارسی دانشگاه اوپسالا استخراج شده‌اند، در چارچوب دستور وابستگی به تجزیه و تحلیل آن‌ها خواهیم پرداخت. از رهگذر این بررسی، تنها هفت قاعدۀ منطقی برای درج کسرۀ اضافه در گروه‌های غیرفعلی اعم از گروه‎های اسمی، صفتی، حرف‎ اضافه‎ای، قیدی، گروه‌هایی با بیش از یک وابستة پسین، گروه‌هایی با بیش از یک وابسته از نوع گروه و ساخت‌های همپایه استخراج می‎شود که با استناد به آن‌ها می‎توان در انواع پیکره‌های وابستگی و سامانه‎های رایانه‎ای مبتنی بر تجزیة وابستگی به شناسایی جایگاه نشانۀ اضافه پرداخت. افزون ‌بر این، در این پژوهش به جایگاه‌های نشانة اضافه‌‌ای نیز اشاره خواهد شد که تاکنون در پژوهش‌های نظری و رایانه‌ای پیشین به‌ آن‌ها پرداخته نشده است.

کلیدواژه‌ها

عنوان مقاله [English]

The Corpus-Based Study of Ezafe Construction in Persian

نویسندگان [English]

  • minoo nassajian 1
  • Razieh Shojaei 2
  • Mohammad Bahrani 3

1 M.A. Graduate in Computational Linguistics, Languages and Linguistics Center, Sharif University of Technology

2 Ph.D. Graduate Linguistics, University of Tehran

3 Assistant professor, Department of Computer, Allameh Tabataba’i University

چکیده [English]

Ezafe construction is considered as one of the most important issues in various linguistic theories including phonetics, morphology and syntax and many Iranian linguists have analyzed this phenomenon from these different aspects. Ezafe marker is usually not written in Persian text. So, not only does it result in a high degree of ambiguity in reading, analyzing, and understanding Persian documents, but also it causes serious difficulties for a large number of natural language processing tasks (NLP) such as part-of-speech (POS) tagging, Named-Entity Recognition (NER), Co-reference Resolution, Converting Text to Speech, Machine Translation, syntactic parsing and so on. As a result, determining the positions of Ezafe in a given sentence is viewed as a controversial and challenging issue especially in these applications. Using a corpus-based analysis and dependency grammar, the current paper sets to study Ezafe positions. Due to the fact that dependency grammar applies a simple parsing, uses low memory and speeds up computer operations, this grammar is regarded as one of the important and practical grammars in the field of computational linguistics. Accordingly, this study will use a rule-based method within this framework to recognize Ezafe positions. For this purpose, all Ezafe constructions which are provided in Uppsala Persian Dependency Corpus (UPDC) are analyzed based on dependency relations. In the next step, only seven Ezafe rules are formulated consisting of such non-verbal phrases as noun phrases, adjective phrases, prepositional phrases, adverb phrases, phrases with more than one post-modifier, phrases with more than one post-modifier as a phrase and co-ordinations. The proposed rules can be used in Persian dependency corpora and a great number of language processing tasks which are based on dependency relations. In addition, in the present research, Ezafe positions which have not been mentioned in previous theoretical and computational studies will be elaborated.

کلیدواژه‌ها [English]

  • Ezafe Marker
  • Ezafe Construction
  • Ezafe Insertion Rules
  • Dependency Grammar
  • Persian Text Processing
ابوالقاسمی، محسن (1375). دستور تاریخی زبان فارسی، (چاپ اول)، تهران، سمت.
باطنی، محمدرضا (1389). توصیف ساختمان دستوری زبان فارسی بر بنیاد یک نظریة عمومی زبان. (چاپ بیست و دوم). تهران: امیرکبیر.
بی‌جن‌خان، محمود (1382). کسرة اضافه از دیدگاه معنایی، جشن‌نامة دکتر علی‌اشرف صادقی، صص 253-229.
بی‌جن‌خان، محمود (1387). امکان‌سنجی برای تجزیه و تحلیل کسرة اضافة زبان فارسی، با روش تطبیق الگو، تهران، پژوهشگاه فرهنگ، هنر و ارتباطات.
خانلری، پرویز (1377). تاریخ زبان فارسی، تهران، فردوس.
راستارگویوا، وراسرگی یونا  (1347). دستور زبان فارسی میانه، (مترجم: ولی‌الله شادان)، تهران، بنیاد فرهنگ ایران.
طباطبائی، علاءالدین (1382). اسم و صفت مرکب در زبان فارسی، تهران، مرکز نشر دانشگاهی.
طبیب‌زاده، امید (1393). دستور زبان فارسی بر اساس نظریة گروه‌های خودگردان در دستور وابستگی، (چاپ دوم)، تهران، نشر مرکز.
فرشیدورد، خسرو (1388). دستور مختصر امروز بر پایة زبانشناسی جدید، تهران، سخن.
لازار، ژیلبر (1389). دستور زبان فارسی معاصر، ترجمة مهستی بحرینی، تهران، انتشارات هرمس.
محمدی بلبان آبادی، صادق (1387). رویکردی کمینه‌گرا به ساخت اضافه در کردی (گویش سوران)، پایان‌نامة کارشناسی ارشد، دانشگاه کردستان.
محمودی بختیاری، بهروز (1389). ترکیب‌های نحوی در زبان فارسی، رشد آموزش زبان و ادب فارسی. شمارة 93: 32-37.
مشکوة‌الدینی، مهدی (1370). دستور زبان فارسی بر پایة نظریة گشتاری، (چاپ دوم)، خراسان رضوی، انتشارات دانشگاه فردوسی مشهد.
معین، محمد (1394). اضافه، تهران، صدای معاصر.
یاراحمدزهی، ناهید. (1381). ساخت درونی گروه اسمی گویش بلوچی سرحدی بر اساس نظریة ایکس-تیره، رسالة کارشناسی ارشد، دانشگاه تهران، ایران.
Abolghassemi, M. 1996. A historical grammar of the Persian language. (first edition). Tehran: Samt. [In Persian].
Asgari, H., J., Maleki and H., Faili. 2014. A Probabilistic Approach to Persian Ezafe Recognition. Proceedings of the 14th Conference of the European Chapter of the Association for Computational Linguistics.
Bateni, M. R. 2010. The description of grammatical structure of Persian language based on a general theory of language. (Twenty-second edition). Tehran: Amirkabir. [In Persian].
Bauer, L. 1983. English Word-Formation. Cambridge: Cambridge University Press.
Bijankhan, M. 2003. Ezafe from semantic approach. Festschrift for prof Dr. A. A. Sadeghi: pp. 229-253. [In Persian].
Bijankhan, M. 2008.  A Feasibility Study for Analysis of Ezafe in Persian Using Pattern Matching. Tehran: Research Center for Culture, Art and Communication. [In Persian].
Brown, K. and J., Miller. 2013. The Cambridge Dictionary of Linguistics. Cambridge University Press.
Chomesky, N. 1993. A minimalist program for linguistic theory. The View from Building 20. Ed. By K. Hale and S. Keyser. Cambridge: MIT Press: 1-52.
Covington, M. A. 2001. “A Fundamental Algorithm for Dependency Parsing”. Proceedings of the 39th Annual ACM Southeast Conference: 1-8.
Farshidvard, K. 2008. The concise grammar based on modern linguistics. Tehran: Sokhan. [In Persian].
Ghayoomi, M. and S., Müller. 2010. PerGram: A TRALE implementation of an HPSG fragment of Persian. In Computer Science and Information Technology (IMCSIT), Proceedimgs of the 2010 International Multiconference on: 461-467.
Ghomeshi, J. 1996. Projection and Inflection: A study of Persian phrase structure. PhD Dissertation. Department of Linguistics, University of Toronto: Canada.
Ghomeshi, J. 1997. Non-projecting Nouns and the Ezafe Construction in Persian. Natural Language and Linguistic Theory 15: 729-788.
Hashemipour, M. 1989. Pronominalization and Control in Modern Persian. PhD dissertation, University of California at San Diego.
Holmberg, A. and D. Odden. 2005. The Noun Phrase in Hawramani. Paper presented at the First International Conference on Iranian Linguistics: Leipzig.
Kahnemuyipour, A. 2000. Persian Ezafe Construction Revisited: Evidence for Modifier Phrase. In John T. Jensen, J. T., van Herk, G. (Eds.), Cahiers Linguistique d’Ottawa, proceedings of the 2000 annual conference of the Canadian Linguistic Association: pp.173-185.
Kahnemuyipour, A. 2006. Persian Ezafe construction revisited: Evidence for modifier phrase. In Proceedings of the annual Conference of the CanadianLinguistic Association: pp. 17–185.
Kahnemuyipour, A. 2014. Revising the Persian Ezafe construction: A roll-up movement analysis. Lingua: pp. 1-24.
Kahnemuyipour, A. 2016. The Ezafe Construction: Persian and Beyond. ConCall-2, Indiana University..
Karimi, S., and M., Brame. 1986. A Generalization Concerning the Ezafe Construction in Persian. Paper presented at Western Conference on Linguistics: Canada.
Karimi, Y. 2007. Kurdish Ezafe Construction: Implications for DP Structure, Lingua 177: 2159-2177.
Khanlari, P. 1998. The history of Persian language. Tehran: Ferdows. [In Persian].
Larson, R. 2009. “Chinese as a Reverse Ezafe Language”. Yuyanxue Lancong (Journal of Linguistics): 39. Peking University, Beijing, pp. 30-85.
Larson, R. and H., Yamakido. 2005. Ezafe and the Deep Position of Nominal Modifiers. Paper presented at the Barcelona Workshop on Adjectives and Adverbs: Universitat Pompeu Fabra.
Larson, R. and H., Yamakido. 2006. Zazaki “Double Ezafe” as double case-marking. Paper presented at the Linguistics Society of America Annual Meeting, Aluquerque, NM.
Larson, R., Yamakido, H. 2008. Ezafe and the Deep Position of Nominal Modifiers. In: McNally, L., Kennedy, C. (Eds.), Adjectives and Adverbs: Syntax, Semantics and Discourse. Oxford: Oxford University Press, 43-70. 
Lazard, G. 2010. Grammaire du persian contemporain. (Translator: M. Bahreyni). Tehran: Hermes. [In Persian].
Lotfi, A. R. 2014. Persian Ezafe as a “figure” marker: A unified analysis. Colifornia Linguistic Notes, 39:1.
Mahmoodi Bakhtari, B. 2010. Word combination in Persian. The Development of Persian Teaching and Literature Journal. No. 93: pp. 32-37. [In Persian].
Mahootian, S. 1993. A Null Theory of Code-switching. PhD dissertation. Northwestern University, Illinois.
Megerdoomian, K. 2000. Persian Computational Morphology: A Unification-Based Approach. Memoranda in Computer and Cognitive Science MCCS-00-320, Computing Research Lab, New Mexico State University.
Meshkatod Dini, M. 1991. Introduction to Persian Transformational Syntax. (second edition). Razavi Khorasan: Ferdowsi University Press. [In Persian].
Moein, M. 2015. Ezafe. Tehran: Sedaye Moaser. [In Persian].
Mohammadi Bolbolan Abadi, S. 2009. A minimalist approach to Ezafe constructions in Kurdish language (Sorani dialect). MA thesis. Kurdistan University. [In Persian].
Moinzadeh, A. 2001. An Antisymmetric, Minomalist Approach to Persian Phrase Structure. PhD dissertation. University of Ottawa.
Moinzadeh, A. 2006. The Ezafe Phrase in Persian: How Complements are added to N˚s and A˚s. Journal of Social Sciences & Humanities of Shiraz University Vol. 23, No. 1.
Nojoumian, P. 2011. Towards the Development of an Automatic Diacritizer for the Persian Orthography based on the Xerox Finite State Transducer. PhD dissertation. Ottawa: Canada.
Oskouipour, N. 2011. Converting text to phoneme stream with the ability to recognizing Ezafe marker and homographs applied to Persian speech synthesis. Msc. Thesis, Sharif Universityof Technology: Iran.
Palmer, A. 1971.The EZAFE Construction in Modern Standard Persian. PhD Dissertation, University of Michigan: USA.
Rastorqueva, V. S. 1968.Dastūr-i zabān-i Fārsī-i miyānah. (Translator: W. Shadan). Tehran: Iranian Culture Foundation. [In Persian].
Samiian, V. 1983.Origins of Phrasal Categories in Persian, an X-bar Analysis. PhD Dissertation: UCLA: USA. 
Samiian, V. 1994.The Ezafe Construction: Some Implications for the Theory of X-bar Syntax. In: Marashi, M. (Ed.). Persian Studies in North America, Betheda, MD: Iranbooks, 17-41. 
Samvelian, P. 2005.When morphology does better than Syntax: The Ezafe construction in Persian.
Samvelian, P. 2008.The Ezafe as a Head-marking Inflectional Affix: Evidence from Persian and Kurmanji Kurdish. In: Karimi, S., Samiian, V., and Stilo, D. (Eds.). Newcastle upon Tyne: Cambridge Scholars Publishing: 339-361.
Seraji, M. 2015. Morphosyntactic Corpora and Tools for Persian. Uppsala Universitet: Sweden.
Shamsfard, M. 2011. Challenges and Open Problems in Persian Text processing. Proceedings of LTC.
Shamsfard, M. and S., Noferesti. 2014. A Hybrid Algorithm for Recognizing the Position of Ezafe Constructions in Persian Texts. International Journal of Interactive Multimedia and Artificial Intelligence Vol. 2, N. 6:17-25.
Tabaian, H. 1974. Conjunction, Relativization and Complement in Persian. PhD dissertation. University of Colorado.
Tabatabaei, A. 2003.Compound nouns and adjectives in Persian language. Tehran: Iran University Press. [In Persian].
Tabibzadeh, O. 2014. Persian Grammar. Tehran: Markaz. [In Persian].
Tesnière, L. 1953. Esquisse d’une Syntaxe structural. Paris: Klincksieck.
Toosarvandi, M. and C. van Urk. 2014. The syntax of nominal concord: what ezafe in Zazaki shows us. In proceedings of NELS 43, eds. Hsin-Lun Hung, Ethan Poole, ans Amanda rsyling, Volume 2, 209-220. Amherst: GLSA.
Yarahmadzahi, A. 2002. The internal structure of noun phrases in Sarhad Balochi dialect based on X-bar theory. MA thesis. University of Tehran. [In Persian].