نوع مقاله : مقاله پژوهشی
نویسندگان
1 استادیار گروه زبانشناسی، دانشکده زبانهای خارجی، دانشگاه اصفهان، اصفهان، ایران.
2 دانشیار گروه زبان شناسی، دانشکده زبان های خارجی، دانشگاه اصفهان، اصفهان، ایران.
چکیده
مشخصه های ریتم گفتار بر اساس دیرش مناطق همخوانی، واک های و نیز هجا می توانند گویشوران یک زبان خاص را از هم تمیز دهند. با وجود این، ریتم یک سیگنال آوایی تنها بر مبنای روابط دیرشی میان مناطق آوایی آن استوار نیست بلکه به تفاوت های مربوط به الگوی شدت در آنها نیز بستگی دارد. پارامتر آکوستیکی شدت تا حد زیادی تحت تأثیر الگوهای حرکتی اندام های گفتار مانند حرکت لبها و باز و بسته کردن دهان است. بنابراین انتظار میرود تفاوت های فردی در حرکت های اندام های گویایی و نیز تفاوتهای آناتومیکِ مربوط به ساختار دستگاه آوایی افراد منجر به تغییر توزیع انرژی در سطح سیگنال و در نتیجه تغییر مقادیر شدت در سیگنال های آوایی افراد شود. در پژوهش حاضر قصد داریم با استفاده از ابزارهای آواشناسی آزمایشگاهی و با رویکرد تشخیص هویت گوینده پارامترهای اکوستیکی ریتم گفتار را بر مبنای مشخصه های شدت-بنیاد در زبان فارسی بررسی کنیم. هدف این پژوهش بررسی توانایی پارامترهای شدت-بنیاد در سطح هجا جهت تشخیص هویت گویندگان فارسیزبان است. دو دسته از پارامترهای شدت-بنیاد یکی بر مبنای میانگین شدت هجا (stdevM, varcoM, rPVIm, rPVIm) و دیگری بر مبنای شدت قلۀ هجا (stdevP, varcoP, rPVIp, nPVIp) برای بررسی و تحلیل داده ها انتخاب شد. صدای دوازده گویشور مرد فارسیزبان در محیط آزمایشگاهی و در دو نوبت مجزا به فاصلۀ یک تا دو هفته ضبط شد. نمونههای آوایی با استفاده از برنامۀ Praat ویرایش 34، 2، 5 مورد تجزیهوتحلیل آکوستیکی قرار گرفت و تحلیل آماری دادهها و مقادیر بهدستآمده از بررسی آکوستیکی نمونههای آوایی با استفاده از نرمافزار SPSS ویرایش 0/21 و نرمافزار R ویرایش 3. 3. 3 صورت گرفت. نتایج نشان داد پارامترهای آکوستیکی ریتم گفتار بر مبنای نوسانات شدت نقش بسزایی در تشخیص هویت گویندگان فارسیزبان دارند. افزون بر آن، مشخصههای زبان-ویژه تأثیری در توانایی این پارامترها در تشخیص هویت گوینده ندارند. همچنین نتایج حاکی از آن بود که پارامترهای مبتنی بر شدت قلۀ هجا ویژگیهای فرد ویژۀ بیشتری را انعکاس میدهند.
کلیدواژهها
عنوان مقاله [English]
Speech Rhythm Measures: Acoustic Cues for Speaker Identification
نویسندگان [English]
- Homa Asadi 1
- Batool alinezhad 2
1 Assistant Professor of Linguistics, University of Isfahan, Isfahan, Iran.
2 Associate Professor of Linguistics, University of Isfahan, Isfahan, Iran.
چکیده [English]
Rhythmic characteristics of speech based on consonantal and vocalic intervals as well as syllabic intervals vary between speakers of the same language. Nonetheless, the rhythmicity of a speech signal is not solely dependent on the durational variability of phonetic intervals but it is also associated with the variability of the intensity patterns as well. Acoustic parameter of intensity is largely determined by the articulatory behaviors of the speech organs such as lip movement or mouth aperture. Therefore, it is plausible that speaker idiosyncrasy in movement of speech articulators and anatomical differences in individual’s vocal tracts may influence the energy distribution across a speech signal which subsequently leads to the variability in the values of the intensity measures. Using experimental phonetics tools and from an explicitly speaker-specific perspective, the present research attempts to explore potential speaker-specific acoustic parameters of speech rhythm which are extracted from the intensity contours across Persian speakers. This research aims to discover whether intensity-based measures of speech rhythm are able to discriminate between speakers in Persian. Two types of acoustic rhythmic measures based on the mean syllable intensity (stdevM, varcoM, rPVIm, nPVIm) and peak syllable intensity (stdevP, varcoP, rPVIp, nPVIp)) were selected for this study. Speech data from 12 Persian male speakers were recorded non-contemporaneously in laboratory environment on two different occasions separated by one to two weeks. Speech tokens were acoustically measured with PRAAT version 5.2.34 and statistical analyses were carried out with SPSS version 21 and R version 3.3.3. Results of the study indicated that speech rhythm measures based on intensity fluctuations play an important role in between-speaker rhythmic variability. In addition, discriminatory power of intensity-based measures is not affected by the language-dependent characteristics of Persian. The results also showed that the peak syllable intensity measures carry more speaker-specific information compared to the mean syllable intensity measures
کلیدواژهها [English]
- Experimental phonetics
- intensity-based measures
- speaker identification
- speech rhythm
- between-speaker variability