نوع مقاله : مقاله پژوهشی
نویسنده
دانشیار پژوهشکده پردازش هوشمند علائم
چکیده
در این مقاله، کارآیی واجهای گفتار فارسی از نظر بازشناسی گوینده مورد مطالعه و پژوهش قرار گرفته و با توجه به میزان کارآییها، رتبهبندی واجها صورت گرفتهاند. جهت برآورد کارآیی واجها، از یک معیاری که بهصورت نسب « فاصلة بینگویندهای» واجها به « فاصلة در گویندهای» تعریف شده است و ما آن را « نسبت تأثیرپذیری گوینده » نامیدهایم، استفاده شده است. آزمایشها و محاسبات لازم برای کلیه واجهای گفتار فارسی (باستثنای واج /À/) با استفاده از دادگان گفتار فارسی « فارسدات» انجام شده و رتبهبندیها براساس نتایج آزمایشها و محاسبات هم در مورد دستههای کلی واجی و هم برای تکتک واجها صورت گرفتهاند. نتایج آزمایشها و محاسبات نشان دادهاند که در رتبهبندی دستههای کلی واجی، واکهها و نیمواکهها در رتبهی اول، خیشومیها، سایشیها و روانها در رتبه دوم و انسدادیها و انفجاریها در رتبه سوم از نظر کارآیی در بازشناسی گوینده قرار دارند. رتبهبندی تک تک واجها نیز نشان میدهد که واج /∂/ در رتبه اول و واج /t/ در رتبهی آخر از نظر کارآیی در بازشناسی گوینده قرار میگیرند. نتایج این تحقیق در مقایسه با نتایج پژوهشهای انجام شده در مورد برخی از زبانهای دیگر نظیر انگلیسی، آلمانی و دوچ از نظر رتبهبندی دستههای کلی واجی سازگاری بالایی دارد اما از نظر جزئیات رتبهبندیها، تفاوتهای قابل توجهی ملاحظه میشود.
کلیدواژهها
عنوان مقاله [English]
Ranking of Persian Speech Phonemes from the Point of View of Efficiency in Speaker Recognition
نویسنده [English]
- Javad Sheykhzadegan
Associate Professor of Research Center of Intelligent Signal Processing
چکیده [English]
In this paper, the efficiency of Persian speech phonemes from the point of view of efficiency in speaker recognition has been studied, and then with due attention to efficiencies, the ranking of phonemes has been done. For estimating the efficiencies of phonemes, we have introduced one criterion that has been defined in the form of phonemes “Inter speaker distance” to “Intra speaker distance” ratio, referred to as “Speaker Affectability Ratio: SAR”. The necessary experiments and computations have been done for all Persian speech phonemes (with the exception of /À/) using the Persian speech database “Farsdat” and then on the basis of the results of these experiments and computations, the ranking of single phonemes and phoneme groups has been done. The results have shown that in the phoneme groups ranking, vowels and semi-vowels are first, nasals, fricatives and liquids are second and, obstructions and plosives are third from the point of view of efficiency in speaker recognition. Likewise, the ranking of single phonemes shows that the phoneme /∂/ is first and the phoneme /t/ is last from the point of view of efficiency in speaker recognition. The results of this research in line with research on other spoken languages such as English, Germanic and Dutch show high agreement for phoneme groups ranking but noticeable differences in details of rankings are also noted.
کلیدواژهها [English]
- phonemes ranking
- Persian speech
- phonemes efficiency
- speaker recognition and speaker affectability ratio