This article has been corrected. See "Erratum to: Acoustic characteristics of the sustained vowel phonation according to age groups" (Vol: 11, Issue:1, Page: 63)
Phonetics

모음 연장 발성이 보이는 연령대별 음향음성학적 특성 연구*

서윤정1, 신지영1,*
Yoon-Jeong Seo1, Jiyoung Shin1,*
Author Information & Copyright
1고려대학교
*Corresponding Author : shinjy@korea.ac.kr

ⓒ Copyright 2018 Korean Society of Speech Sciences. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: Oct 31, 2018 ; Revised: Dec 10, 2018 ; Accepted: Dec 11, 2018

Published Online: Dec 31, 2018

ABSTRACT

This study was performed to investigate acoustic characteristics of sustained vowels produced by Seoul Korean speakers. For this study, three hundred nine healthy adults were chosen as participants from Korean Standard Speech Database. These subjects were divided into five chronological age groups (20s, 30s, 40s, 50s, 60–70s) and two gender groups (male and female). Fundamental frequency (f0), jitter, shimmer, and NHR (noise-to-harmonics ratio) was measured with 8 Korean vowels (/ɑ/, /æ/, /ʌ/, /e/, /o/, /u/, /ɯ/, /i/) by using Praat. The results showed that the vowel type significantly affected all acoustic parameters. Gender affected f0, jitter, and NHR significantly. The mean female speakers’ f0 was greater than the males’, and the mean jitter and NHR of male speakers was greater than the females’. Moreover, age affected shimmer and NHR significantly; in particular, the shimmer and NHR of elderly speakers was greater than the young speakers.

Keywords: fundamental frequency (f0); jitter; shimmer; NHR (noise-to-harmonics ratio); voice quality

1. 서론

이 연구의 목적은 모음 연장 발성 자료 분석을 통해 한국어 화자가 산출한 모음의 기본주파수(f0), 지터(jitter), 시머(shimmer), NHR(noise-to-harmonics ratio) 수치를 보고하고, 성별이나 연령, 모음 등의 요소가 이러한 음향음성학적 특성에 미치는 영향을 살피는 데에 있다. 이를 위해 대규모 음성 코퍼스를 활용하여, 표준어를 사용하는 20세 이상의 성인 화자 309명이 발성한 8개 단모음에 대한 음질 특성 분석을 수행하였다.

f0는 성대 진동의 주파수이며, 지각적으로는 음높이(pitch)에 해당된다. 지터란 진동의 주기가 얼마나 일정한지를 보여주는 수치이며, 시머란 진동의 진폭이 얼마나 일정한지를 보여주는 수치이다. 주기나 진폭이 불규칙할수록 지터나 시머의 값이 커진다. 그리고 NHR은 70–4,500 Hz 사이에 존재하는 배음과 1,500–4,500 Hz 사이에 존재하는 비정상 배음 간의 비율 평균치이며, 그 값이 클수록 소음의 비율이 높음을 의미한다.

지금까지 이러한 모음 음질 특성에 대한 국내 연구는 언어병리학 분야에서 이루어져 왔다(강영애 외, 2009 등; 전은옥 & 고도흥, 2007). 선행 연구는 다양한 음성 장애 환자들을 대상으로 평균 f0, 지터, 시머, NHR 등의 음성 파라미터 수치를 보고하였고, 음성 장애가 없는 화자들과의 비교를 통해 장애 음성의 특성을 밝혀왔다. 그러나 표화영 외(2000)에서 지적한 바와 같이, 음성의 비정상성을 판단하기 위하여 정상성에 대한 기준이 확립되어 있어야 하나 국내에는 규준이라고 할 만큼 충분한 수의 비장애인을 대상으로 음성 분석을 진행한 연구가 많지 않다.

음성 관련 장애가 없는 성인 화자를 대상으로 음질 특성을 측정한 연구로는 표화영 외(2000), 고도흥(2003), 이효진 & 김수진(2006) 등이 있다. 표화영 외(2000)은 20–39세 사이의 정상 성인 남녀 120명을 대상으로 /ㅏ, ㅣ, ㅜ/와 문장 낭독을 수집한 후 MDVP를 이용하여 f0, 지터, 시머, NHR, 발화 기본·최고·최저 주파수를 측정하였다. 정상성의 규준을 제시하기 위해 다수의 화자들을 연구 대상으로 삼아 각 파라미터 값의 분포를 밝히고 타 언어권과의 비교를 수행하였다는 점에서 의의가 있다. 연령에 따른 음질 특성의 차이를 살핀 연구도 있는데, 이효진 & 김수진(2006)은 3개의 연령 집단(20, 50, 70대)의 화자 120명을 대상으로 /ㅏ, ㅣ, ㅜ/와 문단 낭독, 그림 설명 발화를 수집한 후 MDVP를 이용하여 f0, 지터, 시머, NHR를 측정하였다. 이 파라미터 값들을 연령과 성별에 따라 비교하였으며, 그 값이 MDVP에서 제시한 정상범위에 속하는지를 살폈다. 특히, 50대와 70대의 음성 파라미터 평균은 MDVP의 정상 범위에서 크게 벗어났으며 20대도 지터와 시머가 정상 범위를 벗어난 것으로 나타났으므로 정상성의 규준이 국내를 기준으로 마련되어야 함을 역설하였다는 점에서 의의가 있다.

현재까지의 선행 연구는 소수의 피험자를 대상으로 진행되거나 대상 연령층 혹은 성별을 한정하여 진행되었다. 분석 대상으로 삼은 모음 역시 대체로 /ㅏ/나 /ㅏ, ㅣ, ㅜ/로 한정되어 있었다. 이로 인해, 한국어 모음의 전반적인 특성을 살피거나 집단 간의 비교를 수행하는 것은 어려웠다. 이에 본 연구에서는 분석 대상의 범위를 5개 연령층(20대, 30대, 40대, 50대, 60대 이상)과 8개 단모음(/ㅏ, ㅐ, ㅓ, ㅔ, ㅗ, ㅜ, ㅡ, ㅣ/)으로 설정하여 다각적인 분석을 수행하고자 하였다.

2. 연구 방법

2.1. 분석 자료

분석의 대상이 된 자료는 ‘한국인 표준 음성 데이터베이스’(신지영 & 김경화, 2017)이다. 이 코퍼스는 전국 단위로 수집된 성인 화자 3,192 명의 낭독 및 자유 발화 자료로 구축되었다. 한국어의 음성적 특징을 알아보기 위한 음성 코퍼스가 갖추어야 할 대표성과 균형성을 갖춘 대규모 자료이며, 연장 발성 과제가 포함되어 있기 때문에 연구 목적에 적합하다고 판단하였다.

대상 코퍼스에는 5가지의 발화 과제가 존재하는데, 이 가운데 ‘모음 발성 과제’가 분석 대상이 되었다. 이 과제는 한국어의 8개의 단모음을 일정한 음높이와 크기로 3초 이상 연장 발성하게 한 과제이다. 화자들에게 ‘하나 둘 셋’을 발화한 후 /ㅏ, ㅐ, ㅓ, ㅔ, ㅗ, ㅜ, ㅡ, ㅣ/의 순으로 모음을 발성하게 하였고, 이 과정을 3회 반복하였다. 그 결과 화자당 24개의 모음 연장 발성 자료가 수집되었다.

한편, 대상 코퍼스에 존재하는 9개 방언권 중 표준어 지역이라고 간주되는 수도권역 자료만을 분석 대상으로 삼았다. 표준어 화자로 한정한 이유는 방언에 따라 모음의 음질 특성이 달라질 가능성이 있기 때문이었다. 결국, 본 연구의 분석 대상이 된 자료는 5개 연령층(20대, 30대, 40대, 50대, 60대 이상)의 남녀 화자가 발화한 8개 모음의 연장 발성 자료였다.

해당 코퍼스에서 위의 선정 기준에 부합하는 대상자의 수는 총 579명이었으나 다음과 같은 문제가 있는 경우에는 분석에서 제외하였다: ① 화자가 호흡기, 갑상선, 기타 음성 관련 질환 경력을 가진 경우, ② 소음으로 인해 정확한 분석이 불가능한 경우, ③ 화자가 연장 발성을 올바르게 수행하지 않은 경우. 이러한 기준에 의해 최종적으로 분석 대상이 된 화자의 수는 총 309명이며, 이를 연령층 및 성별에 따라 제시하면 표 1과 같다.

표 1 / Table 1. 지역 및 성별에 따른 분석 대상자 수(단위: 명) / Region and gender of participants
변수 20대 30대 40대 50대 60대 이상 합계
남성 37 35 29 19 11 132
여성 32 23 66 43 14 179
합계 69 58 95 62 25 309
Download Excel Table

각 화자 집단의 평균 연령을 제시하면, 20대 남성 24.5세(SD=2.4), 여성 23.5세(SD=2.6), 30대 남성 34세(SD=3.1), 여성 33.5세(SD=3.0), 40대 남성 44.3세(SD=2.6), 여성 44.4세(SD=2.9), 50대 남성 54.8세(SD=3.0), 여성 54.1세(SD=3.0), 60대 이상 남성 66.5세(SD=5.4), 여성 64.2세(SD=3.7)이다. 60대 이상 집단에는 60–74세의 화자가 속했으며, 60대가 20명(남성 8명, 여성 12명), 70대가 5명(남성 3명, 여성 2명) 포함되었다.

모음은 코퍼스 구축 시에 수집된 단모음 8개를 모두 분석 대상으로 삼았다. 전설 저모음 /ㅐ/와 전설 중모음/ㅔ/가 구어에서는 하나의 모음 [ɛ]로 합류하였으나(신지영 & 차재은, 2003), 음성 파라미터상에서는 차이를 보일 가능성이 존재하기 때문이다. 또한, 장혜진 외(2015)에서는 20–60대의 낭독 자료 분석을 통해 50대 이하 화자와 달리 60대 화자는 /ㅐ/와 /ㅔ/를 변별하는 것으로 보인다고 보고한 바 있다. 따라서 본고에서는 /ㅐ/와 /ㅔ/의 분석 결과를 개별적으로 보고하였다.

그 결과 분석 토큰의 수는 총 6,098개(남성: 2,466개, 여성: 3,632개)였는데, 이를 모음별로 세분하여 제시하면 /ㅏ/ 804개, /ㅐ/ 753개, /ㅓ/ 746개, /ㅔ/ 752개, /ㅗ/ 737개, /ㅜ/ 788개, /ㅡ/ 748개, /ㅣ/ 770개와 같다. 소음이나 수행의 문제가 발견된 일부 화자의 자료를 분석 대상에서 제외한 결과, 모음별로 분석 대상 토큰의 수가 일정하지 않았다.

2.2. 분석 방법

분석 자료는 그림 1과 같이 Praat 5.4.01을 이용하여 음운 단위 레이블링이 이루어졌다. 8개의 모음은 /aa, qq, vv, ee, oo, uu, xx, ii/로, 묵음 구간은 s로 레이블링되었다. 아래 그림은 40대 남성 화자의 모음 /ㅏ/와 /ㅐ/의 1회차 발성에 대한 레이블링 결과를 보인 것이다.

pss-10-4-67-g1
그림 1 / Figure 1. Praat을 이용한 레이블링의 예시: 40대 남성 화자(aa: /ㅏ/, s: 묵음 구간, qq: /ㅐ/) / Example annotations using Praat produced by a male speaker in his 40s (aa: /ɑ/, s: silence, qq: /ɛ/)
Download Original Figure

분절음 단위 레이블링이 끝난 후에는 스크립트를 작성하여 모음별로 파일을 만들어 음질 분석을 수행하였다. 음질 분석 수행은 UCLA Phonetics Lab에서 제공하는 voice report script를 활용하였다. 이때 pitch analysis mode는 cc method, costs=standard로, f0 range는 MDVP 70-625를 기준으로 설정하였다. 그리고 전체 구간에서 시작과 끝의 100 ms씩을 제외한 구간을 분석 대상으로 삼았다. 이는 발성의 시작과 끝에서 존재할 수 있는 불안정성을 분석 결과에 포함하지 않도록 하기 위함이었다.

Praat을 통해 voice report 기능을 수행하면 5개 종류의 지터와 6개 종류의 시머 값이 도출된다. 본고에서는 이 가운데 jitter (local) 값과 shimmer (local) 값을 분석 대상으로 취하였다. 또한, NHR은 그 값이 매우 작기 때문에 다른 파라미터 값들과 달리 소수점 셋째자리까지 표시하여 검토하였다.

통계 검정은 R 3.4.3을 이용하여 혼합효과 선형 회귀분석(Linear Mixed-Effects Regression) 방식으로 수행하였다. Fixed effect로 연령 그룹, 성별, 모음을 설정하였으며, 피험자를 random effect로 설정하여 개별 화자의 영향을 배제하고자 하였다. p값은 anova( ) 함수를 이용하여 획득하였으며, 사후 검정은 lsmean 함수를 이용하여 tukey 방식으로 수행하였다.

3. 분석 결과

309명의 화자가 산출한 6,098개의 모음 발성 자료에 대한 전체적인 분석 결과는 아래의 표 2에 요약된 바와 같다. f0 평균값의 경우 남성은 119.02 Hz(SD=22.71), 여성은 199.60 Hz(SD=26.93)으로 나타났다. 지터 평균값의 경우 남성은 0.24%(SD=0.15), 여성은 0.14%(SD=0.11)으로 나타났고, 시머 평균값의 경우 남성은 6.05%(SD=5.16), 여성은 5.9%(SD=4.69)로 나타났다. NHR 평균값은 남성은 0.019(SD=0.02), 여성은 0.013(SD=0.01)으로 나타났고, HNR(harmonics-to-noise ratio) 평균값은 남성 21.77 dB(SD=4.63), 여성은 22.66 dB(SD=4.73)로 나타났다. 각각의 음성 파라미터 평균값을 연령대와 성별, 모음에 따라 자세히 살펴보도록 하겠다.

표 2 / Table 2. 성별에 따른 음성 파라미터 값의 평균(M) 및 표준편차(SD) / Mean(M) and standard deviation(SD) of F0, jitter, shimmer, NHR, and HNR by speakers’ gender
변수 f0 (Hz) 지터 (%) 시머 (%) NHR HNR (dB)
M SD M SD M SD M SD M SD
남성 119.02 22.71 0.24 0.15 6.05 5.16 0.019 0.02 21.77 4.63
여성 199.60 26.93 0.14 0.11 5.90 4.69 0.013 0.01 22.66 4.73
전체 167.01 46.95 0.18 0.14 5.96 4.89 0.016 0.02 22.30 4.71
Download Excel Table
3.1. f0

표 3은 f0의 평균값을 연령대와 성별, 모음에 따라 제시한 것이다. f0는 남성과 여성의 음질 특성차를 가장 극명하게 보여주는 파라미터 값으로 나타났다. 전체 평균값이 119.02 Hz와 199.60 Hz로 여성이 더 큰 값을 보였을 뿐만 아니라 모든 연령대와 모음에서 남성보다 여성이 더 큰 값을 보였다. 이는 통계적으로도 유의미한 차이였다(p<.001).

표 3 / Table 3. 연령대, 성별, 모음에 따른 f0 값의 평균 및 표준편차(단위: Hz) / mean and standard deviation of f0 for each age group, gender, and vowel category (Hz)
변수 모음
연령대 성별 /ㅏ/ /ㅐ/ /ㅓ/ /ㅔ/ /ㅗ/ /ㅜ/ /ㅡ/ /ㅣ/ 전체
20대 남성 110.43±15.00 111.18±15.28 110.56±14.93 112.45±17.59 112.03±15.75 112.28±15.04 113.48±15.76 111.71±14.87 111.75±15.47
여성 203.92±16.56 206.28±16.4 203.51±20.8 205.88±19.27 207.68±19.09 210.27±15.73 209.53±20.13 202.97±28.89 206.26±20.04
30대 남성 112.8±17.94 115.43±19.15 115.14±19.16 116.61±19.27 117.61±19.33 117.22±19.59 119.86±20.35 117.94±20.03 116.53±19.34
여성 189.86±29.9 192.7±34.34 192.39±34.24 192.79±35.67 196.5±38.51 197.74±33.72 198.33±40.1 198.17±36.18 194.9±34.78
40대 남성 118.85±23.38 122.27±26.61 120.4±26.16 120.94±25.91 123.86±28.08 125.02±25.73 124±26.12 121.86±25.66 122.13±25.89
여성 194.18±25.38 197.83±24.12 197.53±21.7 197.54±24.39 199.88±25.94 201.71±25.17 202.17±26.79 199.85±29.39 198.81±25.47
50대 남성 122.22±24.68 123.38±24.33 124.56±25.27 125.83±28.05 125.55±25.52 129.2±25.37 131.02±25.95 128.56±26.96 126.24±25.73
여성 195.35±31.53 198.67±27.24 197.16±31.01 199.47±28.02 201.03±29.66 200.59±30.73 202.49±30.23 200.3±32.69 199.38±30.15
60대 이상 남성 124.46±26.21 128.74±28.64 126.08±27.31 128.4±27.76 125.31±27.54 126.29±25.74 127.46±26.35 126.51±28.43 126.67±26.81
여성 187.19±24.01 190.52±22.11 190.78±25.76 194.38±26.69 193.86±23.71 194.63±28.95 197.16±27.87 189.95±25.25 192.34±25.51
Download Excel Table

모음에 따라서도 f0의 차이가 나타나는데(p<.001), /ㅏ/가 163.01 Hz로 가장 낮았고, /ㅓ/ 165.68 Hz, /ㅣ/ 166.16 Hz, /ㅐ/ 166.36 Hz, /ㅔ/ 166.69 Hz, /ㅗ/ 168.78 Hz, /ㅜ/ 169.04 Hz, /ㅡ/ 170.61 Hz순으로 그 값이 높아지는 양상을 보였다. 이러한 순서는 남녀가 동일하였다. 개별 모음 간의 통계적인 유의도는 표 4에 요약한 바와 같다. 특히 f0 값이 가장 낮은 /ㅏ/는 /ㅓ/를 제외한 나머지 6개의 모음과 모두 통계적으로 유의미한 차이를 보인 반면, f0 값이 가장 높은 /ㅡ/는 /ㅜ/를 제외한 나머지 6개 모음과 모두 통계적으로 유의미한 차이를 보였다.

표 4 / Table 4. 모음 간 f0의 통계적 유의도 / Significance level of f0 among vowels
변수 /ㅏ/ /ㅐ/ /ㅓ/ /ㅔ/ /ㅗ/ /ㅜ/ /ㅡ/
/ㅏ/ - * *** *** *** ***
/ㅐ/ * - * *** ***
/ㅓ/ - ** *** *** ***
/ㅔ/ *** ** - ** ***
/ㅗ/ *** - ***
/ㅜ/ *** *** *** ** -
/ㅡ/ *** *** *** *** ** -
/ㅣ/ *** *** * ***

*p<.05, **p<.01,***p<.001

Download Excel Table

마지막으로, 연령 그룹과 성별 간의 상호작용이 관찰되었다(p<.01). 모든 연령 집단에서 여성의 f0가 남성보다 컸으며(p<.001), 여성 집단 내에서는 20대 그룹이 60대 이상 그룹보다 큰 값을 보였다(p<.05). 아래 그림 2는 연령 그룹과 성별에 따른 f0 값의 분포를 상자 그림으로 제시한 것이다. 그림에서 보이듯이 한 연령 그룹 내에서 f0의 성별 차이가 뚜렷하게 나타났다. 또한, 연령이 증가할수록 남성은 f0가 높아지고 여성은 f0가 낮아지는 경향으로 인해 점차 남성 그룹과 여성 그룹의 격차가 줄어드는 것을 확인할 수 있다.

pss-10-4-67-g2
그림 2 / Figure 2. 연령 그룹과 성별에 따른 f0 상자 그림(가로선: 중앙값, 점: 평균, 이하 동일) / Boxplot of f0 for each age group and gender (horizontal line: median, dot: mean)
Download Original Figure
3.2. 지터

표 5는 지터의 평균값을 연령대와 성별, 모음에 따라 제시한 것이다. 지터 역시 성별에 따라서 차이를 보이는 파라미터이다. 여성의 지터 평균은 0.14%이고 남성의 지터 평균은 0.24%로 남성의 값이 더 컸으며, 이러한 차이는 통계적으로 유의한 수준이었다(p<.001). 아래의 그림 3을 통해 알 수 있듯이, 모든 연령 그룹에서 여성보다 남성의 지터 값이 큰 평균값과 중앙값을 보였으며, 값의 분포 범위 역시 더 넓게 나타났다.

표 5 / Table 5. 연령대, 성별, 모음에 따른 지터 값의 평균 및 표준편차(단위: %) / Mean and standard deviation of jitter for each age group, gender, and vowel category (%)
변수 모음
연령대 성별 /ㅏ/ /ㅐ/ /ㅓ/ /ㅔ/ /ㅗ/ /ㅜ/ /ㅡ/ /ㅣ/ 전체
20대 0.26±0.13 0.22±0.08 0.22±0.08 0.25±0.15 0.22±0.09 0.21±0.12 0.22±0.12 0.21±0.08 0.23±0.11
0.16±0.15 0.14±0.10 0.14±0.10 0.16±0.18 0.12±0.07 0.14±0.11 0.13±0.10 0.15±0.11 0.14±0.12
30대 0.25±0.11 0.23±0.10 0.22±0.07 0.24±0.13 0.20±0.08 0.20±0.08 0.20±0.09 0.22±0.10 0.22±0.10
0.15±0.13 0.12±0.04 0.11±0.03 0.13±0.09 0.10±0.02 0.11±0.03 0.10±0.03 0.12±0.09 0.12±0.07
40대 0.23±0.08 0.24±0.18 0.22±0.14 0.25±0.21 0.24±0.22 0.21±0.17 0.19±0.09 0.21±0.14 0.23±0.16
0.18±0.19 0.14±0.14 0.13±0.08 0.13±0.08 0.14±0.10 0.13±0.07 0.12±0.08 0.15±0.13 0.14±0.12
50대 0.25±0.13 0.27±0.22 0.29±0.26 0.30±0.32 0.25±0.13 0.24±0.16 0.28±0.29 0.25±0.14 0.27±0.22
0.16±0.16 0.13±0.09 0.15±0.12 0.14±0.11 0.14±0.10 0.17±0.15 0.13±0.07 0.16±0.12 0.15±0.12
60대 이상 0.31±0.16 0.29±0.10 0.29±0.10 0.29±0.12 0.28±0.12 0.29±0.11 0.33±0.19 0.30±0.14 0.28±0.13
0.15±0.08 0.17±0.10 0.17±0.12 0.16±0.12 0.15±0.08 0.16±0.10 0.16±0.11 0.14±0.07 0.16±0.11
Download Excel Table
pss-10-4-67-g3
그림 3 / Figure 3. 연령 그룹과 성별에 따른 지터 상자 그림 / Boxplot of jitter for each age group and gender
Download Original Figure

또한, 지터는 /ㅗ, ㅜ, ㅡ/ 0.17%, /ㅐ, ㅓ, ㅣ/ 0.18%, /ㅔ/ 0.19%, /ㅏ/ 0.2% 순으로 평균값이 커지는 양상을 보였으며, 모음에 따라서도 유의한 차이를 보였다(p<.001). 개별 모음 간의 통계적 유의도는 표 6에 제시된 바와 같다. 가장 큰 지터 값을 보인 /ㅏ/는 /ㅗ, ㅜ/(p<.001), /ㅡ/(p<.01), /ㅣ/(p<.05)보다 유의미하게 컸고, 그 다음으로 큰 값을 보인 /ㅔ/는 /ㅗ/, /ㅜ/, /ㅡ/보다 유의미하게 컸다(p<.05).

표 6 / Table 6. 모음 간 지터의 통계적 유의도 / Significance level of jitter among vowels
변수 /ㅏ/ /ㅐ/ /ㅓ/ /ㅔ/ /ㅗ/ /ㅜ/ /ㅡ/
/ㅏ/ - *** *** **
/ㅐ/ -
/ㅓ/ -
/ㅔ/ - * * *
/ㅗ/ *** * -
/ㅜ/ *** * -
/ㅡ/ ** * -
/ㅣ/ *

*p<.05, **p<.01,***p<.001

Download Excel Table
3.3. 시머

표 7은 시머의 평균값을 연령대와 성별, 모음에 따라 제시한 것이다. 우선 시머는 연령 그룹에 따라서 차이를 보였다(p<.001). 이는 50대 그룹이 다른 그룹과 다른 양상을 보여준 결과인데, 다른 4개 그룹이 5%대의 평균값을 보인 데에 반해, 50대 그룹의 평균은 7.38%로 나타났다. 그림 4를 통해서도 50대 그룹의 데이터 분포가 특히 넓은 범위에 걸쳐 있음을 확인할 수 있다. 통계적으로도 50대 그룹은 20대(p<.05), 30대(p<.001), 40대(p<.01) 그룹과 유의한 차이를 보였다. 하지만 그 나머지 그룹 간에는 유의한 차이가 관찰되지 않았다.

표 7 / Table 7. 연령대, 성별, 모음에 따른 시머 값의 평균 및 표준편차(단위: %) / mean and standard deviation of shimmer for each age group, gender, and vowel category (%)
변수 모음
연령대 성별 /ㅏ/ /ㅐ/ /ㅓ/ /ㅔ/ /ㅗ/ /ㅜ/ /ㅡ/ /ㅣ/ 전체
20대 6.53±4.39 5.39±4.51 5.3±4.43 5.69±4.88 5.41±4.52 6.65±4.64 4.97±3.97 5.56±3.79 5.72±4.41
6.12±2.92 5.95±4.54 5.68±3.83 5.44±3.13 4.96±3.52 6.48±5.35 4.96±4.01 5.75±5.46 5.67±4.20
30대 6.79±5.59 6.26±4.96 6.20±4.77 5.84±4.28 5.91±5.96 5.81±4.11 5.44±5.03 6.58±5.85 6.12±5.10
4.96±2.42 3.56±1.82 4.14±2.62 3.71±1.48 3.77±2.69 4.87±2.97 3.68±2.41 5.19±3.55 4.36±2.69
40대 5.63±3.34 4.55±2.98 5.99±5.53 4.85±3.63 5.36±5.02 5.41±5.18 5.20±5.78 6.21±5.47 5.40±4.72
5.88±3.62 5.10±4.57 5.34±3.53 4.69±3.69 5.14±4.46 6.44±5.03 4.98±3.74 6.66±5.15 5.53±4.30
50대 5.92±2.92 8.31±8.03 8.10±6.37 7.63±7.71 8.02±7.90 8.23±8.53 7.74±7.26 8.71±7.66 7.82±7.21
7.18±4.85 7.00±6.06 6.59±4.68 7.45±6.35 6.22±5.22 8.00±6.59 6.19±5.18 9.02±7.21 7.20±5.87
60대 이상 6.00±2.64 5.66±3.17 5.33±3.18 5.31±3.14 4.89±3.64 6.08±3.74 4.65±3.06 5.23±3.71 5.40±3.28
6.08±3.98 4.82±2.85 5.12±3.44 5.31±4.33 4.98±3.48 5.55±3.56 5.45±3.99 4.73±3.14 5.28±3.62
Download Excel Table
pss-10-4-67-g4
그림 4 / Figure 4. 연령 그룹과 성별에 따른 시머 상자 그림 / Boxplot of shimmer for each age group and gender
Download Original Figure

그리고 모음에 따라서 시머가 차이를 보였는데(p<.001), /ㅡ, ㅗ, ㅔ, ㅐ, ㅓ, ㅏ, ㅜ, ㅣ/ 순으로 시머 평균값이 크게 나타났다. /ㅡ/는 5.38%, /ㅗ/ 5.54%, /ㅔ/ 5.67%, /ㅐ/ 5.76%, /ㅓ/ 5.84%, /ㅏ/ 6.22%, /ㅜ/는 6.52%, /ㅣ/는 6.66%의 평균값을 보였다. 그리고 표 8에 제시된 것과 같이 /ㅡ/, /ㅗ/, /ㅏ/, /ㅜ/, /ㅣ/가 다른 모음들과 유의한 수준에서 차이를 보였다.

표 8 / Table 8. 모음 간 시머의 통계적 유의도 / Significance level of shimmer among vowels
변수 /ㅏ/ /ㅐ/ /ㅓ/ /ㅔ/ /ㅗ/ /ㅜ/ /ㅡ/
/ㅏ/ - **
/ㅐ/ - ***
/ㅓ/ - *
/ㅔ/ -
/ㅗ/ - ***
/ㅜ/ *** * *** - ***
/ㅡ/ ** *** -
/ㅣ/ *** * *** *** ***

*p<.05, **p<.01,***p<.001

Download Excel Table

뿐만 아니라 연령 그룹과 모음 간의 상호작용도 관찰되었다(p<.001). /ㅣ/의 경우, 50대 그룹이 다른 모든 그룹보다 유의하게 큰 값을 보였다(20, 30, 60대 이상: p<.001, 40대: p<.01). /ㅐ/의 경우 30–50대(p<.01), 40–50대(p<.001)가 유의한 차이를 보였으며, /ㅓ/의 경우 20–50대(p<.05) 집단만이 유의한 차이를 보였다. /ㅔ/의 경우 30–50대(p<0.01), 40–50대(p<.001)가 차이를 보였고, /ㅗ/의 경우 20–50대와 30–50대, 40–50대가 차이를 보였다(p<.05). /ㅜ/의 경우 30–50대(p<.001), 40–50대(p<.01), 50–60대 이상(p<.05)이 차이를 보였으며, /ㅡ/의 경우 20-50대(p<.05), 30–50대(p<.01), 40–50대(p<.05)의 차이를 보였다. /ㅏ/는 유일하게 집단 간의 차이가 관찰되지 않은 모음이었다.

3.4. NHR

표 9는 NHR의 평균값을 연령대와 성별, 모음에 따라 제시한 것이다. NHR은 세 가지 변수에서 모두 유의미하게 통계적인 차이를 보였다(연령 그룹, 성별: p<.01, 모음: p<.001).

표 9 / Table 9. 연령대, 성별, 모음에 따른 NHR 값의 평균 및 표준편차 / mean and standard deviation of NHR for each age group, gender, and vowel category (%)
변수 모음
연령대 성별 /ㅏ/ /ㅐ/ /ㅓ/ /ㅔ/ /ㅗ/ /ㅜ/ /ㅡ/ /ㅣ/ 전체
20대 0.024±0.03 0.017±0.01 0.013±0.01 0.024±0.04 0.014±0.03 0.015±0.02 0.011±0.02 0.014±0.02 0.017±0.02
0.021±0.02 0.022±0.03 0.011±0.01 0.021±0.02 0.006±0.01 0.009±0.02 0.011±0.02 0.016±0.03 0.014±0.02
30대 0.029±0.03 0.023±0.02 0.016±0.02 0.024±0.02 0.010±0.02 0.011±0.02 0.012±0.02 0.020±0.04 0.018±0.02
0.014±0.01 0.012±0.01 0.009±0.01 0.014±0.02 0.003±0.00 0.007±0.01 0.004±0.00 0.009±0.01 0.009±0.01
40대 0.020±0.02 0.019±0.04 0.014±0.02 0.020±0.03 0.016±0.04 0.014±0.03 0.016±0.05 0.018±0.04 0.017±0.03
0.019±0.02 0.014±0.02 0.009±0.01 0.013±0.01 0.007±0.01 0.009±0.01 0.006±0.01 0.014±0.02 0.011±0.02
50대 0.036±0.06 0.042±0.07 0.030±0.05 0.035±0.06 0.028±0.05 0.025±0.05 0.027±0.05 0.033±0.06 0.032±0.06
0.023±0.02 0.017±0.02 0.017±0.03 0.020±0.03 0.015±0.05 0.017±0.03 0.010±0.02 0.019±0.02 0.017±0.03
60대 이상 0.021±0.02 0.017±0.01 0.017±0.02 0.020±0.01 0.011±0.02 0.012±0.01 0.011±0.02 0.011±0.01 0.015±0.02
0.021±0.02 0.010±0.01 0.012±0.02 0.008±0.01 0.005±0.01 0.009±0.01 0.007±0.01 0.009±0.02 0.010±0.01
Download Excel Table

먼저 연령 그룹에 따라 살펴보면, 20대는 0.016, 30대는 0.015, 40대는 0.013, 50대는 0.022, 60대 이상은 0.012의 평균값을 보여, 50대 그룹이 다른 그룹들과 모두 유의한 차이를 보였다(p<.01). 나머지 그룹 간에는 유의한 차이가 존재하지 않았다. 그림 5를 통해서도 50대 화자 집단이 다른 연령 집단과 차이를 보인다는 것을 확인할 수 있다.

pss-10-4-67-g5
그림 5 / Figure 5. 연령 그룹과 성별에 따른 NHR 상자 그림 / Boxplot of NHR for each age group and gender
Download Original Figure

또한, 남성 집단은 0.019, 여성 집단은 0.013의 평균값을 보여, 남성이 여성보다 큰 NHR 값을 보였다. 그림 5에서도 확인할 수 있듯이, 모든 연령대에서 남성의 NHR 평균이 더 크게 나타났으며, 화자 간의 차이도 남성 집단이 더 크게 나타났다.

마지막으로 모음에 따라 NHR 값을 살펴보면, /ㅡ/가 0.011로 가장 작은 값을 보였고, /ㅗ/ 0.011, /ㅜ/ 0.012, /ㅓ/ 0.014, /ㅣ/ 0.017, /ㅐ/ 0.019, /ㅔ/ 0.019, /ㅏ/ 0.023의 순으로 큰 값을 보였다. 모음 간의 통계적 유의도는 표 10에 제시하였다.

표 10 / Table 10. 모음 간 NHR의 통계적 유의도 / Significance level of NHR among vowels
변수 /ㅏ/ /ㅐ/ /ㅓ/ /ㅔ/ /ㅗ/ /ㅜ/ /ㅡ/
/ㅏ/ - * *** *** *** ***
/ㅐ/ * - * *** *** ***
/ㅓ/ *** * - **
/ㅔ/ ** - *** *** ***
/ㅗ/ *** *** *** -
/ㅜ/ *** *** *** -
/ㅡ/ *** *** *** -
/ㅣ/ *** *** ***

*p<.05, **p<.01,***p<.001

Download Excel Table
3.5. 종합

지금까지 평균 f0, 지터, 시머, NHR의 분석 결과를 연령 그룹, 성별, 모음에 따라서 살펴보았다. 통계적 유의도를 종합하면 표 11과 같다. 연령 그룹에 따라 유의미한 차이를 보인 파라미터는 시머와 NHR이었으며, 성별에 따라 유의미한 차이를 보인 파라미터는 f0와 지터, NHR이었다. 한편, 모든 파라미터 값에서 발성 모음의 영향이 관찰되었다는 점도 주목할 만하다. 변수 간의 상호 작용도 관찰되었는데, f0의 경우 연령 그룹과 성별의 상호 작용이 나타났고, 시머의 경우에는 연령 그룹과 모음 간의 상호 작용이 관찰되었다.

표 11 / Table 11. 변수 간 효과의 통계적 유의도 요약 / Significance level of the effect among the factors
변수 f0 지터 시머 NHR
연령 그룹 *** **
성별 *** *** **
모음 *** *** *** ***
연령 그룹:성별 **
연령 그룹:모음 ***
성별:모음
연령 그룹:성별:모음

*p<.05, **p<.01,***p<.001

Download Excel Table

4. 논의

4.1. 모음

모음은 본고에서 분석한 음성 파라미터 4개 모두에서 차이를 보이는 요소였다. f0는 후설 저모음 /ㅏ/가 가장 작은 값을 보였고 후설 고모음 /ㅡ/가 가장 큰 값을 보였다. 지터는 이와 반대로 /ㅏ/에서 가장 크고 /ㅡ/에서 가장 작았다. 가장 작은 지터 값을 보인 /ㅡ/는 시머와 NHR에서도 가장 작은 값을 보이는 모음이었다. 이와 유사하게, 가장 작은 지터 값을 보인 /ㅏ/는 NHR에서 가장 큰 값을 보였다. 한편, 가장 큰 시머 값을 보인 모음은 전설 고모음 /ㅣ/였다. 모음별 음성 파라미터 평균을 최솟값부터 순위를 매겨 정리하면 표 12와 같다.

표 12 / Table 12. 음성 파라미터 값에 따른 모음 순위(음영은 최댓값과 최솟값) / Vowel rank of acoustic parameters (shade: max. and min.)
모음 f0 (Hz) 순위 지터 (%) 순위 시머 (%) 순위 NHR 순위
/ㅏ/ 163.01 1 0.20 8 6.22 6 0.023 8
/ㅐ/ 166.36 4 0.18 5 5.76 4 0.019 6
/ㅓ/ 165.68 2 0.18 4 5.84 5 0.014 4
/ㅔ/ 166.69 5 0.19 7 5.67 3 0.019 7
/ㅗ/ 168.78 6 0.17 2 5.54 2 0.011 2
/ㅜ/ 169.04 7 0.17 3 6.52 7 0.012 3
/ㅡ/ 170.61 8 0.17 1 5.38 1 0.011 1
/ㅣ/ 166.16 3 0.18 6 6.66 8 0.017 5
Download Excel Table

성대의 초당 평균 진동 횟수를 나타내는 f0는 저모음 /ㅏ/에서 가장 작고 고모음의 /ㅡ/, /ㅜ/에서 크기 때문에 개구도와 상관을 보인다고 할 수 있다. 이처럼 고모음이 저모음보다 높은 기본 주파수로 산출되는 경향을 모음의 내재적 음높이(intrinsic pitch)라고 하며, 여러 선행 연구에서 보고된 바 있다(Ohala & Eukel, 1987; Sapir, 1989; Whalen & Levitt, 1995 등).

단, /ㅣ/의 경우는 이러한 경향성에서 예외를 보이는 것으로 관찰되었다. /ㅣ/는 비록 가장 낮은 f0를 보인 /ㅏ/나 그 다음으로 낮은 f0를 보인 /ㅓ/와는 0.001의 유의 수준에서 통계적으로 유의미한 차이를 보이기는 했지만, 여타의 모음들보다 낮은 f0를 보였다. f0라는 파라미터가 성별에 따라 평균값과 분포 범위가 편차가 컸음을 고려하면, 남녀 집단을 합쳐서 산출한 평균을 검토하는 것은 적절하지 않다고 판단하였다. 이에 성별을 나누어 모음의 f0 평균값 순위를 다시 제시하면 표 13과 같다. 남성과 여성 집단을 나누어 살핀 결과, 남녀 모두 /ㅏ,ㅓ, ㅐ, ㅔ, ㅣ, ㅗ, ㅜ, ㅡ /순으로 f0가 높게 나타났다. 표 12의 순위와 비교하면 /ㅣ/의 위치만이 3위에서 5위로 변동되었다.

표 13 / Table 13. f0 평균값에 따른 남녀별 모음 순위(단위: Hz) / Vowel rank of f0 mean for each gender (Hz)
순위 모음 남성 여성
1 /ㅏ/ 116.02 195.36
2 /ㅓ/ 117.72 197.76
3 /ㅐ/ 118.48 198.78
4 /ㅔ/ 119.16 199.13
5 /ㅣ/ 119.42 199.72
6 /ㅗ/ 119.68 201.00
7 /ㅜ/ 120.23 202.14
8 /ㅡ/ 121.71 203.00
Download Excel Table

음운론적으로는 중모음으로 분류되는 /ㅗ/가 /ㅣ/보다 f0가 높다는 사실도 주목할 만하다. 이러한 결과는 수도권 화자들에게서 나타나는 /ㅗ/와 /ㅜ/의 모음 공간상의 거리 변화와 관련이 있는 것으로 보인다. 여러 선행 연구가 /ㅗ/-/ㅜ/의 거리가 매우 가까우며, 젊은 세대일수록 /ㅗ/의 상승으로 인해 두 후설 모음이 고저 대립보다는 전후 대립으로 구분된다고 밝힌 바 있다(조성문, 2003; 장혜진 외, 2015; 강지은 & 공은정, 2016; 이향원 외, 2017). 즉, /ㅗ/의 f0 평균값이 비교적 높아 /ㅜ/와 /ㅣ/와 비슷한 수준을 보인 것은 /ㅗ/의 F1 하강에서 원인을 찾을 수 있다.

다음으로, 지터는 진동의 주기가 얼마나 일정한지를 보여주는 수치이며, 그 값이 클수록 주기가 불규칙함을 나타낸다. 모음과 지터의 상관을 논의한 선행 연구를 살펴보면, 지터 역시 개구도가 커질수록 그 값이 커지는 경향을 보인다. Wilcox & Horii(1980)은 /u/의 지터 값이 /a, i/보다 작다고 밝혔으며, Deem et al.(1989)는 /a/의 지터 값이 /i, u/보다 크다고 밝혔다. Ramig & Ringel(1983)Sussman & Sapienza(1994)에서도 /a, i, u/의 지터를 비교하였을 때 고모음으로 갈수록 지터가 작아진다고 기술하였다. 물론 Horii(1982)Orlikoff(1995)와 같이 모음 간 지터의 차이가 통계적으로 유의미하지 않다고 보고한 연구도 있었다.

본 연구 결과에서는 지터는 /ㅡ/에서 가장 작고, /ㅏ/에서 가장 컸다. 즉, 화자들이 /ㅡ/보다 /ㅏ/를 발성할 때 상대적으로 더 불규칙한 기본 주파수를 산출한 것으로 볼 수 있다. 그리고 저모음 /ㅏ/가 고모음 /ㅣ, ㅡ, ㅜ/, 중모음 /ㅗ/보다 유의하게 큰 값을 보였으므로 혀의 높이와 지터가 상관을 가진다고 할 수 있을 것이다.

시머는 진동의 진폭이 얼마나 일정한지를 보여주는 수치로, 그 값이 클수록 진폭이 불규칙함을 나타낸다. Horii(1980)에서는 /a, i, u/을 분석한 결과 /a/의 시머가 /i, u/보다 유의하게 컸으며, Sorensen & Horii(1983)에서도 세 모음 가운데 /a/의 시머가 가장 크고 /u/가 가장 작은 것으로 기술되었다.

본고의 분석 결과에서는 /ㅡ/가 가장 작은 시머 값을 보이고, /ㅣ/가 가장 큰 값을 보였다. 이는 /ㅡ/보다 /ㅣ/가 상대적으로 더 불규칙한 진폭으로 산출되었음을 의미한다. 선행 연구에서 가장 큰 값을 보인 /ㅏ/는 /ㅣ, ㅜ/보다 작은 평균값을 보였다. 단, 시머는 연령 그룹과 모음 간의 상호작용이 관찰되었기 때문에 연령 집단을 나누어 살피는 것이 적절할 것이다. 연령 그룹별로 순위를 다시 제시하면 표 14와 같다.

표 14 / Table 14. 시머 평균값에 따른 연령 그룹별 모음 순위(단위: %) / Vowel rank of jitter mean for each age group (%)
순위 20대 30대 40대 50대 60대 이상
1 /ㅡ/ 4.97 /ㅡ/ 4.94 /ㅔ/ 4.73 /ㅡ/ 6.64 /ㅗ/ 4.94
2 /ㅗ/ 5.17 /ㅔ/ 5.26 /ㅐ/ 4.95 /ㅗ/ 6.74 /ㅣ/ 4.98
3 /ㅓ/ 5.50 /ㅗ/ 5.30 /ㅡ/ 5.04 /ㅏ/ 6.80 /ㅡ/ 5.10
4 /ㅔ/ 5.56 /ㅜ/ 5.48 /ㅗ/ 5.20 /ㅓ/ 7.03 /ㅐ/ 5.20
5 /ㅣ/ 5.65 /ㅐ/ 5.50 /ㅓ/ 5.52 /ㅐ/ 7.39 /ㅓ/ 5.22
6 /ㅐ/ 5.67 /ㅓ/ 5.62 /ㅏ/ 5.81 /ㅔ/ 7.50 /ㅔ/ 5.31
7 /ㅏ/ 6.33 /ㅣ/ 6.11 /ㅜ/ 6.16 /ㅜ/ 8.07 /ㅜ/ 5.79
8 /ㅜ/ 6.57 /ㅏ/ 6.18 /ㅣ/ 6.53 /ㅣ/ 8.93 /ㅏ/ 6.05
Download Excel Table

연령대에 따라 모음의 시머는 편차를 보여, 최댓값과 최솟값을 갖는 모음과 전체 순위가 상이하였다. 20대, 30대, 50대 그룹에서는 /ㅡ/의 시머가 가장 작았으나, 40대 그룹에서는 /ㅔ/, 60대 이상 그룹에서는 /ㅗ/의 값이 가장 작았다. 반대로, 시머가 가장 큰 모음은 20대 그룹에서는 /ㅜ/, 30대와 60대 이상 그룹에서는 /ㅏ/, 40대와 50대 그룹에서는 /ㅣ/였다.

마지막으로 NHR은 70–4,500 Hz 사이에 존재하는 배음과 1,500–4,500 Hz 사이에 존재하는 비정상 배음 간의 비율 평균치이며, 그 값이 클수록 소음의 비율이 높다는 것을 의미한다. 가장 작은 NHR 값을 보인 모음은 /ㅡ/이며, 가장 큰 값을 보인 모음은 /ㅏ/였다. /ㅏ/를 예외로 두면, NHR은 상대적으로 전설 모음이 큰 값을 보이고, 후설 모음이 작은 값을 보인다고 할 수 있다.

지금까지의 검토를 종합해 보면, 8개의 모음 가운데 가장 극단적인 위치를 점하는 모음은 /ㅏ/와 /ㅡ/라고 할 수 있다. /ㅏ/는 8개의 모음 중 지터와 NHR이 가장 큰 모음이고, 시머 역시 상당히 큰 값을 보인 점에서 변동성이 크고 소음이 많은 모음이라고 볼 수 있다. 반대로 /ㅡ/는 가장 안정적이고 소음이 적은 모음이라고 할 수 있다. 이러한 결과는 /ㅏ/가 지터와 시머의 측면에서 높은 변동률을 보이고, 반대로 /ㅡ, ㅜ/는 안정적이고 가장 소음이 적었다고 기술한 최성희 & 최철희(2015)와도 일치한다. 이 연구에서도 지적하고 있듯이, 모음의 음향음성학적 연구를 수행하거나 임상에서 환자들의 음질 특성을 검사할 때에 /ㅏ/ 모음만을 측정 대상으로 삼는 것에 대한 재고가 필요할 것이다.

아울러, 본 연구에서는 /ㅐ/와 /ㅔ/가 구어에서 하나의 모음으로 합류되었다고 보는 관점에 동의하나, 음향음성학적으로 차이를 보일 가능성이 있다는 점에서 분리하여 검토를 진행하였다. 하지만 분석 결과 /ㅐ/와 /ㅔ/가 f0와 지터, 시머, NHR에서 모두 통계적으로 유의한 차이를 보이지 않았다. 다시 말해, 두 모음은 음성 파라미터상에서도 변별적인 차이를 보이지 않는 것을 확인할 수 있었다. 따라서 /ㅐ/와 /ㅔ/ 가운데 하나를 택하여 조사를 수행하는 것이 효율적일 것으로 보인다.

4.2. 성별 및 연령

성별과 연령 또한 음성 파라미터 값에 영향을 주는 요인임을 확인할 수 있었다. 성별은 f0, 지터, NHR에 영향이 있었고 연령은 시머와 NHR에 영향을 주는 변수였다.

f0는 여성 화자가 더 높은 수치를 보였는데, 이러한 차이는 일반적으로 남성보다 여성의 성도의 길이가 짧다는 생리적인 차이에서 기인한다. 그리고 여성 20대와 60대 그룹의 경우를 제외하고는 동일 성별 내에서 연령 그룹 간 f0의 차이는 유의한 수준이 아니었으나, 전반적으로 여성은 연령이 증가함에 따라 음높이가 전반적으로 낮아지는 반면에 남성은 높아지는 경향이 보였다. 그 결과, 연령이 증가할수록 남녀 간의 평균 f0 격차가 줄어드는 양상이 관찰되었다. 이러한 경향은 노화로 인한 후두 구조 및 근육의 변화와 같은 신체적인 변화를 반영하는 것이다. 남성은 노년기에 접어들면서 특히 70세 이후로 성도의 길이와 두께의 변화로 음높이가 상승하고(Hollien & Shipp, 1972; Schötz, 2007), 여성은 갱년기 이후 여성 호르몬의 변화로 인해 음높이가 현저하게 하강한다(Gloud, 1975; Honjo & Isshiki, 1980). 본 연구의 결과에서도 이러한 경향을 관찰할 수 있었다.

지터는 남성이 여성보다 더 큰 평균값과 표준편차 값을 보였다. 또한, 연령 그룹 간의 차이는 통계적으로 유의하지는 않았으나, 20–50대 집단을 비교해 보면 40대까지는 지터상의 큰 차이가 없다가 50대에 이르러 평균값과 표준편차 값이 커지는 양상이 관찰되었다. Baken(2005)에 따르면 지터는 20대에서 40대로 갈수록 작아지다가 50대를 기점으로 그 값이 급격하게 커지는 양상이 관찰되는데, 본 연구 결과에서도 지터의 변화 시기가 50대로 나타난 것이다. 요컨대, 지터 수치를 통해서는 남성 화자가 여성 화자에 비해, 노년 화자가 청년 화자에 비해 성대 진동 주기의 규칙성이 떨어진다는 것을 알 수 있었다.

한편, 시머는 성별에 따른 차이를 보이지는 않았으나 연령 그룹에 따른 차이를 보이는 파라미터였다. 시머 역시 지터와 마찬가지로 50대 그룹이 가장 큰 평균과 표준편차를 보여, 다른 집단으로부터 독립적인 양상을 보였다. 다시 말해, 대상 화자들 가운데 50대 화자들의 성대 진동의 진폭이 가장 불규칙하였다.

끝으로 NHR은 연령 그룹과 성별에 따른 차이는 모든 집단에서 관찰되었다. 우선 연령대를 기준으로 살피면 50대 그룹이 유의한 수준에서 다른 그룹보다 큰 값을 보였다. 한편, 성별의 경우는 남성이 여성에 비해 유의미하게 더 큰 값을 보이는 것을 관찰할 수 있었다. 즉, 5개 집단 가운데 50대 집단이 가장 높은 소음 비율을 보였고, 여성보다는 남성이 더 높은 소음 비율을 보여주었다.

이상의 논의를 요약하면 다음과 같다. 남녀 집단을 비교했을 때, 여성 화자는 높은 f0 값을 보이고 남성 화자는 높은 지터와 NHR 값을 보였다. 그리고 50대 그룹이 다른 연령 집단과는 구분되는 특징을 보여주었는데, 시머와 NHR 값이 크게 나타났다. 이러한 결과는 여성의 목소리는 남성보다 일반적으로 더 높은 음높이로 지각되며, 남성의 목소리가 여성에 비해 일반적으로 음높이가 낮고 거칠고 탁하게 지각된다는 우리의 경험을 뒷받침한다고 할 수 있다. 또한, 지터와 시머, NHR 결과를 종합하면, 연령이 높을수록 음성의 불안정성이 증가하고 소음이 섞인 음성을 더 많이 산출한다는 것을 확인할 수 있다. 특히, 본고의 자료에서는 50대 그룹이 이러한 특징을 두드러지게 보였는데, 해당 연령대가 갱년기로 인한 호르몬의 변화를 활발하게 겪는 시기이기 때문에 음성의 변동성이 크게 나타난 것으로 짐작된다.

다만, 60대 이상 그룹이 기존의 연구와는 다르게 50대 그룹보다 낮은 변동성을 보이고 있어, 연령의 증가에 따른 음성 파라미터의 변화를 연속적으로 설명하기 어려웠다. 이러한 결과에 대해서는 60대 이상 그룹의 분석 대상자 수가 상대적으로 적다는 점을 감안할 필요가 있다. 따라서 본고에서 나타난 60대 이상 집단의 결과를 일반화하기 위해서는 해당 집단의 분석 대상 수를 확충하여야 할 것이다.

5. 결론

본 연구에서는 음성 장애가 없는 성인 표준어 화자 309명이 8개의 모음을 연장 발성한 자료를 분석하여 한국어 모음의 음향음성학적 특성을 밝히고자 하였다. 이를 위해, 평균 f0, 지터, 시머, NHR 값을 보고하였으며, 이러한 음성 파라미터들에 영향을 주는 요인을 발성 모음의 종류와 연령, 성별로 나누어 살펴보았다. 분석 결과, 어떠한 모음을 발성하였는지가 음질 특성의 차이를 가져오는 주된 요인으로 밝혀졌다. 성별은 f0와 지터, NHR에, 연령은 시머와 NHR에 영향을 미치는 요인이었다.

본 연구는 20대부터 70대까지의 화자들을 5개의 연령 집단으로 세분하여 연령대별 음향음성학적 특징을 비교할 수 있었다. 또한, 다양한 모음을 분석함으로써 한국어 모음의 음질 특성을 다각적으로 검토할 수 있었으며, /ㅡ/ 모음이 주기와 진폭이 가장 안정적이고 소음도 적게 나타난 모음임을 밝혔다는 점에서 연구의 의의를 갖는다. 연구 결과, 연령과 성별, 모음의 종류에 따라 음성 파라미터 값이 달라지는 양상을 보이고 있기 때문에 이러한 집단 및 모음별 특성을 고려하여 음성의 정상성에 대한 기준을 확립할 필요가 있을 것이다.

다만, 임상에서 주로 사용하는 프로그램인 MDVP가 아닌 Praat을 이용하여 획득한 결과라는 점을 고려할 필요가 있다. 두 프로그램은 음성 파라미터를 분석하는 방식에 차이가 있기 때문에 본 연구의 수치를 활용하는 데에는 주의가 필요할 것이다. 두 프로그램의 차이에 대해서는 심상용 외(2014)에서 상세히 다루고 있어 참고가 될 것이다.

아울러, 분석 자료의 특성상 60대 이상의 연령층에 대한 자료의 규모가 상대적으로 작다는 한계가 있었다. 노년 화자는 노화로 인하여 음성의 변동성을 크게 보여주는 집단이기 때문에 보다 면밀한 검토가 필요하다. 따라서 이후 연구에서는 60대, 70대, 80대 화자 집단을 세분하고 데이터의 수를 확충하는 것이 바람직할 것이다. 뿐만 아니라, 연구의 범위를 10대 화자 집단으로도 확대하여 생애 주기에 걸친 음성 파라미터의 변화를 연속적으로 검토하는 것도 이루어져야 할 작업일 것이다.

각주(Footnote)

이 논문은 교신저자의 2017년 대한민국 교육부와 한국연구재단의 지원(NRF-2017S1A5A2A01024742)과 제1저자의 BK21 플러스 고려대학교 한국어문학 미래인재육성사업단의 지원으로 작성되었음.

참고문헌(References)

1.

Baken, R. J. (2005). The aged voice: A new hypothesis. Journal of Voice, 19(3), 317-325 .

2.

Cho, S. M. (2003). An acoustic study of Korean vowel system. Journal of the International Network for Korean Language and Culture, 24, 427-441. (조성문 (2003). 현대 국어의 모음 체계에 대한 음향음성학적인 연구. 한국언어문화, 24, 427-441.) .

3.

Choi, S. H., & Choi, C. H. (2015). The stability and variability based on vowels in voice quality analysis. Phonetics and Speech Sciences, 7(1), 79-86. (최성희·최철희 (2015). 음질 분석에 있어서 모음에 따른 안정성과 변이성. 말소리와 음성과학, 7(1), 79-86.) .

4.

Deem, J. F., Manning, W. H., Knack, J. V., & Matesich, J. S. (1989). The automatic extraction of pitch perturbation using microcomputers: Some methodological considerations. Journal of Speech and Hearing Research, 32(3), 689-697 .

5.

Gloud, W. J. (1975). Quantitative assessment of voice function in microlarnygology. Folia Phoniatrica et Logopaedica, 27(3), 190-200 .

6.

Hollien, H., & Shipp, T. (1972). Speaking fundamental frequency and chronologic age in males. Journal of Speech Language, and Hearing Research, 15(1), 155-159 .

7.

Honjo, I., & Isshiki, N. (1980). Laryngoscopic and voice characteristics of aged persons. Archives of Otolaryngology, 106(3), 149-150 .

8.

Horii, Y. (1980). Vocal shimmer in sustained phonation. Journal of Speech Language, and Hearing Research, 23(1), 202-209 .

9.

Horii, Y. (1982). Jitter and shimmer differences among sustained vowel phonations. Journal of Speech Language, and Hearing Research, 25(1), 12-14 .

10.

Jang, H., Shin, J., & Nam, H. (2015). Aspects of vowels by ages in Seoul dialect. Studies in Phonetics, Phonology and Morphology, 21(2), 341-358. (장혜진·신지영·남호성 (2015). 서울 방언 단모음의 연령별 실현 양상. 음성·음운·형태론 연구, 21(2), 341-358.) .

11.

Jun, E. O., & Ko, D. H. (2007). The voice quality of the children with cochlear implant according to the time. Speech Science, 14(4), 213-220. (전은옥·고도흥 (2007). 인공와우 이식시기에 따른 아동의 음질 특성. 음성과학, 14(4), 213-220.) .

12.

Kang, J., & Kong, E. (2016). Static and dynamic spectral properties of the monophthong vowels in Seoul Korean: Implication on sound change. Phonetics and Speech Sciences, 8(4), 39-47. (강지은·공은정 (2016). 서울 방언 단모음의 소리 변화와 음향 단서 연구: 단일지점 포먼트와 궤적 양상. 말소리와 음성과학, 8(4), 39-47.) .

13.

Kang, Y. A., Park, S. H., & Seong, C. J. (2009). Articulation characteristics of patients with idiopathic Parkinson's disease and normal-aging group: Articulatory rate & acoustic vowel space. Journal of Speech & Hearing Disorders, 18(3), 115-135. (강영애·박상희·성철재 (2009). 파킨슨병 환자와 정상 노인의 조음 특성 연구: 조음 속도와 모음 음향 공간. 언어치료연구, 18(3), 115-135.) .

14.

Ko, D. H. (2003). A study of extracting acoustic parameters for individual speakers. Speech Science, 10(2), 129-143. (고도흥 (2003). 개별화자의 음성파라미터 추출에 관한 연구 : 음성파라미터의 상관관계를 중심으로. 음성과학, 10(2), 129-143.) .

15.

Lee, H. J., & Kim, S. J. (2006). Age and sex differences in acoustic parameter of middle age and elderly adult voice. Malsori, 60, 13-28. (이효진·김수진 (2006). 장·노년기 성인 음성의 성별과 연령에 따른 음향음성학적 특성 비교. 말소리, 60, 13-28 .

16.

Lee, H., Shin, W., & Shin, J. (2017). A sociophonetic study on high/mid back vowels in Korean. Phonetics and Speech Sciences, 9(2), 39-51. (이향원·신우봉·신지영 (2017). 한국어 후설 고·중모음에 대한 사회음성학적 연구. 말소리와 음성과학, 9(2), 39-51.) .

17.

Morrison, M. D., & Gore-Hickman, P. (1986). Voice disorders in the elderly. The Journal of Otolaryngology, 15(4), 231-234 .

18.

Ohala, J. J., & Eukel, B. W. (1987). Explaining the intrinsic pitch of vowels. In R. Channon, & L. Shockey (Eds.), In honor of ilse lehiste/ilse lehiste pühendusteos. (pp. 207-215). Dordrecht: Foris .

19.

Orlikoff, R. F. (1995). Vocal stability and vocal tract configuration: An acoustic and electroglottographic investigation. Journal of Voice, 9(1), 173-181 .

20.

Ramig, L. A., & Ringel, R. L. (1983). Effects of physiological aging on selected acoustic characteristics of voice. Journal of Speech Language, Hearing Research, 26(1), 22-30 .

21.

Sapir, S. (1989). The intrinsic pitch of vowels: Theoretical, physiological, and clinical considerations. Journal of Voice, 3(1), 44-51 .

22.

Schötz, S. (2007). Acoustic analysis of adult speaker age. In C. Müller (Ed.), Speaker classification I: Fundamentals, features, and methods (Lecture Notes in Computer Science) (Vol. 1, pp. 88-107). Berlin: Springer .

23.

Shim, S. Y., Kim, H. H., Kim, J. O., & Shin, J. C. (2014). Difference in voice parameters of MDVP and praat programs according to severity of voice disorders in vocal nodule. Phonetics and Speech Sciences, 6(2), 107-114. (심상용·김향희·김재옥·신지철 (2014). 성대결절 음성 중증도에 따른 MDVP와 Praat 프로그램 별 파라미터 차이. 말소리와 음성과학, 6(2), 107-114.) .

24.

Shin, J. Y., & Cha, J. E. (2003). The system of Korean sounds. Seoul: Hankukmunhwasa. (신지영·차재은 (2003). 우리말 소리의 체계: 국어 음운론 연구의 기초를 위하여. 서울: 한국문화사.) .

25.

Shin, J., & Kim, K. (2017). Developing a Korean standard speech DB (II). Phonetics and Speech Sciences, 9(2), 9-22. (신지영·김경화( 2017). 한국인 표준 음성 DB 구축(II). 말소리와 음성과학, 9(2), 9-22.) .

26.

Sorensen, D., & Horii, Y. (1983). Frequency and amplitude perturbation in the voices of female speakers. Journal of Communication Disorders, 16(1), 57-61 .

27.

Sussman, J. E., & Sapienza, C. (1994). Articulatory, developmental, and gender effects on measures of fundamental frequency and jitter. Journal of Voice, 8(2), 145-146 .

28.

Whalen, D. H., & Levitt, A. G. (1995). The universality of intrinsic F0 of vowels. Journal of Phonetics, 23(3), 349-366 .

29.

Wilcox, K. A., & Horii, Y. (1980). Age and changes in vocal jitter. Journals of Gerontology, 35(2), 194-198 .