Reduction patterns of Korean diphthongs across different speech rates

Lee, Nara

doi:10.13064/KSSS.2026.18.1.045

Phonetics Speech Sci. 2026; 18(1):45-54

pISSN: 2005-8063, eISSN: 2586-5854

DOI: https://doi.org/10.13064/KSSS.2026.18.1.045

Phonetics/음성학

발화 속도에 따른 한국어 이중모음의 감쇄 패턴^*

이나라 ¹ ^, ^*

Reduction patterns of Korean diphthongs across different speech rates^*

Nara Lee ¹ ^, ^*

Author Information & Copyright ▼

¹고려대학교 학부대학

¹University College, Korea University, Seoul, Korea

^*Corresponding author : nara2nara@korea.ac.kr

© Copyright 2026 Korean Society of Speech Sciences. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: Feb 04, 2026; Revised: Mar 10, 2026; Accepted: Mar 11, 2026

Published Online: Mar 31, 2026

국문초록

이 연구의 목적은 한국어의 이중모음이 발화 속도에 따라 어떻게 실현되는지를 살펴보고, 한국어 이중모음의 주요 구성 성분이 무엇인지를 고찰해 보는 것이다. 이를 위하여 수도권 화자에게 이중모음이 어두에 위치한 문장을 보통 속도와 빠른 속도로 낭독시켰다. 그 후에는 이중모음을 이루고 있는 세 가지 요소인 활음, 핵모음, 전이 구간(F2의 기울기)을 측정하였다. 그 결과 j계 이중모음의 경우 활음이 발화 속도에 상관없이 안정적으로 실현된 반면 핵모음과 F2의 기울기는 속도에 따라 유의미한 차이가 났다. w계 이중모음은 F2의 기울기가 발화 속도에 상관없이 일정했으나 활음과 핵모음이 속도에 따라 유의미한 차이를 보였다. 이 결과를 바탕으로 보면 j계 이중모음은 목표점, 그중에서도 활음의 목표점이 중요한 구성 성분인 것으로 보이며 w계 이중모음은 목표점보다는 기울기가 중요한 구성 성분인 것으로 보인다. 또한 이 결과는 발화 속도에 따른 이중모음의 실현 양상이 하나의 조음 양상으로 설명되기보다는 한 언어 내에서도 활음과 같은 하위 분류에 따라 서로 다른 조음 전략으로 실현될 수 있음을 보여준다.

Abstract

This study investigates how Korean diphthongs are realized as a function of speech rate and examines which components constitute their core elements. To this end, speakers of the Seoul dialect were asked to read sentences containing word-initial diphthongs at two speech rates: normal and fast. Three components of diphthong realization were analyzed: the glide, the following nucleus vowel, and the transition between them, measured in terms of the F2 slope. The results showed that for j-glide diphthongs, the glide was realized stably regardless of speech rate, whereas the nucleus vowel and the F2 slope exhibited significant differences across speech rates. In contrast, w-glide diphthongs displayed a stable F2 slope across speech rates, while both the glide and the nucleus vowel varied significantly as a function of speech rate. These findings suggest that in j-glide diphthongs, the glide target point constitutes the core component of diphthong realization, whereas in w-glide diphthongs, the F2 slope, rather than the target points, plays a more central role. Overall, the results indicate that diphthong realization under different speech-rate conditions cannot be accounted for by a single articulatory pattern. Instead, even within a single language, diphthongs may be realized through different articulatory control strategies.

Keywords: 이중모음; 활음; 핵모음; 발화 속도; 기울기; 목표점

Keywords: diphthong; glide; nucleus vowel; speech rate; slope; target point

1. 서론

이 연구의 목적은 한국어의 이중모음이 발화 속도에 따라 어떠한 패턴으로 감쇄되는지를 살피고, 이를 바탕으로 한국어의 이중모음을 구성하는 주요한 구성 성분이 무엇인지를 고찰해 보는 데 있다. 이를 위하여 두 가지 발화 속도(보통 속도, 빠른 속도)에서 j계 이중모음과 w계 이중모음이 어떻게 실현되는지를 살펴보았다.

한국어의 이중모음은 ‘활음’과 ‘단모음(핵모음)’의 결합으로 이루어진다¹. 여기에는 활음의 목표점, 후행하는 핵모음의 목표점, 활음의 목표점에서 핵모음의 목표점으로 가는 전이 구간이 포함된다. Byrd & Tan(1996), Moon & Lindblom(1994) 등의 연구에 따르면 빠른 발화 속도에서는 분절음의 감쇄가 일어난다. 이를 바탕으로 본 연구에서는 이중모음을 구성하는 여러 성분 중에 빠른 속도로 인한 조음적 감쇄의 영향을 덜 받는 구성 성분이 무엇인지를 살펴보고자 한다. 빠른 속도라는 제약하에서 감쇄되지 않고 유지되는 성분이 이중모음의 주요 구성 성분이라고 할 수 있을 것이기 때문이다(Jha, 1985).

Petersen(2018)은 발화 속도에 따른 이중모음의 실현 패턴을 두 가지 가설로 유형화하였다. 그중 하나는 ‘기울기 유지 가설(slope-constant hypothesis)’이다. 이 가설에서는 이중모음의 F2 변화율은 발화 속도에 상관없이 일정하게 유지되지만, 목표점의 주파수는 달라진다고 가정한다. 따라서 이 가설에서는 이중모음의 주요 구성 요소가 F2의 변화율(기울기)이라고 본다.

두 번째 가설은 ‘주파수 유지 가설(frequency-constant hypothesis)’로, 여기에서는 이중모음의 목표점이 속도에 상관없이 안정적으로 유지된다고 가정한다. 이 가설에 따르면 발화 속도가 증가하면 목표점은 비교적 일정하게 유지되지만 기울기가 달라진다. 따라서 이 가설에서는 이중모음의 주요 구성 요소가 목표점의 주파수라고 볼 수 있다.

요약하면 두 가설의 차이는 발화 속도 변화에 따라 어떤 요소가 안정적으로 유지되는가에 있다. 기울기 유지 가설은 F2 변화의 기울기를, 주파수 유지 가설은 시작점과 끝점의 목표 주파수를 이중모음의 주요 요소라고 가정한다.

Gay(1968)와 Jha(1985)의 연구 결과는 기울기 유지 가설을 지지한다. Gay(1968)에서는 미국 영어의 다섯 가지 이중모음(/ɔɪ/, /ɑɪ/, /ɑʊ/, /eɪ/, /oʊ/)을 세 가지 발화 속도(보통 속도, 빠른 속도, 느린 속도)로 낭독시키고 그 실현을 살펴보았다. 그 결과 시작점의 목표점과 F2의 기울기는 속도와 상관없이 유지되었으나, 끝점의 목표점은 속도에 따라 다른 양상을 보였다². Jha(1985)는 마이틸리어(Maithili)의 두 이중모음(/əi/, /əu/)을 대상으로 비슷한 실험을 하였다. 그 결과 Gay(1968)와 마찬가지로 속도와 상관없이 시작점의 목표점과 F2의 기울기가 유지된다는 사실을 관찰하였으며, 이 두 가지가 이중모음에서 중요한 요소임을 주장하였다.

반면 Dolan & Mimori(1986)에서는 영어와 일본어를 대상으로 속도에 따른 이중모음의 실현을 살폈는데, 두 언어에서 모두 속도에 따라 F2의 기울기가 달라지는 것을 확인하였다. 그에 비해 목표점의 위치는 상대적으로 안정적이었다. 이는 Petersen(2018)이 말한 주파수 유지 가설을 지지하는 결과이다.

그렇다면 한국어 이중모음의 경우는 어떠할까? 본고에서는 한국어 이중모음의 속도에 따른 실현 양상을 관찰하여 두 가설 중 어느 가설에 더 부합하는지를 살펴보고자 한다. 물론 한국어의 이중모음은 j 활음과 w 활음이 핵모음에 선행하는 상향 이중모음이라는 점에서 선행 연구에서 관찰한 언어들의 이중모음과 성격이 다르지만, 두 개의 목표점과 전이 구간을 포함한다는 점에서 조음이 동적이라는 공통점을 가지며 따라서 이전 연구들과 비슷한 방식으로 조음 전략을 관찰할 수 있다.

또한 본고에서는 활음 유형(j계인지 w계인지)을 중요한 변수로 보고 연구를 진행하였다. 한국어에서 두 활음이 조음적으로 다른 특성을 가지고 있다고 보고되었기 때문이다. 특히 w 활음의 경우 j 활음에 비해 목표점에 수렴하지 않고 후행 핵모음의 영향을 많이 받는다(Hwang & Ha, 2024; Lee, 2024). 따라서 본고에서는 발화 속도를 다르게 했을 때 두 활음의 조음적 차이가 어떻게 나타나는지를 살펴보고 조음적으로 역동적인 이중모음을 보다 정교하게 살펴보고자 한다.

이상을 종합하여 이 연구에서는 다음과 같은 연구 질문을 설정하였다. 첫째, 발화 속도가 증가하면 이중모음은 어떠한 감쇄 패턴을 보이며, 이 패턴은 두 가설(기울기 유지 가설, 주파수 유지 가설) 중 어느 가설에 더 부합하는가? 둘째, 한국어 이중모음에서는 활음 유형(/j/, /w/)에 따라 감쇄 패턴이 다르게 나타나는가?

2. 연구 방법

2.1. 낭독 자료

실험에서는 목표음이 어두에 등장하는 유의미한 문장을 실험 참가자들에게 낭독시켰다³. 목표음은 본고의 분석 대상인 j계 이중모음 6개(/ㅑ, ㅒ, ㅖ, ㅠ, ㅛ, ㅕ/)와 w계 이중모음 6개(/ㅘ, ㅙ, ㅞ, ㅚ, ㅟ, ㅝ/)와 더불어 단모음 8개(/ㅏ, ㅐ, ㅔ, ㅣ, ㅡ, ㅗ, ㅜ, ㅓ/)로, 해당 목표음이 어두에 위치한 20개의 문장을 생성하였다. 목표음의 후행 분절음으로는 레이블이 용이하도록 폐쇄음을 선택하였다. 본고에서는 해당 목표음이 포함된 유의미 단어를 사용하였기 때문에 폐쇄음 중에서도 사전 표제어에서 가장 높은 빈도를 보이는 /ㄱ/(Shin, 2010)를 선정하였으며, 모든 문장은 8음절짜리 문장이 되도록 하였다. 표 1에 실험 문장 일부를 제시하였다⁴.

표 1. | Table 1. 실험 문장 예시 | Example sentences used as reading materials

목표음	문장
j계 이중모음	야금야금 파먹었다.
w계 이중모음	와글와글 시끄럽다.
단모음	아기들이 놀고 있다.

Download Excel Table

2.2. 실험 방법

낭독 실험에는 20대의 대학생 19명이 참여하였다. 그중 남성은 9명, 여성은 10명이었으며 모두 수도권에서 태어나고 자란 서울 방언 화자들이었다. 실험 참가자의 평균 연령은 23.8세(SD=1.76)였다.

실험은 고려대학교 음성언어정보연구실 내의 방음실에서 SONY사(Tokyo, Japan)의 PCM D-50을 이용하여 진행되었다. 우선 실험 참가자들에게 대본의 문장을 보통 속도로 낭독하도록 요청하였다. 모니터에 문장이 하나씩 임의의 순서대로 제시되면 본인이 편안한 속도로 읽으면서 화면을 전환하도록 하였다.

다음으로는 빠른 속도로 읽어줄 것을 요청하였다. 빠른 속도의 낭독에서도 한 화면에 하나의 문장이 제시되었으나, 빠른 속도의 경우에는 화면이 자동으로 전환되도록 하였다. 화면은 1.4초마다 다음 문장으로 넘어가도록 설정하였는데 1.4초로 설정한 이유는 다음과 같다. Lee & Ko(2004)에서 6명의 대학생들에게 2개의 음운구로 구성된 9음절짜리 문장을 빠른 속도로 읽게 하였을 때 평균 약 7.75 sps의 발화 속도를 보였다. 이를 8음절 문장으로 속도를 환산해 보면 약 1초에 8음절을 낭독하는 수준이다. 여기에 화면 전환 시간까지 고려하여 한 문장당 1.4초의 시간을 부여하였다.

아울러 보통 속도 낭독의 경우와는 다르게 화면이 자동으로 전환되도록 설정한 이유는 해당 목표음이 실험 설계 목표와 다르게 어두에서 실현되지 않을 것을 우려해서였다. 본 실험 전에 실시했던 예비 실험에서 참가자에게 화면을 스스로 전환해 가며 빠른 속도로 낭독할 것을 요청하였을 때, 지나치게 빠른 속도로 읽는 나머지 한 문장이 끝나고 휴지 없이 다음 문장으로 바로 넘어가는 경우가 많았다. 이런 경우 뒷문장의 목표음은 어두에서 실현되지 않게 된다. 이러한 이유로 빠른 속도 낭독에서는 1.4초 간격으로 화면이 자동으로 전환되게 하였다. 또한 빠른 속도로 낭독을 시작하기 전에 연습 문장 5개를 제시하여 해당 속도에 익숙해지도록 하였다.

낭독하다 틀렸거나 목표음을 제대로 낭독하지 않은 문장은 연구자가 체크하였다가 모든 문장을 다 낭독한 후 다시 읽도록 요청하였다. 빠른 속도의 경우에는 속도를 일정하게 유지하기 위하여 틀린 문장의 앞뒤 문장까지 낭독해 줄 것을 요청하였다.

2.3. 분석 방법

낭독 실험에서 수집된 음성 중 분석 대상이 된 토큰은 단모음 304개(8개의 모음×19명의 참가자×2개의 속도), 이중모음 456개(12개의 모음×19명의 참가자×2개의 속도)로 총 760개였다. 수집된 음성은 그림 1과 같이 레이블링의 과정을 거쳤다. F1과 F2가 둘 다 관찰되는 지점에서 가장 가까운 영교차점을 시작점으로, F1과 F2 중 하나라도 보이지 않기 시작하는 지점에서 가까운 영교차점을 끝점으로 레이블하였다.

그림 1. | Figure 1. 레이블링 예시 | Example of labeling used in the analysis

Download Original Figure

레이블링이 끝난 후에는 포먼트를 추출하였다. 남성의 최대 포먼트는 5,000 Hz, 여성의 최대 포먼트는 5,500 Hz로, 추출 포먼트 수는 5개로 설정하였다. 포먼트 추출 시에는 측정 오류를 최소화하고자 반자동 스크립트를 이용하여 최대 포먼트 값과 추출 포먼트 수를 조절하면서 측정하였다. 단모음은 50% 지점에서, 이중모음은 10개 지점(0%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%)에서 F1과 F2를 추출하였다. 추출이 끝난 후 F1과 F2를 z-score 방식으로 정규화하였으며 이후 본고에서 제시하는 F1, F2는 모두 정규화한 값이다. 정규화를 거친 후에는 –3에서 3의 범위 밖에 분포한 데이터를 제거하였다. 이렇게 제거된 데이터는 이중모음이 16개, 단모음이 19개였으며 따라서 최종적으로 분석 대상이 된 데이터는 725개였다.

이후에는 두 목표점(활음의 목표점, 후행 핵모음의 목표점)의 위치와 F2의 기울기를 측정하였다. 여기에서 활음의 목표점은 이중모음의 시작 지점이라고 볼 수 있다. 하지만 후행 핵모음의 목표점은 어디인지, 어느 구간의 기울기를 측정해야 하는지가 문제가 된다. Lee(2024)에서 지적한 바 있듯이 이중모음을 음향음성학적으로 분석한 대부분의 연구에서 ‘전이 구간’이나 핵모음의 ‘안정 구간’은 연구자의 주관으로 정해지는 경우가 많다. 또 문제가 되는 것은 그림 1에서 관찰할 수 있듯이 빠른 속도의 이중모음 실현에서는 안정 구간이 관찰되지 않는 경우가 많다. 이 문제를 해결하기 위하여 Lee(2024)에서는 핵모음이 목표점에 가장 가깝게 도달하는 지점을 측정하였다. 그 결과 이중모음의 60% 지점이 핵모음의 목표점에 가장 가깝게 도달한다는 것을 밝혔다. 또한 이중모음이 활음의 목표점부터 핵모음의 목표점까지 이동한다는 가정하에 0% 지점에서 60% 지점까지를 이중모음의 이동 궤적이라고 보고 이에 대한 양상을 살펴보았다.

이 연구에서도 이와 같은 방법론을 사용하여 분석을 진행하였다. 우선 빠른 속도에서도 핵모음의 목표점이 60%에서 실현되는지를 살피기 위하여 핵모음의 도달 위치를 측정하였다. 이를 위해 이중모음을 10등분하여 측정한 10개 지점 중에 어느 지점이 해당 핵모음의 목표점에 가장 가깝게 도달하는지를 살펴보았다⁵. 이때의 거리는 유클리드 공식을 이용해 측정하였고, 이를 통하여 핵모음의 목표점을 구하였다. 이를 수식으로 나타내면 수식 (1)과 같다(m=단모음, d=이중모음, t=0, 10, 20, 30, 40, 50, 60, 70, 80, 90).

거리 t = (F 1 d t − F 1 m 50) 2 + (F 2 d t − F 2 m 50) 2

(1)

다음으로는 F2의 기울기를 구하였다. 기울기는 활음의 목표점에서부터 핵모음의 목표점까지의 F2의 변화량을 핵모음의 목표점부터 활음의 목표점까지의 시간으로 나누어 측정하였다. 여기에서 기울기의 방향은 중요하지 않으므로 F2의 변화량에는 절댓값을 씌웠다. 이를 수식으로 나타내면 수식 (2)와 같다.

기울기 = | Δ F 2 | Δ t = | F 2 핵모음목표점 − F 2 활음목표점 | t 핵모음목표점 − t 활음목표점

(2)

3. 결과

3.1. 이중모음의 길이

우선 실험의 의도대로 발화 속도에 따라 이중모음의 길이 실현에 차이가 있었는지를 살펴보았다. 보통 속도에서 발화한 이중모음의 평균 길이는 111.48 ms(SD: 24.57), 빠른 속도의 평균은 88.28 ms(SD: 18.97)인 것으로 나타났다. 그림 2에는 j계 이중모음과 w계 이중모음이 속도에 따라 길이가 어떻게 실현되었는지를 박스플롯으로 제시하였다. 이와 함께 이중모음이 두 수준의 속도에서 실현된 길이가 유의미한 차이가 있는지 혼합효과모델(mixed-effects model)을 이용하여 검정해 보았다. 이때 고정 효과는 발화 속도(빠른 속도, 보통 속도)와 활음(j계, w계)의 유형, 임의 효과는 모음의 종류(/ㅘ, ㅝ, ㅑ, ㅕ/ 등)와 화자로 설정하였다.

그림 2. | Figure 2. 발화 속도에 따른 이중모음의 길이(왼쪽: j계, 오른쪽: w계) | Diphthong duration as a function of speech rate (left: j-glides, right: w-glides)

Download Original Figure

그 결과 발화 속도의 주효과가 유의미한 것으로 나타났다(β=21.22, SE=4.41, t=4.82, p<0.001). 즉 보통 속도에서의 길이가 빠른 속도에서의 길이보다 유의미하게 긴 것을 관찰할 수 있었으며, 이는 실험의 의도대로 산출이 잘 되었음을 의미한다. 반면 활음의 유형에 따른 주효과는 유의미하지 않음을 관찰할 수 있었다(β=4.50, SE=6.04, t=0.745, p>0.05).

3.2. 핵모음 실현 위치

활음에 후행하는 핵모음이 이중모음의 어느 부분에서 목표점에 가장 가깝게 실현되는지를 살펴보았다. 그림 4에는 측정 위치별로 목표점과의 거리를 측정하여 제시하였다. 이 경우에 x축이 나타내는 ‘측정 위치’는 연속적인 시간의 차원이기 때문에 어느 지점이 가장 거리가 짧은지를 통계적으로 검정하기보다는 기술적인 통계를 통해 살펴보도록 하겠다.

그림 3. | Figure 3. 핵모음의 목표점과의 거리(위: j계, 아래: w계) | Distance from the nucleus vowel to the target point (top: j-glides, bottom: w-glides)

Download Original Figure

그림 4. | Figure 4. 두 목표점과 F2 기울기 실현 양상 | Realization patterns of the two target points and the F2 slope

Download Original Figure

그림 3의 상단은 j계 이중모음, 하단은 w계 이중모음이며, 각 측정 위치에서 왼쪽의 박스는 보통 속도, 오른쪽의 박스는 빠른 속도에서 측정한 값을 나타낸다. 상하단의 그림에서 모두 핵모음의 목표점과의 거리는 포물선의 형태를 보인다. 박스의 분포를 보면 j계의 경우 보통 속도, 빠른 속도 모두 60%–70% 지점에서 가장 짧은 거리를 보여준다. 또 이 두 지점 모두에서 빠른 속도보다는 보통 속도에서 목표점으로부터의 거리가 더 짧다. w계는 보통 속도의 경우 50%–60% 지점에서, 빠른 속도의 경우에는 40%–50% 지점에서 목표점과 가장 가까워짐을 알 수 있다. 중앙값의 분포를 조금 더 자세히 살펴보기 위해 표 2에 각 지점에서의 중앙값을 제시하였다.

표 2. | Table 2. 핵모음의 목표점과의 거리(중앙값) | Distance from the nucleus vowel to the target point (median)

활음 종류	측정 위치	거리 (보통 속도)	거리 (빠른 속도)
j	0	2.36	2.48
	10	1.96	2.17
	20	1.66	1.75
	30	1.29	1.50
	40	0.94	1.19
	50	0.75	0.95
	60	0.64	0.84
	70	0.65	0.87
	80	0.69	0.92
	90	0.90	0.95
w	0	1.81	1.54
	10	1.49	1.29
	20	1.19	1.00
	30	0.97	0.78
	40	0.75	0.74
	50	0.61	0.69
	60	0.60	0.82
	70	0.71	0.88
	80	0.96	1.10
	90	1.23	1.45

Download Excel Table

표 2를 보면 j계의 경우 보통 속도, 빠른 속도 모두 60% 지점에서 가장 거리가 가까워지고 있음을 관찰할 수 있었으며 빠른 속도일 때보다 보통 속도일 때 목표점에 더 가까워지고 있음을 알 수 있었다. w계의 경우 보통 속도일 때는 60% 지점에서, 빠른 속도에서는 50% 지점에서 목표점과 가장 가까워졌다. 가장 가까워지는 지점을 기준으로 보았을 때 w계 역시 j계와 마찬가지로 보통 속도일 때 목표점에 더 가까워지는 것으로 보이나 j계만큼의 차이는 보이지 않았다. 이 결과는 이중모음의 핵모음이 어느 지점에서 실현되는지를 보여준다. 따라서 이 연구에서는 j계 이중모음(보통 속도, 빠른 속도)과 w계 이중모음(보통 속도)의 핵모음 실현 위치를 60% 지점으로 설정하였으며, 빠른 속도의 w계 이중모음은 50% 지점으로 설정하고 연구를 진행하였다.

3.3. 첫 번째 목표점: 활음

j 활음과 w 활음이 목표점(각각 단모음 /ㅣ/와 /ㅜ/)에 얼마나 가깝게 실현되는지를 이중모음의 0% 지점과 단모음 /ㅣ/ 혹은 /ㅜ/의 50% 지점 간 유클리드 거리를 통해 측정하였다. 특히 발화 속도에 따라서 실현 양상이 어떻게 달라지는지에 집중하여 그 양상을 살펴보았다. 그 결과, j 활음의 경우 보통 속도에서는 목표점에서 평균 0.74(SD: 0.41)만큼 떨어져 있었으나 빠른 속도에서는 평균 0.79(SD: 0.55)만큼 떨어져 있었다. w 활음의 경우 보통 속도에서는 평균 1.04(SD: 0.74)만큼 떨어져 있었으며 빠른 속도의 경우 평균 1.42(SD: 0.70)만큼 떨어져 있는 것을 확인할 수 있었다. 속도에 상관없이 w 활음이 j 활음보다 목표점으로부터의 거리가 더 멀었으며 표준편차도 더 컸다. 속도에 따른 차이는 j 활음보다는 w 활음이 더 컸다. 이를 조금 더 자세히 알아보기 위하여 그림 4의 가장 상단 (A)에 박스플롯을 제시하였다. 이 박스플롯을 보면 j 활음에 비해 w 활음의 분포가 넓게 퍼진 것을 관찰할 수 있다.

마지막으로 활음 시작점에서 목표점까지의 거리가 발화 속도와 활음의 종류에 따라 어떻게 달라지는지를 살펴보기 위해 혼합효과모델을 적용해 보았다. 이때 발화 속도와 활음의 종류, 그리고 둘 간의 상호작용을 고정 효과로, 화자와 모음의 유형을 임의 효과로 설정하였다. 결과는 표 3에 제시하였다.

표 3. | Table 3. 활음과 목표점과의 거리 혼합효과모델 요약 | Summary of the linear mixed-effects model for the distance between glides and their target points

Fixed effect⁶	Estimate	SE	t-value	p-value
(절편)	0.798	0.185	4.320	0.001
발화 속도 (보통-빠른)	–0.053	0.079	–0.671	0.504
활음 유형 (w계-j계)	0.626	0.256	2.446	0.033
속도 × 유형	–0.327	0.085	–3.832	<0.001

Random effect	Variance	SD
화자	0.024	0.154
모음 유형	0.186	0.431
잔차	0.200	0.447

Download Excel Table

표 3을 보면 발화 속도와 활음 유형 간의 상호작용이 유의미하게 나타났다. 이는 발화 속도에 따른 거리 변화 양상이 j 계열과 w 계열에서 동일하지 않음을 의미한다. 고정효과의 주효과를 살펴보면, 기준 조건인 빠른 속도에서 w 계열은 j 계열에 비해 활음의 시작점에서 목표점까지의 거리가 유의미하게 더 크게 나타났다. 반면, j 계열을 기준으로 한 발화 속도의 주효과는 유의미하지 않았다.

상호작용 효과를 더욱 구체적으로 확인하기 위해 추정된 주변평균(estimated marginal means)을 이용한 후속 분석을 실시하였다. 그 결과, 발화 속도에 따른 거리 차이는 w계에서만 유의미하게 나타났으며(빠른 속도-보통 속도=0.38, SE=0.08, t=4.83, p<0.001), j계에서는 유의미하지 않았다(빠른 속도-보통 속도=0.05, SE=0.08, t=0.67, p=0.50).

3.4. 두 번째 목표점: 핵모음

다음으로는 핵모음이 목표점과 얼마나 가깝게 실현이 되는지를 활음 종류별, 발화 속도별로 살펴보았다. 핵모음의 목표점 측정 위치는 3.2의 결과를 참고하여 j계 보통 속도, 빠른 속도, w계 보통 속도에서는 60% 지점, w계 빠른 속도의 경우에는 50% 지점으로 설정하였다. 측정 결과 j계 이중모음은 보통 속도에서는 핵모음의 목표점과 평균 0.76(SD: 0.63)만큼 떨어져 있었으며, 빠른 속도에서는 0.95(SD:0.50)만큼 떨어져 있었다. 즉 j계 이중모음은 빠른 속도에서보다 보통 속도에서 목표점에 더 가깝게 도달했다. w계의 경우 보통 속도에서는 평균 0.67(0.38)만큼, 빠른 속도에서는 0.79(0.51)만큼 떨어져 있다는 것을 확인하였다. w계 역시 j계와 마찬가지로 보통 속도에서 더 목표점과 가깝게 실현이 되었지만, 속도 간 차이는 j계만큼 두드러지지는 않았다. 아울러 그림 4의 가장 하단 (C)에 핵모음의 목표점 위치와의 거리에 대한 박스플롯을 제시해 두었다.

다음으로 핵모음의 목표점과의 거리가 발화 속도와 활음의 종류에 따라 유의미한 차이를 보이는지를 알아보기 위하여 혼합효과모델을 적용해 보았다. 고정 효과와 임의 효과는 표 3의 경우와 동일하게 설정하였으며 결과는 표 4에 제시하였다.

표 4. | Table 4. 핵모음과 목표점과의 거리 혼합효과모델 요약 | Summary of the linear mixed-effects model for the distance between nucleus vowels and their target points

Fixed effect	Estimate	SE	t-value	p-value
(절편)	0.946	0.119	7.93	<0.001
발화 속도 (보통-빠른)	–0.192	0.068	–2.84	0.006
활음 유형 (w계-j계)	–0.152	0.165	–0.92	0.377
속도 × 유형	0.065	0.084	0.77	0.439

Random effect	Variance	SD
화자	0.010	0.101
모음 유형	0.071	0.267
잔차	0.192	0.438

Download Excel Table

표 4를 보면 발화 속도의 주효과가 유의미하게 나타났는데, 보통 속도에서 빠른 속도보다 더 짧은 거리를 보이는 경향이 있었다. 반면 활음 유형의 주효과는 유의미하지 않았으며 두 변수 간 상호작용도 유의미하지 않았다.

3.5. F2의 기울기

첫 번째 목표점부터 두 번째 목표점까지 F2의 변화량을 측정하였다. j계의 경우 이중모음의 0% 지점에서 60% 지점까지의 F2 기울기를 측정하였고 w계의 경우 보통 속도에서는 0%에서 60% 지점까지, 빠른 속도에서는 0%에서 50% 지점까지의 F2 기울기를 측정하였다. 그 결과 보통 속도의 j계 이중모음에서는 기울기 평균이 17.39(SD: 10.60), 빠른 속도에서는 21.17(SD: 13.12)로 나타났다. 보통 속도의 w계 이중모음에서는 기울기 평균이 9.09(SD: 7.65), 빠른 속도에서는 9.96(SD: 9.72)으로 나타났다. 기울기에 대한 박스플롯은 그림 4 중앙에 위치한 (B)에서 확인 가능하다.

이를 보면 전체적으로 j계의 기울기가 w계보다 크다. 또 두 유형의 이중모음 모두 빠른 속도에서의 기울기가 보통 속도에서의 기울기보다 더 크다. 하지만 그 차이는 w계보다는 j계에서 더 크게 나타났다. 표준편차와 그림 4의 (B)를 보면 j계는 기울기 분포 범위가 넓지만 이에 비해 w계는 분포가 크지 않다.

다음으로 F2의 기울기가 발화 속도별, 활음 유형별 유의미한 차이를 보이는지를 알아보기 위하여 혼합효과모델을 적용하였다. 고정 효과 및 임의 효과는 표 3, 표 4와 동일하게 설정하였으며, 검정 결과를 표 5에 정리하였다. 표를 보면 발화 속도의 주효과가 유의미한 것으로 보이며, 보통 속도에 비해 빠른 속도일 때 F2 기울기가 커지는 경향을 보이는 것을 알 수 있다. 또한 활음 유형의 주효과도 유의미하게 나타났으며, 발화 속도와 활음 유형 간 상호작용 효과도 유의미하게 나타났다. 이것으로 보아 발화 속도에 따른 F2 기울기의 변화 양상이 j 계열과 w 계열에서 다르게 나타남을 알 수 있다.

표 5. | Table 5. F2 기울기 혼합효과모델 요약 | Summary of the linear mixed-effects model for F2 slope

Fixed effect	Estimate	SE	t-value	p-value
(절편)	21.124	3.545	5.96	<0.001
발화 속도 (보통-빠른)	–3.763	1.059	–3.55	<0.001
활음 유형 (w계-j계)	–11.138	4.990	–2.23	0.49
속도 × 유형	2.2919	1.334	2.19	0.29

Random effect	Variance	SD
화자	2.117	1.455
모음 유형	71.939	8.482
잔차	48.758	6.983

Download Excel Table

F2 기울기 역시 추정된 주변평균을 이용한 후속 분석을 실시하였다. 그 결과, j계 이중모음은 빠른 속도와 보통 속도 간 F2 기울기 차이가 유의미하게 나타난 반면(빠른-보통=3.76, SE=1.06, t=3.55, p<0.001), w계 이중모음에서는 유의미하지 않은 것으로 나타났다(빠른-보통=0.84, SE=1.06, t=0.80, p=0.426).

4. 논의

지금까지 한국어의 이중모음이 발화 속도에 따라 어떻게 실현되는지를 살펴보았다. 핵모음의 실현 위치와 기울기를 측정할 지점을 정하기 위해 ‘핵모음이 어디에서 목표점에 가장 가깝게 도달하는지’를 우선 살펴보았다. 그 결과 j계 이중모음은 속도에 상관없이 60%–70% 지점에서 목표점에 가장 가깝게 실현되었지만, w계 이중모음은 보통 속도에서는 50%–60% 지점, 빠른 속도에서는 40%–50% 지점에서 목표점에 가장 가까워졌다. w계 이중모음이 j계 이중모음에 비해 목표점에 더 빨리 가까워진다는 것은 Lee(2024)에서 관찰한 바와 같다. 이 연구에서 추가적으로 관찰이 가능했던 것은 j계 이중모음의 경우 속도에 상관없이 핵모음의 위치가 고정적인 것에 비해 w계 이중모음의 경우 속도가 빨라지면 핵모음의 실현도 더 빨라진다는 것이다.

이러한 관찰은 자연스럽게 이중모음의 첫 번째 목표점인 활음 시작 부분의 실현과 연결된다. Lee(2024)에서는 j계에 비해 w계 활음의 시작점이 유동적으로 실현되며, 후행 핵모음의 영향을 크게 받는다고 보고하였다. 반면 j계는 시작점이 비교적 고정적이었다. 이러한 특징은 발화 속도를 달리했을 때도 나타났다. j계 이중모음은 보통 속도일 때의 시작점 분포와 빠른 속도일 때의 시작점 분포가 유의미한 차이를 보이지 않았다. 반면 w계 이중모음은 보통 속도일 때와 빠른 속도일 때 유의미한 차이를 보였으며, 빠른 속도일 때 목표점에 더 가까이 도달하지 못한 것으로 관찰되었다.

이러한 경향성은 /w/와 /j/ 조음 시 혀의 위치를 초음파를 통해 관찰한 Hwang & Ha(2024)에서도 보고되었다. 해당 연구에 따르면 /j/는 조음점이 /ㅣ/에 수렴하지만 /w/는 그에 비해 산포적 양상을 보였다. Lee(2024)와 Hwang & Ha(2024)에서 지적한 바 있듯이 이러한 경향을 보이는 이유로 생각해 볼 수 있는 것은 두 활음의 조음적 차이이다. 조음에 혀만이 관여하는 j 활음에 비해 w 활음은 혀뿐 아니라 입술이 조음에 관여한다. 즉 짧은 지속 시간 내에 핵모음으로 이동하며 원순 제스처를 약화시킨 것이라고 생각해 볼 수 있다.

이러한 활음의 특성은 한국어의 구어에서 수의적으로 일어나는 활음 탈락 현상을 설명할 수 있다. j 활음의 경우 표준 발음법 제5항의 예외 항목⁷을 제외하면 구어에서 탈락되는 경우가 드물다. 이는 j 활음의 조음 위치가 후행 환경이나 발화 속도와 상관없이 고정적으로 실현이 된다는 점과 연결지어 생각해 볼 수 있다. 반면 w 활음은 한국어의 구어에서 빈번히 탈락된다고 보고되고 있다. 한 예로 자유발화에서 /w/의 실현을 살핀 Ha(2018)에서는 w 활음 유지형이 35%였던 것에 비해 탈락형이 65%에 달한다고 보고하였는데, 이를 보면 구어에서는 /w/ 탈락형이 유지형보다 우세하다는 것을 알 수 있다. 이는 지금까지 본고에서 살펴본 w 활음의 불안정한 조음 위치에서 기인하는 것으로 해석이 가능하다. 한편 /w/의 이러한 특징은 범언어적인 특성은 아닌 것으로 보인다. Stevens & Keyser(1989)에서는 영어 /w/의 주요 자질(primary feature)을 ‘원순성’으로 보고 있다. 즉 영어에서는 /w/가 원순성을 확실히 가지고 실현되며, 한국어만큼 불안정한 조음을 보이지는 않을 것이라는 것을 짐작해 볼 수 있다. 이는 한국어와 달리 영어에서는 /w/가 탈락한다는 보고가 찾아보기 힘들다는 점과도 관련이 있을 것이다.

다음으로 핵모음의 목표점을 살펴보면 j계 이중모음과 w계 이중모음에서 속도 효과가 유의미하게 나타났으며, 활음 유형의 주효과나 발화 속도와 활음 유형 간 상호작용은 유의미하지 않았다. 이는 발화 속도가 빨라질수록 핵모음의 목표점에 대한 도달 정도가 전반적으로 감소하는 경향이 있음을 의미한다. 이러한 속도 효과는 j 계열과 w 계열 모두에서 유사하게 관찰되었으며, 활음 유형에 따라 다르게 나타나지는 않았다. 이것은 이중모음의 핵모음 위치가 발화 속도 변화에 대해 상대적으로 영향을 받는 지점임을 보여준다.

마지막으로 살펴본 것은 F2 기울기였다. 시간당 F2의 변화량을 뜻하는 F2 기울기는 j계 이중모음에서는 보통 속도와 빠른 속도 간 유의미한 차이를 보였으며, 빠른 속도에서의 기울기가 유의미하게 컸다. 반면 w계 이중모음에서는 보통 속도와 빠른 속도 간 기울기 차이가 유의미하지 않은 것으로 나타났다.

이상을 종합해 보면 두 유형의 이중모음이 속도 변화에 대해 다른 전략을 지니고 있다고 해석해 볼 수 있다. j계 이중모음의 경우 고정적인 위치에서 시작해 발화 속도에 따라 기울기를 달리하는 전략을 가진다. 특히 빠른 속도에서 더 큰 기울기를 보였는데, 이는 제한된 짧은 시간 내에 핵모음의 목표점인 두 번째 목표점에 최대한 도달하려는 시도로 보인다. 이러한 양상은 발화 속도 변화에도 불구하고 목표점이 최대한 유지된다는 점에서, Petersen(2018)이 제안한 ‘주파수 유지 가설’로 해석될 수 있는 결과라 할 수 있다. 이것으로 미루어 보았을 때 한국어에서 j계 활음을 구성하는 필수 성분은 목표점의 실현이라고 볼 수 있을 것이다. 빠른 속도의 발화에서도 두 목표점이 최대한 실현될 수 있는 전략이 사용되고 있기 때문이다.

반면 w계 이중모음은 첫 번째 목표점과 두 번째 목표점 모두 보통 속도와 빠른 속도에서 유의미한 차이를 보였으며, 보통 속도에 비해 빠른 속도에서 목표점에 미도달된 경향이 관찰되었다. 하지만 F2의 기울기는 보통 속도와 빠른 속도 모두에서 비교적 일정하게 유지되었다. 이는 w계 이중모음이 빠른 속도일 때 F2의 변화량을 조정하기보다는 목표점 도달 정도를 조정하는 방식으로 실현됨을 보여준다. 이러한 결과는 Petersen(2018)에서 제안한 ‘기울기 유지 가설’에 부합하는 것으로 보인다. 이러한 특성으로 미루어 보아 한국어에서 w계 이중모음을 구성하는 주요 성분은 일정 수준의 기울기임을 알 수 있다. 빠른 발화에서 대부분의 목표점들은 미도달되었지만 기울기는 일정하게 유지되었기 때문이다.

이러한 결과는 한 언어 내에서도 발화 속도에 따른 이중모음 실현 양상이 단일한 가설로 설명되기보다는, 활음의 유형에 따라 서로 다른 조음 전략으로 실현될 수 있음을 보여준다. 기존의 연구에서는 한 언어 내에서 이중모음 발화 속도에 따른 실현 양상이 동일한 전략에 의해 나타날 것이라고 가정하였지만 본고에서 관찰한 바로는 이중모음을 이루고 있는 구성 성분의 특성에 따라 그 전략이 다르게 나타날 수도 있다. 이 결과는 두 가지 가설이 이중모음 전반에 보편적으로 적용되기보다는, 활음의 조음적 특성에 따라 다르게 적용될 수 있음을 보여준다. 특히 j계 이중모음과 w계 이중모음이 발화 속도가 변화함에 따라 활음, F2 기울기, 핵모음 실현에서 서로 다른 패턴을 보였다는 점은 이중모음을 조음하는 전략이 하위 유형별로 분화되어 있을 수 있음을 보여준다.

이 연구의 결과는 한국어 이중모음의 조음적 실현에 대해 몇 가지 이론적 시사점을 보여준다. 우선 이 연구는 이중모음을 이루는 세 가지 요소(활음의 목표점, 핵모음의 목표점, 기울기)가 발화 속도에 따라 어떻게 바뀌는지를 관찰함으로써 이중모음 실현에서 목표점과 전이 구간이 어떤 방식으로 조정되는지를 보여주었다. 이는 이중모음의 실현을 설명하는 두 가지 가설(기울기 유지 가설, 주파수 유지 가설)의 관점에서 한국어 이중모음을 관찰하였다는 점에서 의의가 있다. 또 이 연구에서는 한국어 이중모음이 j 활음과 w 활음에 따라 서로 다른 감쇄 패턴을 보일 수 있음을 관찰하였다. 이는 활음의 조음적 특성이 이중모음의 실현에 중요한 역할을 할 가능성이 있음을 보여주었다.

끝으로 표 6에 본 연구의 주요 결과를 정리해 두었다. j계 이중모음의 경우 구성 성분 중에 활음의 목표점이 속도에 상관없이 안정적이었으며 이를 토대로 주파수 유지 가설을 지지하는 결과라고 보았다. w계 이중모음의 경우 기울기가 속도에 상관없이 안정적이었으며 이를 토대로 기울기 유지 가설을 지지하는 결과라고 보았다. 이를 토대로 w계 이중모음을 구성하는 주요 성분은 F2의 기울기인 것으로 해석하였다.

표 6. | Table 6. 발화 속도 변화에 따른 이중모음의 실현 패턴 | Effects of speech rate on diphthong realization

분석 항목	j계 이중모음	w계 이중모음
활음 목표점	안정적	속도에 영향
핵모음 목표점	속도에 영향	속도에 영향
F2 기울기	속도에 영향	안정적
조음 전략	주파수 유지	기울기 유지

Download Excel Table

5. 결론

지금까지 한국어의 j계 이중모음과 w계 이중모음을 대상으로 발화 속도에 따라 실현 양상이 어떻게 달라지는지를 살펴보았다. 이를 위하여 이중모음의 구성 성분인 활음의 목표점, F2 기울기, 핵모음의 목표점이 발화 속도에 어떻게 영향받는지를 관찰해 보았다. 그 결과 j계 이중 모음은 속도에 상관없이 활음의 목표점이 안정적인 실현을 보였으나 F2의 기울기나 핵모음의 목표점은 속도에 영향을 받았다. 반면 w계 이중모음은 F2의 기울기가 속도에 상관없이 일정했지만 나머지 구성 성분인 두 목표점은 속도에 영향을 받아 빠른 속도에서 더 미도달의 경향을 보였다. 그중 w 활음이 미도달되는 것은 원순성의 제스처가 감쇄된다는 조음적 이유로 해석하였다. 이를 토대로 한국어 구어에서 /w/가 자주 탈락되는 원인도 함께 살펴보았다. w계 이중모음이 보인 이러한 결과는 Petersen(2018)이 제시한 가설 중 ‘기울기 유지 가설’을 지지하는 결과이며 j계 이중모음의 결과는 ‘주파수 유지 가설’을 지지하는 결과였다. 이를 통해 Petersen(2018)에서 제시한 두 가지 유형의 가설이 한 언어의 이중모음에 일관적으로 적용되지 않고 구성 성분의 특성에 따라 다른 양상을 보일 수 있음을 보여주었다.

Notes

^* 이 연구는 2025년 10월 건국대학교에서 개최된 겨레어문학회 2025년 하반기 전국학술대회에서 발표한 내용을 수정 및 보완한 것이다.

^* This study is a revised version of the paper presented at the 2025 Fall Conference of the Society of Korean National Language and Literature, held at Konkuk University in October 2025.

¹ 이중모음 중 /ㅢ/는 본고의 논의에서 제외한다.

² Gay(1968)에서 속도 변수를 세 가지 차원(느린 속도, 보통 속도, 빠른 속도)으로 설정한 것과 달리, 본고에서는 두 가지 차원(보통 속도, 빠른 속도)으로 설정하였다. 본고는 감쇄 패턴을 통해 이중모음의 조음 전략을 살펴보는 데 목적이 있기 때문에 ‘느린 속도’를 설정하는 것은 감쇄를 관찰하는 데 적합하지 않다고 판단했기 때문이다.

³ 본 연구는 Lee(2024)의 후속 연구로서 본 실험에서 실험 참가자들이 낭독한 자료는 Lee(2024)와 동일하다. 또한 본고에서 분석한 두 가지 속도의 낭독 자료 중 보통 속도로 녹음한 음성은 Lee(2024)에서 분석한 자료와 동일하다.

⁴ 실험에서는 다른 연구 주제를 위한 문장까지 총 51개의 문장을 낭독시켰지만 본 연구에서는 20개의 문장만을 분석하였다. 낭독 자료에 대한 자세한 정보 및 분석 문장 전체는 Lee(2024)에서 확인 가능하다.

⁵ 예를 들어 /ㅑ/의 경우에는 단모음 /ㅏ/와 공간적으로 가장 가깝게 실현되는 지점이 어디인지를 살펴보았으며 /ㅕ/의 경우에는 단모음 /ㅓ/와 가장 가깝게 실현되는 지점이 어디인지를 살펴보았다. 이때 보통 속도의 /ㅑ/는 보통 속도에서의 단모음 /ㅏ/와 비교하였으며 빠른 속도의 /ㅑ/는 빠른 속도에서의 단모음 /ㅏ/와 비교하였다. 또 각 단모음은 전체 화자의 평균값이 아니라, 각 화자별 단모음의 포먼트를 비교점으로 삼았다.

⁶ 기준 수준은 속도에서는 ‘빠른 속도’였으며 활음 종류에서는 ‘j 활음’이었다(표 4와 표 5에서도 동일).

⁷ 해당 항목은 ‘용언의 활용형에 나타나는 ‘져, 쪄, 쳐’는 [저, 쩌, 처]로 발음한다.’와 ‘‘예, 례’ 이외의 ‘ㅖ’는 [ㅔ]로도 발음한다.’이다.

References/참고문헌

Byrd, D., & Tan, C. C. (1996). Saying consonant clusters quickly. Journal of Phonetics, 24(2), 263-282.

Dolan, W. B., & Mimori, Y. (1986). Rate‐dependent variability in English and Japanese complex vowel F2 transitions. The Journal of the Acoustical Society of America, 80, S96.

Gay, T. (1968). Effect of speaking rate on diphthong formant movements. The Journal of the Acoustical Society of America, 44(6), 1570–1573.

Ha, Y. (2018). A study on the optional /w/ deletion. Studies in Phonetics, Phonology, and Morphology, 24(1), 69-91.

Hwang, Y., & Ha, Y. (2024). A study on the articulatory patterns and characteristics of Korean diphthongs. Korean Language Research, 65(48), 1-17.

Jha, S. K. (1985). Acoustic analysis of the Maithili diphthongs. Journal of Phonetics, 13(1), 107-115.

Lee, N. (2024). The target point of the nucleus vowel and trajectory of Korean diphthongs. Korean Language Research, 65(42), 1-19.

Lee, S., & Ko, H. J. (2004). Speech rate and the acoustic features of Korean segments. The Journal of the Acoustical Society of Korea, 23(2), 162-172.

Moon, S. J., & Lindblom, B. (1994). Interaction between duration, context, and speaking style in English stressed vowels. The Journal of the Acoustical Society of America, 96(1), 40-55.

10.

Petersen, S. J. (2018). Accounting for diphthongs: Duration as contrast in vowel dispersion theory (Doctoral dissertation). Georgetown University, Washington, DC.

11.

Shin, J. (2010). Phoneme and syllable frequencies based on the analysis of entries in the Korean dictionary. Communication Sciences & Disorders, 15(1), 94-106.

12.

Stevens, K. N., & Keyser, S. J. (1989). Primary features and their enhancement in consonants. Language, 65(1), 81-106.

13.

신지영(2010). 한국어 사전 표제어 발음의 음소 및 음절 빈도. 언어청각장애연구, 15(1), 94-106.

14.

이나라(2024). 한국어 이중모음의 핵모음 위치와 이동 궤적. 한말연구, 65(42), 1-19.

15.

이숙향, 고현주(2004). 발화속도와 한국어 분절음의 음향학적 특성. 한국음향학회지, 23(2), 162-172.

16.

하영우(2018). 수의적 /w/ 탈락의 양상과 해석. 음성음운형태론연구, 24(1), 69-91.

17.

황영, 하영우(2024). 한국어 이중모음의 조음 양상과 특성. 한말연구, 65(48), 1-17.

발화 속도에 따른 한국어 이중모음의 감쇄 패턴*

국문초록

Abstract

1. 서론

2. 연구 방법

3. 결과

4. 논의

5. 결론

Notes

References/참고문헌

발화 속도에 따른 한국어 이중모음의 감쇄 패턴^*