Phonetics/음성학

발화 속도와 말차례 교체 빈도에 따른 운율 단위 변화에 관한 연구

원유권 1 , *
Yugwon Won 1 , *
Author Information & Copyright
1건국대학교 국어국문학과
1Department of Korean Language and Literature, Konkuk University, Seoul, Korea
*Corresponding author : linky1584@gmail.com

© Copyright 2022 Korean Society of Speech Sciences. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: Apr 22, 2022; Revised: Jun 09, 2022; Accepted: Jun 10, 2022

Published Online: Jun 30, 2022

국문초록

이 연구는 국립국어원 일상 대화 음성 코퍼스(2020)에서 나타나는 발화를 분석하여 발화 속도 및 말차례 교체 빈도가 운율 단위 변화에 어떤 영향을 끼치는지 밝히는 것을 목적으로 하였다. 분석 결과, 발화 속도가 증가할수록 억양구, 어절 빈도, 발화 길이가 증가하는 양의 상관관계를 보였으나 상관관계가 낮았고, 회귀모형의 적합도는 3%–11%로 설명력이 약했다. 말차례 교체 빈도에 따른 평균 발화 속도는 유의미한 차이가 있었고, 말차례 교체 빈도가 증가할수록 발화 속도는 감소하였다. 또한 말차례 교체 빈도가 증가할수록 억양구 및 어절 빈도와 발화 길이는 감소하였으며 높은 음의 상관관계가 있는 것으로 나타났다. 회귀 모형의 적합도는 27%–32%로 계산되었다. 말차례 교체 빈도가 발화 속도와 운율 단위를 변화시키는 요인으로 작용했을 수 있다. 이는 대화체에서 나타나는 비유창성, 말차례 교체 특성, 화자 간 활발한 상호작용 등이 영향을 미쳤을 것이라 추측된다.

Abstract

This study aimed to analyze the speech appearing in the National Institute of Korean Language’s Daily Conversation Speech Corpus (2020) and reveal how the speech rate and the frequency of turn-taking affect the change in prosody units. The analysis results showed a positive correlation between intonation phrase, word phrase frequency, and speaking duration as the speech speed increased; however, the correlation was low, and the suitability of the regression model of the speech rate was 3%–11%, which was weak in explanatory power. There was a significant difference in the mean speech rate according to the frequency of the turn-taking, and the speech rate decreased as the frequency of the turn-taking increased. In addition, as the frequency of turn-taking increased, the frequency of intonation phrases, the frequency of word phrases, and the speaking duration decreased; there was a high negative correlation. The suitability of the regression model of the turn-taking frequency was calculated as 27%–32%. The frequency of turn-taking functions as a factor in changing the speech rate and prosodic units. It is presumed that this can be influenced by the disfluency of the dialogue, the characteristics of turn-taking, and the active interaction between the speakers.

Keywords: 발화 속도; 억양구; 운율; 말차례; 코퍼스 언어학
Keywords: speech rate; intonation phrase; prosody; turn-taking; corpus linguistics

1. 서론

이 연구는 국립국어원 일상 대화 음성 코퍼스(2020)에서 나타나는 발화를 분석하여, 발화 속도 및 말차례 교체 빈도가 운율 단위 변화에 어떤 영향을 끼치는지 분석하는 것을 목적으로 한다. 발화의 운율 단위 형성의 원리는 그동안 운율 음운론(Kang, 1992; Nespor & Vogel, 1986; Selkirk, 1980)과 억양 음운론(Jun, 1993; Pierrehumbert, 1980; Pierrehumbert & Hirschberg, 1990)의 관점에서 연구가 되어 왔다. 운율 음운론에서는 음운부의 구조가 통사 구조로부터 형성되는 것으로 보았고, 억양 음운론에서는 억양을 형성하는 구 악센트(phrasal accent)와 경계 음조(boundary tone) 등이 운율 단위 형성에 어떻게 기여하는지를 밝히려고 하였다(Ahn, 2008). 이러한 운율 단위들이 어떠한 변수들과 상호작용하는지, 어떠한 변수에게 영향을 끼치고 받는지 등 다양한 관점으로부터 연구가 진행되어 왔다. 그중에서 발화 속도가 운율에 영향을 미친다는 연구 결과들이 있다. 발화 속 도는 말장애 및 외국어 교육 분야에서 발화의 유창성과 명료도 측정의 지표(Hernandez et al., 2020; Yeo et al., 2021)가 되기도 하고, 발화의 특성과 관련하여 음성학적 변이의 요인으로 음소 단위(Ko et al., 2004; Lee & Ko, 2004; Lee et al., 2003; Oh, 2009) 및 억양 단위(Kim, 2009; Kim et al., 1995)에 영향을 주기도 한다. 또한 발화 속도라는 변수 자체도 하나의 언어적 현상이므로 성별, 세대, 지역 등 사회언어학적 변수에 따라 영향을 받기도 하는 것으로 알려져 있다(Kendall, 2013; Lee et al., 2017). 이 중에서 세대와 관련하여 대체로 젊을수록 빨리 말하는 경향이 있으며(Quené, 2008; Smith et al., 1987; Verhoeven et al., 2004; Yuan et al., 2006), 피험자의 나이를 예측하는 데 발화 속도가 중요한 지각적 단서로 이용되기도 한다(Harnsberger et al., 2008; Seo & Shin 2019). 그러나 이러한 견해와는 반대로 Jacewicz et al.(2009)에서는 비격식 화법에서 연령에 따른 유의미한 차이가 없었고, 성별의 영향이 있긴 했지만 약하다는 견해가 있으며 남성이 읽기와 같은 특정 상황에서만 여성보다 빨랐다고 하였다.

운율과 관련된 연구에서는 발화 길이가 발화 속도에 영향을 미친다는 연구가 있는데, Kim(2017)에서는 한국어 자연 발화 코퍼스(Yun et al., 2015)에서 10명의 화자를 분석하여 화자의 발화 길이가 길어질수록 발화 속도가 빨라진다는 사실을 밝혔다. 또한 Kim et al.(1995)에서는 낭독체에서 발화 속도가 빨라질수록 음운구나 억양구 사이의 휴지 빈도가 감소하고, 이러한 특성이 지수함수의 형태를 가지고 있음을 관찰하였다. 즉, 발화 속도가 빨라질수록 휴지 발생 빈도는 급격하게 낮아진다는 것을 의미한다. 이와 비슷한 연구로 낭독체에서 발화 속도에 따른 억양구와 음운구의 생성 빈도의 차이를 연구한 Kim(2009)에서는 발화 속도가 빨라질수록 억양구와 음운구의 개수가 줄어드는 관계가 어느 정도 있다고 하였지만, 절대적인 상관관계는 존재하지 않았다고 분석했다. 발화 속도에 따른 운율 단위의 빈도 변화를 연구한 Kim et al.(1995)Kim(2009) 모두 낭독체를 연구 대상으로 하였고, 이 연구들의 결과는 발화 속도가 증가하면 음운구나 억양구의 생성 빈도가 감소하는 것으로 수렴한다고 볼 수 있지만, 과연 이러한 경향성이 자연적인 발화나 일상적인 대화에서도 유지될 것인가에 대한 의문이 남아 있다. 또한 Kim(2017)에서 연구한 ‘한국어 자연 발화 코퍼스’는 인터뷰 방식으로 발화를 수집한 말뭉치이기에 음성 자료가 피험자의 대답으로만 구성되어 있어 일상적인 대화에서의 발화 특성을 관찰하기에 한계가 있다.

이처럼 선행연구에서는 주로 실험 연구나 낭독체를 대상으로 발화 속도와 억양구와 음운구의 관계를 살펴본 연구가 많았다. 그러나 최근에는 기업이나 국가적 차원에서 대규모의 말뭉치가 많이 구축되고 있기 때문에 그동안 다룰 수 없었던 좀 더 자연스러운 일상적인 대화 발화를 분석할 기회가 많아졌다. 또한 말뭉치를 통한 음성 자료의 분석은 많은 인원을 대상으로 하여 발화가 수집되기에, 실험 연구에서 설정한 특수한 환경의 한계를 넘어서 발화의 보편적 특성을 연구할 수 있는 이점이 있다. 그렇기에 자연 발화 말뭉치를 분석한 연구 데이터도 균형 있게 축적할 필요가 있다.

Jun(2003, 2006)에서는 발화의 단위를 억양 단위와 담화 단위로 구분하고 담화의 단위로 말차례 교체(turn-taking) 단위, 인접 쌍(adjacency pairs), 화제 단위 등을 제시했다. Kim et al.(2011)에서는 기존의 발화 구분 요소들을 체계적으로 정리하여 발화 요소를 말차례, 종결 억양, 휴지, 종결어미, 통사적, 의미적 완결성 등으로 구분하였다. 이 중에서 말차례와 종결 억양은 해당 발화를 다른 발화와 구별하는 발화 구분 요소로 분류하였다. 본고에서 살펴보고자 하는 연구 자료가 대화체의 성격을 띠는데, 그동안 자연스러운 대화체에서의 억양구와 음운구 등의 운율 단위의 변화 현상을 다룬 연구가 많지 않았고, 대화체의 특성에 따라 기존의 발화와 구별된 말차례라는 발화 교체 특성을 통해서 새롭게 살펴볼 필요가 있다. 따라서 이 연구에서는 그동안 낭독체에 한정되어온 운율 단위 변화 특성을 대화체로 확장하여 살펴보고, 발화 속도뿐만 아니라 말차례 교체 빈도에 따른 변화 양상도 살펴볼 것이다.

이에 선행연구에서 그동안 다루어 온 발화 속도, 발화 길이, 억양구 생성 빈도 등의 운율적 요소들을 고려하여 일상적인 대화체에서도 발화 속도 및 말차례 교체 빈도에 따라서 억양구 수와 어절 수 생성 빈도 및 발화 길이가 어떻게 달라지는지를 연구 문제로 삼고 연구를 진행한다.

2. 연구 방법

2.1. 연구 자료

본 연구는 국립국어원에서 제공하는 일상 대화 음성 코퍼스(2020, 버전 1.2)1를 분석하였다. 이 말뭉치는 국립국어원에서 인공지능 기술 개발 및 국어 연구 활용을 위해 ‘모두의 말뭉치2’ 홈페이지를 통해 2021년 12월에 공개된 말뭉치이다. 회원가입과 간단한 신청 절차를 통해 무료로 제공된다. 이 말뭉치는 15개 주제,3 13개의 제시 자료4를 보고 두 명의 화자가 자유롭게 대화를 나눈 일상 대화이다. 총 2,739명의 화자가 참여했으며 대화당 대략 15분 분량(총 500시간 분량)으로 구성되어 있다. 또한 전사 단위는 긴 휴지, 경계 억양, 경계 말 장음화를 특징으로 하는 억양구 단위로 전사되어 있다. 말뭉치는 JSON 파일과 PCM 음성 파일로 구성되어 있다. JSON 파일에는 전사 자료가 저장되어 있고 PCM 파일은 전사된 억양구의 음성을 들어볼 수 있게 구성되어 있다. 이 연구에서는 JSON 파일의 자료만을 분석 대상으로 삼았다.

2.2. 연구 대상

이 연구에서 3.1.절은 독립변수로 발화 속도, 종속변수로 억양구와 어절, 그리고 발화 길이를 설정하였고, 3.2.절에서는 독립변수로 말차례 교체 빈도와 종속변수로 발화 속도를 설정하였다. 먼저 발화 속도를 측정하기 위해선 ‘발화’에 대한 정의가 필요하다. Kim et al.(2011)에서는 ‘말차례’를 발화 구분 요소로 분류하고 ‘발화를 시작한 화자가 다음 화자에게 발언권을 물려주는 한 번의 말차례’5라고 정의하였다. 본고에서는 이러한 말차례를 하나의 발화로 분석하였는데, 그 이유는 대화체에서는 하나의 전사 단위를 하나의 발화로 보는 것보다 화자가 교체되기 전까지를 발화로 보는 것이 더 자연스러운 발화 속도가 측정될 것이라고 예상했기 때문이다.

표 1은 구축된 말뭉치의 전사 단위에 대한 음절 수, 어절 수, 발화 길이에 대한 평균을 나타낸 것이다. 본 연구에서는 대규모 자료를 분석하는 과정에서 말뭉치 전사 단위들이 억양 곡선을 기반으로 한 억양구 단위인지는 확인할 수 없었고, 말뭉치 구축 단계에서 분석한 구축 단위가 억양구라고 가정하고 분석을 진행한다.

표 1. | Table 1. 말뭉치에서 전사된 억양구의 운율 단위별 통계 | Statistics by the prosodic unit of intonation phrases transcribed from corpus
억양구 수 운율 단위 평균 표준편차
870,655 음절 수 9.00 6.08
어절 수 3.49 2.35
발화 길이 2.07 .96
Download Excel Table

본고에서는 억양구의 하위 단위로 어절을 측정하였는데, 어절은 엄밀히 말하면 운율 단위가 아니다. 하지만 Oh(2015)의 연구에 따르면 어절도 음절과 마찬가지로 리듬을 생성하는 단위로, 상위 단위와 일정한 비례 관계를 맺는다. 따라서 이 연구는 자료에서 음조(tone) 패턴으로 정의되는 음운구를 측정할 수 없었고 부득이하게 운율 단위로 어절을 측정하였다.

발화 길이는 말차례가 교체되고 난 직후의 시작 시간부터 말차례가 종료되는 시점까지의 시간을 측정하였다.

따라서 본고에서 살펴보고자 하는 운율 단위는 말뭉치 구축 단위에 따라 억양구와 어절 그리고 발화 길이이다.

이 연구는 자연 발화에서 운율 단위의 변화 요소를 밝히기 위한 시험적 연구이기 때문에 언어 내적 요소에 집중하기로 하였다. 화자의 성별은 여성의 발화 자료가 더 많았기 때문에 여성으로 고정하여 추출하였고, 가능한 한 많은 자료를 보기 위해서 세대는 따로 구분하지 않았다.

2.3. 분석 방법
2.3.1. 자료 분석 방법

본 연구에서는 화자 정보와 발화 속도 그리고 억양구 수, 어절 수, 발화 길이 등을 측정하기 위해 파이썬 스크립트(python script)를 작성하여 분석하였다. 발화 속도의 음절 수는 표 2의 발음 전사 부분의 음절 수를 측정하였으며, 정규 표현식(regular expression)을 통해 한글만 추출하였다. 따라서 발화 속도 산출은 말차례 전체 음절 수를 동일 화자(speaker id)의 말차례 시작 시간부터 말차례 종료 시간까지의 합으로 나눈 초당 음절 수[음절 수/시간(초), syll/sec]로 계산되었다. 다만, 연구에 사용된 말뭉치의 특성상 억양구 사이 휴지는 소실되어 억양구와 억양구 사이의 휴지를 제외한 발화 시간(speaking time)으로 발화 속도가 계산되었다.

표 2. | Table 2. 말뭉치의 전사 형식 | Transcription form of corpus
"id": "SDRW2000000515.1.1.363",
"form": "그러니까 7월이나",
"original_form": "((그니까)) 칠월이나", (발음전사)
"speaker_id": "SD2000651", (화자 고유번호)
"start": 724.49505, (억양구 시작시간)
"end": 726.49406, (억양구 종료시간)
"note": ""
"id": "SDRW2000000515.1.1.364",
"form": "뭐",
"original_form": "뭐",
"speaker_id": "SD2000651",
"start": 726.50402,
"end": 727.62804,
"note": ""
Download Excel Table

이해를 돕기 위한 말차례의 예시는 다음 표 3과 같다. 첫 번째 대화에서의 B 화자처럼 한 사람이 어떤 주제에 대해서 이야기를 하면 꽤 오랜 시간 동안 이야기를 해도 말차례를 기다려 주는 경우도 있고, 친밀도에 따라서 두 번째 대화에서처럼 서로 활발히 주고받는 경우도 있었다.

표 3. | Table 3. 말차례 예시 | An example of turn-taking
말차례 발화시간(sec) 음성 전사 내용
A: .0–13.0
B: 13.8–83.2
A: 네 오늘/여기 오는 길에 보니까 날씨가 정말 많이 더워졌더라고요/그래서 이제 진짜 여름인 것 같은데/사계절 중에서 어느 계절을 제일 좋아하세요?
B:아~ 저는/사계절을/음 딱 좋아하는 건 없구요/어 물어보면은/이~ 봄과 여름 사이와/가을과 겨울사일 좋아해요/(중략)/그~ 날씨 중에서 어떤/날씨를 참 좋아하세요?
     (id: SDRW2000000010)
A: 3.4–6.1
B: 6.2–18.7
A: 22.9–83.3
A: 가고 싶은 여행지 있어?/
B:나는/아무 아무래도 대구 온 지 얼마 안 돼서/청도 쪽/으로 가 보고 싶은데/혹시 청도 좀 가 본 적 있나?
A:응. 나 얼마 전에 가 봤었는데/(중략)/남았던 곳 있어?/
     (id: SDRW2000000073)

‘/’는 억양구 구분 기호.

Download Excel Table

또한 화자의 말차례가 교체되는 시점에는 전사 단위에 시간적 차이가 있지만 화자의 발화가 시작하고, 화자 내에서는 모든 전사 단위 사이가 기계적으로 .01초 간격이므로 화자 내에서 전사 단위 사이, 즉 억양구 단위 사이의 모든 휴지는 제거되었다고 판단했다. 따라서 본고에서 측정된 발화 길이와 발화 속도에 사용된 시간은 휴지가 제거된 발화 길이이다.

2.3.2. 통계 분석 방법

통계 분석은 통계 분석 프로그램인 R(version 4.1.2; R Core Team, 2021)을 사용하였다. 변수 간 관련성을 파악하기 위해서 상관분석(correlation analysis) 방법을 사용하였고, 상관 계수로 Spearman 상관 계수를 사용하였으며, 검정 방법으로는 양쪽 꼬리 검정(two-tailed)을 채택하였다. 유의 수준은 .05이다. 관찰의 독립성을 위해서 말뭉치에서 중복으로 여러 대화에 참여한 화자가 있을 경우 임의로 하나의 자료만 선택하였다. 또한 인과관계를 확인하기 위해 발화 속도와 말차례 교체 빈도를 독립변수로, 억양구와 어절 빈도수, 발화 길이는 종속변수로 취하는 강건한 회귀분석(robust regression) 방법을 사용하였다. 일반적으로 회귀분석에서 회귀 계수 추정에 사용하는 최소제곱법(ordinary least squares)의 경우엔 단 하나의 잔차의 이상치에도 회귀계수가 심하게 왜곡되는 단점이 있다(Li, 1985). 그리고 본고에서 사용한 연구 자료가 정규성 가정을 충족하지 않았고, 이상치도 다수 포함되어 있어 이상치들의 영향을 적게 받는 강건한 회귀분석을 사용한 것이다. 말차례 빈도에 따른 평균 발화 속도의 분포를 비교하기 위해 비모수검정 방법인 Kruskal-Wallis 검정을 시행했으며 사후분석은 Bonferroni test를 시행하였다.

3. 연구 결과

3.1. 발화 속도에 따른 변화

표 4에서 말하는 발화 속도는 말차례 시작 시간부터 말차례 종료 시간까지 초당 발화된 음절 개수로, 각각의 말차례 단위의 발화 속도를 측정한 것이다. 말차례당 발화 속도를 측정하고 이상치를 제거하기 위해서 Z-점수 ±2.5 이내의 값을 추출하였다. 이렇게 추출한 총 13,125개의 말차례를 대상으로 발화 속도와 억양구, 어절 빈도, 발화 길이에 대한 기술통계량은 표 4와 같다. 총 2,033명의 화자들의 말차례당 평균 발화 속도는 4.1로 초당 4음절 정도를 발화하는 것으로 나타났다. 또한 말차례당 평균 27.85개의 억양구와 98.69개의 어절로 이루어지는 것으로 나타났다.

표 4. | Table 4. 말차례당 발화 속도와 운율 단위 빈도 그리고 발화 길이에 대한 기술통계량 | Descriptive statistics on speech rate, prosodic units frequency, and speaking duration per turn-taking
Variables Mean Median SD Min Max
발화 속도(syll/sec) 4.10 4.14 .81 1.88 6.27
억양구(N) 27.85 21 26.10 1 309
어절(N) 98.69 73 97.31 1 1,386
발화 길이(sec) 59.72 47.47 53.06 .26 678.94
Download Excel Table

발화 속도에 따른 억양구와 어절 수, 발화 길이에 대한 상관관계를 알아보기 위해 상관분석을 시행하여 요약한 결과는 다음 그림 1과 같다.

pss-14-2-29-g1
그림 1. | Figure 1. 발화 속도, 억양구, 어절 빈도 및 발화 길이에 대한 산점도 및 히스토그램 | Scatter plot and histogram of speech rate, intonation phrase, word phrase frequency, and speaking duration
Download Original Figure

측정한 변수들이 정규분포를 보이지 않아 비모수적 검정방법을 사용했으며 상관 계수로 Spearman 상관 계수6를 적용하였다. 발화 속도와 억양구 수, 어절 수 발화 길이 간의 상관 계수를 살펴보면 모두 양의 상관관계를 갖는 것으로 나타났고, 유의수준 .05에서 유의하였다. 발화 속도와 억양구 수, 어절 수, 발화 길이 간의 상관 계수는 .24, .37, .20으로, 모두 상관성이 낮은 것으로 나타났다.

발화 속도(syll/sec)가 억양구 수, 어절 수와 발화 길이의 변화에 미치는 영향을 알아보기 위해 강건한 회귀분석을 시행한 결과 표 5와 같았다. 추정된 회귀식에 의해서 독립변수인 발화 속도(초당 음절 수, syll/sec)가 1 증가할 때마다 억양구 수는 5.02개, 어절 수는 26.81개, 발화 길이는 8.91초 늘어나는 것으로 나타났으며 유의수준 .05에서 통계적으로 유의한 영향을 주는 것으로 나타났다. 하지만 추정된 회귀식에 의해서 각각 5%, 11%, 3%를 설명할 수 있는 모형으로 설명력이 약한 모형이었다.

표 5. | Table 5. 발화 속도에 따른 운율 단위 변화의 강건한 회귀분석 모형 요약 | Summary of robust regression analysis model of prosodic unit changes according to speech rate
Variable Dependent variable B SE t-value R2 (adj. R2)
발화속도(syll/sec) 억양구 수(N)*** 5.02 .21 23.49 .05 (.05)
어절 수(N)*** 26.81 .77 34.62 .11 (.11)
발화 길이(sec)*** 8.91 .46 19.03 .03 (.03)

*** p <0.001.

Download Excel Table
3.2. 말차례 교체 빈도에 따른 변화

표 6은 2,063명의 화자들의 전체 대화에서 측정한 말차례 교체 빈도에 따른 평균 발화 속도를 나타낸 것이다. 말차례 빈도의 최솟값은 1이며 이것은 화자가 전체 대화에서 한 번의 말차례를 가진 것을 의미하고 최댓값인 72는 72번의 말차례 교대를 가진 것을 의미한다. 그러나 말차례 교체 빈도가 20회 이하는 1– 4명밖에 되지 않아 일반화할 수 없다고 생각하여, 화자 수가 최소 10명 이상인 말차례 빈도에 대해서 통계 분석을 실시하였다. 그림 2는 10명 이상의 화자 정보로 구성된 말차례 교체 빈도의 20회까지의 평균 발화 속도를 나타낸 것이다.

표 6. | Table 6. 말차례 교체 빈도에 따른 화자 수, 평균 발화 속도, 중위수 | Number of speakers, mean speech rate, and median according to the frequency of turn-taking
말차례 교체 빈도 (회) 해당 빈도로 발화한 화자 수(명) 평균 발화 속도(syll/sec) 중위수 (syll/sec)
1 60 4.56 4.55
2 180 4.37 4.38
3 324 4.33 4.39
4 285 4.27 4.32
5 283 4.14 4.19
6 235 4.08 4.16
7 171 4.16 4.19
8 112 4.05 4.10
9 79 4.02 4.17
10 80 4.11 4.15
11 46 4.10 4.15
12 33 4.04 4.07
13 25 4.15 4.16
14 18 4.25 4.29
15 25 4.15 4.18
16 20 3.93 4.01
17 14 3.83 3.85
18 13 3.83 3.89
19 10 3.96 4.04
20 10 3.94 3.99
21 3 3.86 3.97
22 1 3.68 3.72
23 2 4.20 4.21
24 3 4.28 4.07
25 1 4.95 4.88
26 1 3.41 3.37
27 4 3.27 3.15
28 2 3.32 3.26
29 4 4.04 3.99
30 4 3.36 3.41
31 1 3.18 3.12
32 1 4.02 4.06
33 1 3.89 3.94
35 1 3.79 3.73
36 1 3.67 3.59
37 1 4.97 5.06
38 1 4.10 4.16
41 1 2.55 2.40
42 1 3.14 3.13
45 1 3.59 3.69
46 1 3.68 3.53
47 2 4.04 4.02
72 2 3.00 2.97
Download Excel Table
pss-14-2-29-g2
그림 2. | Figure 2. 말차례 교체 빈도에 따른 평균 발화 속도 | Mean speech rate on the frequency of turn-taking
Download Original Figure

그림 2에서 말차례 빈도가 많아질수록 발화 속도가 감소하는 우하향 경향성이 관찰된다. 말차례 교체 빈도에 따른 발화 속도의 정규성 검정(Shapiro-Wilk’s test)과 등분산 검정(Levene-test) 결과, 정규분포를 따르지 않고(W=.99, p <.05), 이분산을 보였다[ F (19)=5.88, p <.05]. 따라서 말차례 빈도에 따라 발화 속도의 분포가 차이가 있는지 확인하기 위해서 비모수적 검정 방법인 Kruskal-Wallis 검정을 시행하였다. 검정 결과 유의수준 .05에서 말차례 교체 빈도에 따라 발화 속도의 분포가 통계적으로 유의미한 차이가 있었다[x2(19)=258.71, p <.05]. 세부적으로 어떤 말차례 사이에 차이가 있는지 살펴보기 위해 사후 검정(Bonferroni test)을 실시한 결과 유의미한 차이가 있는 말차례 교체 빈도는 표 7과 같았다.

표 7의 행과 열은 모두 말차례 교체 빈도수를 나타낸다. 그리고 사후분석 결과 서로 유의미한 차이가 있는 말차례 교체 빈도는 별표로 표시하였다. 말차례 교체 빈도 중 1–3회에서 측정된 발화 속도는 말차례 교체 빈도 2, 3, 4, 14회로 측정된 발화 속도를 제외하고 모두 유의미한 차이가 있는 것으로 나타났다. 그리고 말차례 빈도 5–16회는 유의미한 차이가 없다가, 말차례 빈도 16회 이후 몇 쌍씩 유의미한 차이가 있는 것으로 나타났다.

그림 3은 말차례 교체 빈도와 억양구 및 어절 빈도에 대한 자료의 분포와 상관분석의 결과를 나타낸 것이다. 억양구 및 어절 빈도와 발화 길이가 말차례 교체 빈도에 따라 음의 상관관계가 있는 것으로 나타났고 각각 –.60, –.59, –.62로, 높은 상관이 있는 것으로 나타났다. 이러한 상관이 인과관계로 해석될 수 있는지 강건한 회귀분석을 실시한 결과 표 8의 모형으로 나타났다.

pss-14-2-29-g3
그림 3. | Figure 3. 말차례, 억양구, 어절 빈도 및 발화 길이에 대한 산점도 및 히스토그램 | Scatter plot and histogram of turn-taking, intonation phrase, word phrase frequency, and speaking duration
Download Original Figure
표 8. | Table 8. 말차례 교체 빈도에 따른 운율 단위 변화의 강건한 회귀분석 모형 요약 | Summary of robust regression analysis model of prosodic units changes according to the frequency of turn-taking
Variable Dependent variable B SE t-value R2 (adj. R2)
말차례 교체 빈도 억양구 수(N)*** –2.26 .03 –57.87 .28 (.28)
어절 수(N)*** –7.8 .14 –54.21 .27 (.27)
발화길이(sec)*** –5.08 .08 –63.55 .32 (.32)

*** p <.001.

Download Excel Table

회귀계수의 추정치는 말차례 교체 빈도가 한 단위 증가할 때마다 억양구 수는 –2.26개, 어절 수는 –7.8개, 발화 길이는 –5.08초 감소하는 것으로 나타났으며, 유의수준 .05에서 통계적으로 유의미한 영향을 주는 것으로 나타났다. 모형의 적합도는 추정된 회귀식에 의해 각각 28%, 27%, 32%를 설명할 수 있는 모형이었다.

4. 논의

이 연구는 일상 대화 음성 코퍼스에서 운율 단위를 변화시키는 요소를 밝히는 것이 목적이었다. 그 첫 번째로 발화 속도에 주목하여 발화 속도가 운율 단위 형성에 어떤 영향을 미치는지 확인하고자 하였다. 그러한 이유는 화자가 발화 계획에 앞서 빨리 발화하거나 느리게 발화함에 따라 발화 속도를 충분히 제어할 수 있기에 발화 속도에 따른 운율 단위 변화가 논의되어 왔기 때문이다(Kim, 2009; Park, 2002a; Park, 2002b; Tseng & Lee, 2004). 이에 따라 3.1.절에서 발화 속도를 변인으로 하여 발화 속도에 따라서 억양구 수, 어절 수, 발화 길이가 어떻게 달라지는지 분석하였다. 그림 1에서 보는 바와 같이 발화 속도가 증가할수록 억양구 개수와 어절 개수, 그리고 발화 길이가 증가하는 양의 상관관계를 보였지만 뚜렷한 상관관계가 없었고, 회귀분석 결과도 인과관계를 설명하기에는 설명력이 약한 모형이었다. 따라서 일상 대화에서 발화 속도가 운율 단위를 변화시키는 요인으로 강하게 작용하지 않는다면 어떤 것이 운율 단위를 바꾸게 하는지 면밀하게 관찰할 필요가 있다.

우선 발화 속도 이외의 다른 변수가 작용할 가능성이 있다. 그중에서 대화체와 낭독체와의 차이에 집중하여 살펴보기로 한다. Kim et al.(1995)에서는 발화 속도에 따라서 낭독 문장에 대해서 휴지기 규칙 및 평균 음절 길이를 연구한 결과, 발화 속도가 느려짐에 따라 끊어 읽는 구간이 많아진다고 밝혔다. 즉 발화 속도가 느려질수록 음운구 경계가 분절되는 횟수가 많아진다. 이는 본 연구의 결과와 대조적이며 대화체에서는 이러한 경향성이 약할 것이라고 추측할 수 있다.

Seong(1998)에서는 낭독체와 대화체의 지속시간 및 fundamental frequency(F0)의 값을 토대로 비교 연구를 하였는데, 대화체는 낭독체에 비해서 지속 시간, 높낮이 곡선, F0 등의 운율 요소 등이 역동적이고, 유동적이라는 결론을 내렸다. 또한 Park(2002a)에서는 낭독체보다 대화체의 억양구와 음운구가 더 계층적인 구조를 가지고 있고, 낭독체는 직렬적인 운율 구조를 가지고 있어 대화체에 비해 음절 수가 고정되어 있는 것으로 파악했다.

한편, 발화 길이와 관련하여 예상되는 구의 길이가 길어질 때 발화 속도가 빨라진다는 연구 결과가 많이 보고되었다(Crystal & House, 1990; Kim, 2017; Quené, 2008). 발화 길이가 길어지거나 음절 수가 많아질수록 발화 속도가 빨라진다는 상호관계를 관찰하였는데, 본 연구에서는 발화 길이와 발화 속도가 뚜렷한 상관을 보이지 않았다. 이러한 현상은 연구 자료의 구조가 달랐기 때문에 발생한 것처럼 보인다. 선행 연구의 연구 자료들이 대부분 낭독 과제나 인터뷰 형식의 말뭉치이기 때문이다. Quené(2008), Kim(2017)의 연구 등은 분석에 사용한 자료가 한 사람의 독백에 가까운 인터뷰이기 때문에, 화자 한 명이 자신의 발화 계획에 따라 덜 변동적으로 발화 속도를 조절할 수 있었을 것으로 추측된다.

이러한 논의에 따라 3.2.절에서는 말차례 교체 빈도에 집중하여 말차례 교체 빈도와 발화 속도, 말차례 교체 빈도와 운율 단위 간의 관계에 대해서 살펴보았다. 그림 3에서는 대화에서 말차례 교체 빈도가 증가할수록 발화 속도는 감소하는 경향을 보였으며, 그림 4에서는 말차례 교체 빈도와 억양구, 어절 개수와 발화 길이가 높은 음의 상관관계가 있는 것을 미루어볼 때, 이러한 결과는 대화의 특성에 따른 결과라고 볼 수 있다.

Sacks et al.(1974)에 의하면 말차례 교체의 특징은 화자 전환이 최소한 한 번은 나타나며, 말차례의 순서 및 길이가 고정되어 있지 않고 다양하며, 대화의 시간이 미리 정해져 있지 않고 연속적이거나 불연속적이라는 것이다. 또한 자연 발화는 자기수정, 어구 반복, 원치 않은 휴지 등의 비유창성을 유발하기도 한다(Clark & Wasow, 1998). 이러한 즉흥적인 발화의 특징과 말차례의 빈번한 교체와 같은 대화 화자 간 활발한 상호작용이 본 연구의 결과를 보여준 것이라 해석된다. 대화체에서 화자는 일정한 발화 속도를 유지할 수 없고, 짧은 어구에서 시간 대비 짧은 음절 수(간투사, 머뭇거림)의 발생으로 인한 발화 속도의 감소가 있었을 수 있다. 가령, 말차례 교체 시 질문에 대한 동의나 대답의 상황에서 ‘응/아니, 음, 아’ 등의 발화 등을 떠올려 볼 수 있다. Schegloff(1996)에서 말차례의 시작 부분과 끝 부분이 대화 참여자 간 상호작용 조직을 형성하는 중요한 부분이라고 제시했으며, Choi(2021)에서는 영국 영어 대화 코퍼스에서 말차례 시작에 나타난 담화 표지의 빈도를 조사하였는데, 말차례 교체 시 시작과 끝에서 ‘well, yeah, mm, but, so’ 등의 단음절 담화 표지가 높은 비율로 등장하였다. 이러한 연구 결과를 볼 때 말차례 교체 빈도가 높을 때 발화 시간 대비 짧은 음절 수가 발생했을 가능성이 높다. 이는 대화에서 발화 속도가 충분히 나오기 위해서는 확실하게 자신의 말차례를 유지해야 함을 의미한다.

말차례 교체의 상황을 보면 친밀도가 높은 사람들끼리는 잦은 말차례 교체가 발생할 수 있고, 상대의 차례를 기다려 주지 않고 끼어들 수도 있다. 반면, 화자가 낯선 사람과 대화한다면 격식을 갖추고 상대방의 말차례를 충분히 기다려주는 상황이 발생할 수 있다. 발화 속도와 같은 변인들이 운율 단위에 직접적으로 영향을 미치는 것은 낭독 과제와 같은 통제된 환경에서 화자가 발화를 계획할 수 있을 때 상관이 있을 가능성이 높다. 반면 일상적인 대화 환경에서는 말차례 교체가 독립적으로 발화 속도에도 영향을 미치고, 운율 단위의 변화에도 영향을 미칠 수 있음을 시사한다.

5. 결론

이 연구는 대규모 말뭉치 기반 접근 방식을 활용하여 일상 대화체로 된 자연 발화에서 발화 속도와 말차례 교체에 따른 억양구 수 및 어절 수, 발화 길이의 변화를 살펴보았다. 일상 대화체에서 발화 속도가 빠를수록 억양구 수와 어절 수 및 발화 길이가 증가하는 경향을 보였으나 상관관계가 낮았고, 인과관계를 설명하기에도 연구 모형의 설명력이 약했다. 말차례 교체 빈도에 따른 발화 속도 분포는 통계적으로 유의미한 차이가 있었고, 말차례 교체 빈도가 많아질수록 발화 속도는 감소하는 경향을 보였다. 말차례 교체 빈도에 따른 억양구 수, 어절 수 및 발화 길이는 높은 음의 상관관계를 나타냈다. 이 연구에서는 자료 구성의 한계로 휴지 길이 및 억양 정보(억양구 및 음운구의 억양 곡선) 등이 반영된 운율 단위를 관찰하지 못하였다. 미처 다루지 못했지만 추후 정밀한 운율 단위로 전사된 연구 자료가 나오게 되면 다양한 변인을 다루어 운율 단위 변화를 설명하기 위한 후속 연구가 진행되길 기대한다.

Notes

1 자료에 대한 자세한 내용은 “국립국어원 누리집 > 자료 > 연구조사 자료 > ‘2020년 일상 대화 말뭉치 구축’ 사업 보고서”를 참고할 수 있다.

2 모두의 말뭉치 주소: https://corpus.korean.go.kr

3 15개의 주제는 ‘스포츠/레저’, ‘여행지(국내/해외)’, ‘계절/날씨’, ‘회사/학교’, ‘먹거리’, ‘방송/연예’, ‘영화’, ‘건강/다이어트’, ‘선물’, ‘꿈(목표)’, ‘연애/결혼’, ‘반려동물’, ‘아르바이트’, ‘성격’, ‘가족’ 등으로 제시되었다.

4 13개의 제시 자료는 국립국어원 신문 말뭉치(버전 1.0)에서 선정한 신문 기사가 제시되었다.

5 Kim et al.(2011)에서는 말차례를 자발적 중단과 비자발적 중단으로 나누었으나 본 연구에서는 단순히 화자 교체 여부로만 말차례를 구분하였다.

6 상관 계수의 절댓값이 클수록 선형 관계가 크다는 것을 의미하며, 범위에 따라 “±.0–.2: 상관이 거의 없음, ±.2–.4: 상관이 낮음, ±.4–.6: 상관이 있음, ±.6–.8: 상관이 높음, ±.8–1.0:상관이 매우 높음”으로 해석한다(Sung & Si, 2014).

References/참고문헌

1.

Ahn, B. (2008). The study on prosodic structure and functions in Korean (Doctoral dissertation). Korea University, Seoul, Korea.

2.

Choi, I. J. (2021). A study on turn-beginning discourse markers: Focusing on the British English face-to-face conversation corpus. The Journal of Linguistics Science, 98, 427-453.

3.

Clark, H. H., & Wasow, T. (1998). Repeating words in spontaneous speech. Cognitive Psychology, 37 (3), 201-242.

4.

Crystal, T. H., & House, A. S. (1990). Articulation rate and the duration of syllables and stress groups in connected speech. The Journal of the Acoustical Society of America, 88 (1), 101-112.

5.

Harnsberger, J. D., Shrivastav, R., Brown W. S. Jr., Rothman, H., & Hollien, H. (2008). Speaking rate and fundamental frequency as speech cues to perceived age. Journal of Voice, 22 (1), 58-69.

6.

Hernandez, A., Kim, S., & Chung, M. (2020). Prosody-based measures for automatic severity assessment of dysarthric speech. Applied Sciences, 10 (19), 6999.

7.

Jacewicz, E., Fox, R. A., O’Neill, C., & Salmons, J. (2009). Articulation rate across dialect, age, and gender. Language Variation and Change, 21 (2), 233-256.

8.

Jun, S. (1993). The Phonetics and Phonology of Korean Prosody (Doctoral dissertation). The Ohio State University, Columbus, OH.

9.

Jun, Y. (2003). A study on the intonation unit in Korean conversation. Discourse and Cognition, 10 (1), 241-265.

10.

Jun, Y. Y. (2006, July). Study of units and structures in spoken language. Proceedings of the Korean Language ResearchCircle (pp. 7-21). Wonju, Korea.

11.

Kang, O. (1992). Korean prosodic phonology (Doctoral dissertation). University of Washington, Seattle, WA.

12.

Kendall, T. (2013). Speech rate, pause and sociolinguistic variation: Studies in corpus sociophonetics. London, UK: Palgrave Macmillan.

13.

Kim, J. (2017). The influence of utterance length on speech rate in spontaneous speech. Phonetics and Speech Sciences, 9 (1), 9-17.

14.

Kim, J. I., Kim, J. Y., & Lee, T. W. (1995). Control rules of synthetical pauses and syllable duration depending on pronunciation speed in Korean speech. The Journal of the Acoustical Society of Korea, 14 (1), 56-64.

15.

Kim, S. (2009). A preliminary study on the relationship between speech rate and prosodic unit generation in Korean read speech. Eoneohag, 53, 225-253.

16.

Kim, S., Cha, J., & Oh, J. (2011). Utterance factors and utterance type. Korean Semantics, 36, 91-118.

17.

Ko, H., Han, Y., Jung, J., Park, S., & Lee, S. H. (2004). Speech rate and Segment Duration. Wonkwang Journal of Humanities, 5, 57-68.

18.

Lee, N., Shin, J., Yoo, D., & Kim, K. (2017). Speech rate in Korean across region, gender and generation. Phonetics and Speech Sciences, 9 (1), 27-39.

19.

Lee, S. H., Ko, H. J., Han, Y. G., & Kim, J. J. (2003). Effects of speaking rate on Korean vowels. The Journal of the Acoustical Society of Korea, 22 (1), 14-22.

20.

Lee, S., & Ko, H. J. (2004). Speech rate and the acoustic features of Korean segments. The Journal of the Acoustical Society of Korea, 23 (2), 162-172.

21.

Li, G. (1985). Robust regression. In D. C. Hoaglin, F. Mosteller, & J. W. Tukey (Eds.), Exploratory data tables, trends and shapes (pp. 281-344). New York, NY: John Wiley & Sons.

22.

Nespor, M., & Vogel, I. (1986). Prosodic phonology. Dordrecht: Foris.

23.

Oh, E. (2009). Voice onset time of Korean stops as a function of speaking rate. Phonetics and Speech Sciences, 1 (3), 39-48.

24.

Oh, J. (2015). A study on isochronism in the rhythm of the Korean language. Korean Linguistics, 68, 91-115.

25.

Park, C. (2022). A study on phonetic characteristics of turn-taking place in spontaneous speech (Doctoral dissertation). Hanyang University, Seoul, Korea.

26.

Park, J. (2002a). Some prosodic aspects of read speech and dialogue in Korean. MALSORI, 43, 11-23.

27.

Park, M. (2002b). A study on the change of Korean phoneme according to the speech rate (Master’s thesis). Korea University, Seoul, Korea.

28.

Pierrehumbert, J. (1980). The phonology and phonetics of English intonation (Doctoral dissertation). MIT, Cambridge, MA.

29.

Pierrehumbert, J., & Hirschberg, J. (1990). The meaning of intonation contours in the interpretation of discourse. In P. R. Cohen, J. Morgan, & M. E. Pollack (Eds.), Intentions in communication (pp. 271-312). Cambridge, MA; MIT Press.

30.

Quené, H. (2008). Multilevel modeling of between-speaker and within-speaker variation in spontaneous speech tempo. The Journal of the Acoustical Society of America, 123 (2), 1104-1113.

31.

R Core Team. (2021). R: A language and environment for statistical computing (version 4.2.1) [Computer software]. R Foundation for Statistical Computing. Vienna, Austria. Retrieved from https://www.R-project.org/

32.

Sacks, H., Schegloff, E. A., & Jefferson, G. (1974). A simplest systematics for the organization of turn-taking for conversation. Language, 50 (4), 696-735.

33.

Schegloff, E. A. (1996). Turn organization: One intersection of grammar and interaction. In O. Elinor, E. A. Schegloff, & S. A. Thompson (Eds.), Interaction and grammar (pp. 52-133). Cambridge, MA: Cambridge University Press.

34.

Selkirk, E. (1980). Prosodic domains in phonology: sanskrit revisited. In Aronoff, M., & Kean, M. (Eds). Juncture (pp. 107-129). California: Anma Libri.

35.

Seo, Y., & Shin, J. (2019). Speaker age estimation and acoustic characteristics: according to pitch and speech rate. Phonetics and Speech Sciences, 11 (4), 9-18.

36.

Seong, C. J. (1998). The prosodic characteristics of Korean read sentences in dicourse context. MALSORI, 35-36, 1-12.

37.

Smith, B. L., Wasowicz, J., & Preston, J. (1987). Temporal characteristics of the speech of normal elderly adults. Journal of Speech Language and Hearing Research, 30 (4), 522-529.

38.

Sung, T., & Si, K. (2014). Research methods (2th ed.). Seoul, Korea: Hakjisa.

39.

Tseng, C., & Lee, Y. (2004). Speech rate and prosody units: Evidence of interaction from Mandarin Chinese. Speech Prosody, 23-26.

40.

Verhoeven, J., De Pauw, G., & Kloots, H. (2004). Speech rate in a pluricentric language: A comparison between Dutch in Belgium and the Netherlands. Language and Speech, 47 (3), 297-308.

41.

Yeo, E. J., Kim, S., & Chung, M., (2021). Automatic severity classification of dysarthria using voice quality, prosody, and pronunciation features. Phonetics and Speech Sciences, 13 (2), 57-66.

42.

Yuan, J., Liberman, M., & Cieri, C. (2006, Sept). Towards an integrated understanding of speaking rate in conversation. Proceedings of Interspeech 2006 (pp. 541-544). Pittsburgh, PA.

43.

Yun, W., Yoon, K., Park, S., Lee, J., Cho, S., Kang, D., Byun, K., ... Kim, J. (2015). The Korean corpus of spontaneous speech,. Phonetics and Speech Sciences, 7 (2), 103-109.

44.

고현주, 한양구, 정진숙, 박성희, 이숙향 (2004). 발화속도와 분절음의 지속시간. 열린정신 인문학연구, 5, 57-68.

45.

김선철(2009). 발화 속도에 따른 운율 단위의 빈도 변이에 대한 시험적 연구. 언어학, 53, 225-253.

46.

김수진, 차재은, 오재혁 (2011). 발화 요소와 발화 유형, 한국어 의미학, 36, 91-118.

47.

김재인, 김진영, 이태원(1995). 발음속도에 따른 한국어 휴지기 규칙 및 평균음절길이 조절규칙. 한국음향학회지, 14 (1), 56-64.

48.

김정선 (2017). 자연발화 음성 코퍼스에서 발화 속도에 대한 발화 길이의 영향. 말소리와 음성과학, 9 (1), 9-17.

49.

박미영(2002b). 발화 속도에 따른 국어 음운의 변화 연구: 운율구 형성과 관련하여. 고려대학교 석사학위논문.

50.

박지혜(2002a). 대화체와 낭독체의 운율에 관한 연구. 말소리, 44, 11-23.

51.

박초롱(2022). 자연 발화에서 나타나는 말차례 교체 지점의 음성적 특징 연구. 한양대학교 박사학위논문.

52.

서윤정, 신지영(2019). 화자 연령 지각과 음성적 특징: 음높이와 발화속도를 중심으로. 말소리와 음성과학, 11 (4), 9-18.

53.

성철재(1998). 한국어 낭독체 담화문의 운율적 특징: 단독발화문과 연속발화문의 비교를 통하여. 말소리, 35-36, 1-12.

54.

성태제, 시기자(2014). 연구방법론. 서울: 학지사.

55.

안병섭(2008). 국어 운율부의 구조와 기능에 대한 연구. 고려대학교 박사학위논문.

56.

여은정, 김선희, 정민화(2021). 음질, 운율, 발음 특징을 이용한 마비말장애 중증도 자동 분류. 말소리와 음성과학, 13 (2), 57-66.

57.

오은진(2009). 발화 속도에 따른 한국어 폐쇄음의 VOT 값 변화. 말소리와 음성과학, 1 (3), 39-48.

58.

오재혁(2015). 한국어 리듬의 등시성에 대하여. 한국어학, 68, 91-115.

59.

이나라, 신지영, 유도영, 김경화 (2017). 한국어 발화 속도의 지역, 성별, 세대에 따른 특징 연구. 말소리와 음성과학, 9 (1), 27-39.

60.

이숙향, 고현주(2004). 발화속도와 한국어 분절음의 음향학적 특성. 한국음성학회지, 23 (2), 162-172.

61.

이숙향, 고현주, 한양구, 김종진(2003). 발화속도에 따른 한국어 모음의 음향적 특성. 한국음향학회지, 22 (1), 14-22.

62.

전영옥(2003). 한국어 억양단위 연구: 통사적 특징을 중심으로. 담화와 인지, 10 (1), 241-265.

63.

전영옥(2006). 구어의 단위와 구조 연구. 한말연구학회 학술발표논문집, 2006 (1), 7-21.

64.

최인지(2021). 말차례 시작에 나타난 담화표지어 연구: 영국 영어 대면 대화 코퍼스를 중심으로. 언어과학연구, 98, 427-453.