Communication Disorders

명료발화와 보통발화에서 파킨슨병환자 음성의 켑스트럼 및 스펙트럼 분석

신희백1, 심희정1, 정훈2, 고도흥3,*
Hee-Baek Shin1, Hee-Jeong Shim1, Hun Jung2, Do-Heung Ko3,*
Author Information & Copyright
1한림대학교 보건과학대학원
2구미대학교 언어재활과
3한림대학교 언어청각학부
*Corresponding Author : dhko1561@gmail.com

ⓒ Copyright 2018 Korean Society of Speech Sciences. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: May 01, 2018 ; Revised: Jun 02, 2018 ; Accepted: Jun 12, 2018

Published Online: Jun 30, 2018

ABSTRACT

The purpose of this study is to examine the acoustic characteristics of Parkinsonian speech, with respect to different utterance conditions, by employing acoustic/auditory-perceptual analysis. The subjects of the study were 15 patients (M=7, F=8) with Parkinson’s disease who were asked to read out sentences under different utterance conditions (clear/casual). The sentences read out by each subject were recorded, and the recorded speech was subjected to cepstrum and spectrum analysis using Analysis of Dysphonia in Speech and Voice (ADSV). Additionally, auditory-perceptual evaluation of the recorded speech was conducted with respect to breathiness and loudness. Results indicate that in the case of clear speech, there was a statistically significant increase in the cepstral peak prominence (CPP), and a decrease in the L/H ratio SD (ratio of low to high frequency spectral energy SD) and CPP F0 SD values. In the auditory-perceptual evaluation, a decrease in breathiness and an increase in loudness were noted. Furthermore, CPP was found to be highly correlated to breathiness and loudness. This provides objective evidence of the immediate usefulness of clear speech intervention in improving the voice quality of Parkinsonian speech.

Keywords: clear speech; Parkinson’s disease; voice quality; cepstral & spectral measures

1. 서론

파킨슨병(Parkinson disease, PD)은 중뇌 흑질의 도파민 신경세포의 결함으로 나타나는 신경학적 퇴행성 질환 중 하나이며, 과소운동형 마비말장애(hypokinetic dysarthria)로 언급된다. 파킨슨병은 보통 60세 이후에 발생하지만, 10% 정도는 젊은 나이에 진단받기도 한다. 2007년에 국내 파킨슨병 유병률 및 실태조사에서는 65세 이상의 노인 10만 명 중 1,522명(1.5%)이 파킨슨병을 겪고 있다고 보고했으며(정해관, 2007), 파킨슨병 환자의 75%는 파킨슨병과 관련된 음성과 말 문제를 가진다고 하였다(Logemann et al., 1978).

파킨슨병의 주요 말 문제는 기식 발성(breathy phonation), 목쉰 음성(hoarseness), 음성 강도 감소, 부정확한 조음, 운율 문제로 인해 말 명료도에 영향을 미치고, 이는 환자들의 의사소통적, 사회적, 경제적, 심리적 문제를 야기할 수 있다. Logemann et al.(1978)은 200명의 파킨슨병 환자들의 주요 의사소통 문제를 확인한 결과, 89%는 쉰 목소리, 떨림, 기식음 등의 음성장애를 겪고, 45%는 조음장애를 보이며, 20%는 짧거나 긴 음절, 음절 반복, 지나친 휴지 기간 등의 말 속도 문제를 보이며, 10%는 과대비성 등의 공명장애를 보인다고 보고하였다.

특히 음성강도의 감소와 음질 문제는 파킨슨병 환자의 초기 증상으로 나타나며, 이는 질환으로 인한 전반적인 운동 근육의 약화와 고령화로 인한 성대의 휨 등으로 인해 불완전한 성대폐쇄와 연관되어 있다. 이러한 초기 증상은 파킨슨병 환자들의 대화 상황에서 짧은 호흡 길이로 인해 조음이 빨라지고 가속화된 움직임으로 드러나며, 불완전한 성대폐쇄로 인한 기식성 음질로 인해 음성적 문제로 나타나게 된다(Bunton, 2005). 이러한 음성적 문제는 파킨슨병으로 진단 받은 초기부터 나타나 환자의 명료도 저하에 직접적인 영향을 미치게 된다.

파킨슨병 환자들의 주요 문제인 말 명료도 문제를 보완하기 위해 LSVT(lee silverman voice treatment) 등의 중재 접근법이 치료에 적용되어 왔으며, 비교적 최근에는 명료발화(clear speech)를 통한 접근이 제안되고 있다(Tjaden, 2008). 명료발화는 다양한 지시방법으로 유도할 수 있는데, 다양한 말 산출 조건에서 파킨슨병 환자의 명료발화를 유도한 결과, “청각장애 환자와 대화하는 것처럼 말하세요”로 발화를 유도하였을 때, 마찰음 길이(fricative durations)와 기본주파수와 음압수준 등의 초분절적 조절이 가장 용이하였다고 하였다(Lam & Tjaden, 2016). 이 지시방법은 “명확하게 말하세요” 또는 “발음을 세게 하세요”보다 현실적이고 직접적으로 효과적인 명료발화를 산출할 수 있다. 이처럼 파킨슨병 환자를 대상으로 실시된 명료발화 연구에서는 음향학적 변화와 말 명료도 증가를 보고하였고, 청자가 지각할 수 있을 만큼 증가된 명료발화 특장점(clear speech benefit)을 보고하며, 이는 음향학적 측면뿐만 아니라 공기역학적 측면에서도 일반 말소리와는 확연한 차이를 보이는 것으로 나타났다(신희백 & 고도흥, 2017; Goberman & Elmer, 2005; Lam et al., 2012; Tjaden et al., 2014). 이러한 결과들은 명료발화가 파킨슨병 환자들의 말 문제 해결에 충분히 실현 가능한 전략이며, 후두에 대한 직접적인 처지 없이 말소리 개선이 가능하고, 전통적 음성치료와는 달리 연결발화에서의 즉각적인 음질 향상이 가능하다는 장점을 가지고 있다고 보고하였다(Gillespie & Gartner-Schmidt, 2016). 이는 명료발화가 즉각적인 말 명료도의 향상뿐만 아니라, 파킨슨병 환자의 음질개선에 대해 긍정적인 영향을 미침을 시사한다.

파킨슨병환자에 대한 명료발화의 음성 개선 효과를 살피기 위해서는, 다채로운 분석을 통한 파킨슨병 음성의 해석이 필요하다. 대부분의 연구자들은 파킨슨환자의 청지각적 음성 특성을 감소된 크기, 거친 음성, 기식 음성으로 기술하는데 동의하는 반면(Gilman & Kluin, 1992; Hertrich & Ackermann, 1998), 음향학적 결과에서는 다소 결과들의 차이가 있다.

기존 선행연구들에서 파킨슨병의 음성문제에 대한 음향학적인 진단 표지로 MPT(maximum phonation time)와 HNR의 감소, shimmer와 jitter의 두드러진 변화, F0 변이성의 감소 등을 제시하였다(Holmes et al., 2000; Jiménez-Jiménez et al., 1997). 하지만 일부 연구에서는 말운동장애 환자들의 음성문제가 일반적이지는 않다고 보고하기도 한다. Yuceturk et al.(2002)은 30명의 파킨슨병 환자들을 정상집단과 비교한 결과, MPT와 HNR에 유의한 차이를 보였지만 jitter와 shimmer에서는 두드러진 차이를 보이지 않았다고 보고하였으며, Santos et al.(2010)은 F0, shimmer, jitter, HNR 등의 음향학적 측정치에서 대조군과 파킨슨병 환자들 간에 유의한 차이를 보이지 않았음을 확인하였다. 파킨슨병 환자와 유사한 음성 특성을 보이는 실조형 마비말장애 환자의 경우, 청지각적으로 harshness와 breathiness가 두드러진다고 보고되며(Gilman & Kluin,1992; Hertrich & Ackermann, 1998), 음향학적인 분석에서는 F0의 과도한 변이성이 실조형 환자의 두드러진 진단표지이며, shimmer는 남녀 모두 높게 나타났고, jitter는 여성에게서만 높게 나타났다고 하였다(Kent et al., 2000).

상기 결과들을 종합하면, 음질의 비정상성이 말운동장애 환자들과 관련되는 주요한 증거라고 볼 수 있다. 하지만 이를 객관적으로 풀어내는 데는 다른 관점의 분석이 필요할 것으로 여겨진다. 비교적 최근에는 음성문제가 두드러진 대상자들의 음성 분석에 기존의 시간 기반 분석방식(time-based analysis)에서 벗어나 켑스트럼과 스펙트럼 분석 적용의 이점이 보고되고 있다.

켑스트럼(cepstrum) 분석은 스펙트럼 측정치를 다시 역푸리에 변환하여, 음성 신호의 배음 구조를 스펙트럼에 비해 더욱 두드러지게 시각화하여 보여주는 특성이 있으며, CPP(cepstral peak prominence)를 이용하여 켑스트럼의 최대치와 회귀선과의 차이를 통해 음성신호 내 배음의 양을 보여준다(Hillenbrand et al., 1994). 이는 음성문제가 두드러진 화자의 경우 CPP 값이 작은 양상을 보이며(Heman-Ackah et al., 2002), 음질이 개선되거나 음성 강도가 세지면 CPP가 증가하는 양상을 보인다(Rosenthal et al., 2014).

ADSV(Analysis of Dysphonia in Speech and Voice, KayPentax)는 임상현장에서 손쉽게 사용할 수 있도록 제작되었으며, CPP 외에도 L/H ratio(low/high spectral ratio), CPP F0 등의 다양한 측정치의 결과를 제시한다. L/H ratio는 4 kHz를 기점으로 저주파수와 고주파수대 스펙트럼 에너지의 비율을 나타내며, 장애 음성의 경우에 더 낮은 경향을 보인다(심희정 등, 2016). CPP F0는 분석할 유성음 구간에서 60~300 Hz 범위의 CPP의 평균 주파수를 나타내며, 이는 비정상적인 발성노력이 심할수록 높아지는 양상을 보인다. 또한 CPP F0 SD는 CPP F0의 표준편차 값을 말하며, 음성의 비정상성이 심할수록 모음발성과제에서는 높아지고, 연결발화과제에서는 낮아지는 양상을 보인다(서인효, 2014). 앞서 설명한 켑스트럼과 스펙트럼 측정치들의 특성은, 강도가 약하고 기식 음성을 띄는 화자의 음성을 평가하는데 유용성이 보고되며, 이는 파킨슨병 환자의 음성 분석에 적용할 수 있음을 기대하게 한다.

Jannetts & Lowit(2014)은 파킨슨병환자와 실조형 마비말장애 환자의 음성을 켑스트럼과 스펙트럼을 통해 음향학적 분석을 실시하여 GRBAS 청지각적 평가 결과와의 상관성을 살펴보았다. 결과에서 두 환자군 모두 CPP와 CPPs(smoothed CPP)가 G(overall severity)와 높은 상관성을 보였으며, 이는 말운동장애 환자의 음성 분석에 켑스트럼과 스펙트럼 분석의 적용이 유용함을 설명한다고 볼 수 있다. 또한 Byeon & Cho(2016)는 파킨슨병환자와 정상화자의 모음연장발성과 연결발화 음성을 켑스트럼과 스펙트럼 분석방식을 적용하여 살펴보았으며, 파킨슨병환자의 CPP와 L/H ratio가 정상화자에 비해 유의하게 낮은 값을 보여, 파킨슨병 환자 음성에 대한 켑스트럼 측정의 기초 자료를 제시하였다. 국내의 경우 서인효(2014)는 발화조건(습관적/운율적)에 따른 마비말장애 환자의 음성을 음향학적/청지각적으로 살펴본 결과, 운율적 발화 시 CPP와 CPP SD가 통계적으로 유의하게 증가하였으며, G값과 .651의 부적상관을 보임을 확인하였다. 이는 마비말장애 환자의 음성 평가에서 연결발화에 대한 켑스트럼 분석의 유용성과 운율적 발화가 파킨슨병 환자의 음성개선에 효과적임을 객관적으로 제시하였다고 볼 수 있다.

앞서 살펴본 선행연구의 결과들은 켑스트럼과 스펙트럼 분석이 음향학적으로 파킨슨병 환자의 음성 특징을 확인하는데 유용성과 적절성을 보여주며, 이는 파킨슨병 환자들의 음질변화를 객관적으로 기술하는데 유용한 정보를 제공할 것으로 여겨진다. 따라서 본 연구에서는 파킨슨병 환자가 명료발화를 사용할 때 어떠한 음질변화가 나타나는지 켑스트럼/스펙트럼 분석과 청지각적 분석을 통해 확인하고, 이들이 어떠한 상관성을 갖는지 살펴보고자 하였다. 이는 향후 명료발화 중재 프로그램의 개발을 위한 기초 자료로 제공될 수 있을 것이다.

2. 연구 방법

2.1. 연구 대상

본 연구 대상은 서울, 경기 지역의 병원에서 신경과 전문의에 의해 특발성 파킨슨병(IPD)으로 진단받은 환자 총 15명(M=7, F=8)으로 진행되었으며, 평균연령은 63.7세(SD: 8.88세)이며 연령 범위는 46세부터 75세였다.

대상자들의 파킨슨병 진단 경과일은 평균 9.06년이었으며, 인지 수준은 K-MMSE(Korean mini Mental state exam)의 규준 연구를 바탕으로(강연욱, 2006), 최소 23점 이상의 수행을 나타내는 대상자로 선정하였다. 대상자 15명 중 이상운동증(dyskinesia)이 심한 환자들은 없었지만, 떨림(tremor) 수준은 환자들마다 편차를 보였다. 대상자들의 Hoehn & Yahr stage는, Hoehn & Yahr stage 1, 2단계의 환자들이 LSVT를 통해 일상적 구어 의사소통을 유지하도록 도움을 받을 수 있다는 Ramig et al.(1995)의 연구와 LSVT를 이용한 논문들에 대해 메타분석을 실시한 김윤경 등(2012)의 연구에서 Hoehn & Yahr stage 3단계까지 포함하였다는 근거 하에, 본 연구 대상자도 3단계까지 포함하였다(<표 1>). 위의 척도에 대한 정보는 각 환자들이 정기적으로 다니는 신경과 전문의의 보고에 의한 결과를 기준으로 하였다. 모든 대상자는 현재까지 LSVT에 대한 중재를 받아본 경험이 없는 자를 대상으로 하였으며, 4번 연구 참여자의 경우 2년 전에 언어치료를 받은 경험이 있다고 하였다.

표 1 / Table 1. Participants’ information / 연구 참여자 정보
구분 성별 나이 교육년수 진단경과 K-MMSE 언어치료 약복용 H&Y
1 F 67 17 12 28 × 3
2 M 70 12 18 28 × 2
3 F 70 6 16 28 × 2
4 F 46 2 14 26 1
5 F 56 13 12 23 × 2
6 F 75 5 12 29 × 2
7 F 56 6 16 30 × 1.5
8 M 65 3 16 26 × 2.5
9 M 74 11 6 28 × 3
10 F 58 17 12 29 × 1.5
11 M 60 14 16 25 × 1.5
12 M 58 10 16 26 × 2.5
13 M 72 4 16 26 × 1.5
14 M 73 12 14 27 × 2
15 F 56 4 12 28 × 1

K-MMSE: Korean mini mental state exam, H&Y: Hoehn & Yahr stage

Download Excel Table
2.2. 자료수집 절차

파킨슨병 환자들의 명료발화에 대한 음질 변화를 확인하기 위한 음성 자료 수집은 보통발화(casual speech) 1회, 명료발화 1회로 두 번에 걸쳐 수집되었다. 국외 문헌에서는 파킨슨병환자의 문장 과제로 Sentence Intelligibility Test(SIT) 문장을 많이 사용하지만, 국내의 경우 표준화된 평가 문장이 많지 않기 때문에 한국어 자음과 모음이 적절한 비율로 포함된 ‘산책’ 문단의 첫 문장을 이용하여 실시하였다. 이는 문장 위치에 따른 중증도 예측치가 문단의 맨 앞부분에서 제일 높았던 부분을 고려하여 첫 문장을 선택하였다(이승진 외, 2017).

문장 읽기는 소음측정기를 활용하여 소음이 40 dB 이하인 장소임을 확인한 뒤 녹음을 진행하였다. 음성 녹음은 환자의 편안한 상태의 음성을 수집함이 목적이나, 환자의 떨림의 정도가 환자들마다 달라 음성수집 과정에 있어서 이를 통제하고자 Phonatory Aerodynamic System(PAS; model 6600; KayPENTAX, NJ, USA)을 이용하여 보통발화와 명료발화로 산책 문단의 첫 문장을 읽게 하였다. PAS 6600은 보정된 마이크의 호기류계와 얼굴 마스크가 한 쌍으로 구성된다. 대상자는 바른 자세로 앉아서 마스크를 잡고 편안하게 입과 코를 덮은 후 문장을 읽었다. 연구자는 문장을 읽기 전 대상자들이 부드럽게 흡기할 수 있도록 유도하였고, 환자의 자세와 호흡, 발성의 통제를 위해 PAS running speech protocol에서 흡기와 호기에 대한 기류율이 나타나며 이때 기류 그래프의 변화를 확인하여 환자의 얼굴 마스크 주변에서 공기가 새는지 체크하였다. 연구자는 먼저 대상자들이 평소에 읽듯이 보통발화로 산책 문장을 읽도록 유도한 뒤, 2분간 휴식을 가진 후, 명료발화로 산책 문장을 읽도록 하였다. 대상자들이 명료발화를 산출할 수 있도록 지시하는 방법은 Lam et al.(2012)의 연구 절차에 따라 “청각장애 환자와 대화하는 것처럼 말하세요”로 발화를 유도하였다.

2.3. 자료분석

음성자료는 KayPentax사의 Analysis of Dysphonia in Speech and Voice(ADSV Model 5109; KayPentax, Montvale, NJ, USA)를 사용하여 분석하였다. 분석할 음성자료는 PAS 6600을 통해 녹음된 파킨슨병 환자들의 음성(.nsp)을 ADSV로 불러왔으며, 분석할 음성자료는 환자 개인당 보통발화와 명료발화 조건에서 읽은 산책 문장의 첫 번째 문장으로 2문장×15명으로 총 30개의 파일을 분석하였다. 음성 자료 트리밍(trimming) 시, 파일을 재생하여 환자의 음성을 듣고, 해당 부분의 스펙트로그램과 파형을 보며 시작과 끝을 정확하게 확인하여 분석하였다.

2.4. 청지각적 평가

청지각적 평가는 언어병리학을 전공하는 정상 청력을 가진 청자 11명을 대상으로 실시하였다. 청자의 선정 기준은 첫째, 신경학적으로 건강하고, 둘째, 말․언어 또는 청각적 병력이 보고되지 않은 대상자들로 구성하였으며, 셋째, 의사소통에 문제가 없고, 넷째, 음성, 음향과 관련된 전문지식을 교육받았지만 파킨슨병 환자들의 음성을 들어본 적 없는 대상자들로 선정하였다. 대상자들의 평균연령은 21.9세였다.

청지각적 평가는 파킨슨병 환자의 보통발화와 명료발화의 음성 30개를 무작위로 청취한 후, 기식성과 강도에 대하여 측정하였다. 연구자는 청자들에게 파킨슨병 환자들의 음성을 들려준다는 지시만을 제공하고, 음성학 및 음성장애를 전공하는 박사학위 소지자 2인에 의해 기식성의 수준에 따른 음성샘플(기식성이 높은 음성, 중간 음성, 낮은 음성)을 제시하여 4번의 연습을 진행한 후, VAS(visual analog scale)로 평가를 실시하였다. 제공된 VAS 평가지에서는 100 mm 선에 자유롭게 체크하도록 하였고, 체크 시 VAS 선을 교차하여 체크하도록 지시하였다.

제공된 VAS 선은 기식성의 경우, 0이 “낮다”, 100이 “높다”로 하였고, 강도는 0이 “낮다”, 100이 “높다”로 하였다. 청지각적 평가의 각 변수에 대한 11명의 평가자 간 신뢰도는 intraclass correlation coefficients(ICC)로 측정하였다. 기식성에 대한 ICC는 .905, 강도에 대한 ICC는 .897로, 높은 평가자 간 신뢰도를 보였다.

2.5. 통계 처리

파킨슨병 환자들의 음질 변화를 확인하기 위한 음향학적 분석과 청지각적 분석은 Shapiro-Wilk를 이용하여 정규성 검정을 실시한 후, 음향학적 분석은 대응표본 t 검정(paired t-test)을 실시하였고, 청지각적 분석은 윌콕슨 부호순위 검정(Wilcoxon Signed Rank Test)을 통해 분석하였다(p<.05). 또한 파킨슨 화자들의 음질변화에 대한 음향학적 분석과 청지각적 평가 분석이 얼마만큼의 상관성을 살펴보고자 Spearman 상관분석을 시행하였다. 통계분석 프로그램은 SPSS 22(IBM, Armonk, NY, USA)를 이용하였다.

3. 연구 결과

3.1. 발화조건에 따른 켑스트럼 및 스펙트럼 측정치 비교

발화조건(보통발화/명료발화)에 따른 켑스트럼 및 스펙트럼 측정치의 특성을 살펴본 결과, 명료발화에서 CPP가 유의하게 증가하였고(p<.01), L/H ratio SD, CPP F0 SD는 유의하게 감소하였다(p<.01). 발화조건에 따른 CPP SD, L/H ratio, CPP F0 측정치는 유의한 차이를 보이지 않았다(<표 2>).

표 2 / Table 2. 보통발화와 명료발화에 따른 켑스트럼 스펙트럼 측정치 비교 / Cepstral & spectral parameter comparisons between casual speech and clear speech
Variables N Minimum Maximum Mean SD t-value df p-value
CPP Casual 15 3.54 6.16 4.68 .85 -4.123 14 .001***
Clear 15 4.48 7.70 5.66 .81
CPP SD Casual 15 2.14 4.03 3.43 .48 -1.540 14 .146
Clear 15 3.05 4.26 3.63 .41
L/H ratio Casual 15 32.23 45.77 39.20 4.41 2.062 14 .058
Clear 15 28.38 46.07 37.81 5.71
L/H ratio SD Casual 15 9.09 14.36 11.44 1.42 3.946 14 .001**
Clear 15 7.91 13.17 10.52 1.45
CPP F0 Casual 15 184.25 251.68 215.75 20.83 -0.340 14 .739
Clear 15 179.08 252.46 218.72 22.20
CPP F0 SD Casual 15 30.24 92.60 61.48 20.51 3.786 14 .002**
Clear 15 30.97 93.17 50.34 17.39

*p<.05, **p<.01, ***p<.001

CPP, cepstral peak prominence, L/H ratio, low/high spectral ratio

Download Excel Table
3.2. 발화조건에 따른 청지각적 분석 결과 비교

발화조건에 따른 기식성과 강도의 음질 특성을 분석한 결과, 명료발화를 사용할 경우, 기식성이 유의하게 감소하였고(p<.05), 강도는 유의하게 증가하였다(p<.001) (<표 3>).

표 3 / Table 3. 발화조건에 따른 청지각적 분석 결과 / Auditory-perceptual analysis between casual speech and clear speech
Variables N Mean SD Z p-value
Breathiness Casual 15 53.99 22.29 -2.208 .027*
Clear 15 48.25 25.55
Loudness Casual 15 21.16 16.61 -8.437 .000***
Clear 15 39.02 22.55

*p<.05, **p<.01, ***p<.001

Download Excel Table
3.3. 명료발화의 음향학/청지각 분석의 상관

명료발화를 이용하여 발화를 산출하였을 때, 켑스트럼/스펙트럼 측정치가 청지각적 평가 결과와 어떠한 상관성을 보이는지 분석한 결과, CPP는 breathiness와 부적 상관관계를 보였으며(CPP-breathiness, ρ=-.618, p<.05), CPP는 강도와 정적 상관관계를 보였다(CPP-Loudness, ρ=.621, p<.05) (<표 4>).

또한 CPP F0 SD는 강도와 부적 상관관계를 나타냈다(CPP F0 SD-Loudness, ρ=-.632, p<.05). 그 외의 측정치는 두드러진 상관성을 나타내지 않았다 (<표 4>).

표 4 / Table 4. 명료발화에서 음향학적/ 청지각적 측정치의 상관관계 / Auditory-perceptual analysis between casual speech and clear speech
Variables Breathiness Loudness
CPP -.618* .621*
CPP SD .154 -.246
L/H ratio -.343 .043
L/H ratio SD .118 -.289
CPP F0 .171 .368
CPP F0 SD .196 -.632*

*p<.05

CPP, cepstral peak prominence L/H ratio, low/high spectral ratio

Download Excel Table

4. 논의 및 결론

본 연구는 파킨슨병 환자 15명을 대상으로 명료발화 후 파킨슨병 환자의 음질이 어떠한 변화를 보이는지 음향학적/청지각적으로 기술한 뒤, 두 결과의 상관성을 살펴보고자 하였다.

발화조건에 따른 음향학적 특성을 살펴본 결과, 명료발화의 CPP는 보통발화에 비해 높은 값을 보였고(p<.001), CPP SD는 두드러진 차이를 보이지 않았다. 정상 음성을 가진 화자들은 음성 내 주기적 신호가 잘 분포하여 배음구조가 잘 나타나기 때문에 일반적으로 높은 CPP 값을 보이는데, 이에 반해 파킨슨병 환자의 보통발화는 바람 새는 듯한 음성과 약한 강도 등의 음성특성을 보이기 때문에 성대 진동의 범위와 운동성의 제한으로 음성 신호 내 비주기성이 두드러져 켑스트럼 피크가 완만하고 CPP 값이 낮아지는 양상을 보인다(Heman-Ackah et al., 2002).

명료발화로 인한 일시적인 음성 변화는 성도의 생리적인 측변에서도 해석할 수 있다. Whitfield & Goberman(2014)은 발화조건(habitual/clear)에 따른 12명의 파킨슨병 환자를 대상으로 모음공간과 명료도를 확인한 결과, 명료발화 시에 순간적으로 모음공간의 크기가 넓어졌고, 말이 명료화해지는 효과를 보고하였다. 모음공간은 제1포먼트 주파수와 제 2포먼트 주파수를 통해 성도수축의 정도와 위치에 따라 변화하는 상대적인 포먼트 패턴의 변화를 간접적으로 보여주며, 파킨슨병환자의 모음공간의 확장은 성도 모양의 변화를 초래한 것으로 해석할 수 있다. 성도의 변화는 배음의 양을 결정하는데 주요한 역할을 하므로 본 연구에서 명료발화 시 나타난 CPP의 증가는 순간적으로 성대 진동의 규칙성이 증가하여 배음구조가 뚜렷하게 형성되었으며, 명료발화를 통해 파킨슨병 환자의 음성이 즉각적으로 개선된 점을 객관적으로 해석할 수 있다.

또한 CPP SD 값은 음성문제가 심할수록 모음연장발성에서는 높고, 연결발화에서는 낮아지는 양상을 보인다. 이는 성대의 긴장성을 높여 산출하는 쥐어짜는 음성(strained voice)일 때도 문장산출 시 CPP SD 값이 작아지는 양상을 보인다고 보고되는데(Lowell et al., 2012), 본 연구에서는 발화조건에 따라서 두드러지는 차이를 보이지 않았다. 마비말장애 환자들의 발화조건에 따른 음질을 켑스트럼과 스펙트럼을 통해 살펴본 서인효(2014)의 연구에서는 습관적 발화와 운율적 발화에서 통계적으로 유의하게 운율적 발화의 CPP SD 값이 높아지는 양상을 보였다. 이는 문장구성의 차이로 인한 것이라 생각할 수 있겠다. 본 연구의 경우 하강운율구로 구성된 문장을 청각장애에게 말하듯이 명료발화를 유도하였으나, 서인효(2014)의 연구에서는 상승운율구, 하강운율구와 같은 다양한 운율구로 읽게 하여, 이러한 차이가 결과가 반영된 것이라고 생각된다.

발화조건에 따른 L/H ratio는 통계적으로 유의한 차이를 보이지 않았으나, L/H ratio SD는 유의한 차이를 보였다(p<.01). L/H ratio는 CPP와 더불어 기식성(breathiness)과 관련성이 높은 측정치로 꼽히는데, 4 kHz를 기준으로 저주파수와 고주파수 스펙트럼 에너지의 비율을 말하며, 음성장애환자의 경우 고주파수 영역대의 소음성 에너지의 증가로 인해 L/H ratio 값이 낮게 나타나고, 정상 화자는 높은 양상을 보인다(Lowell et al., 2013). 본 연구에서 발화조건에 따라 L/H ratio에 유의한 차이를 보이지 않은 것은 습관적 발화와 운율조절 발화에서 마비말장애 환자의 음질의 변화에서 L/H ratio에 유의한 차이를 보이지 않았다는 서인효(2014)의 연구와 동일한 결과를 나타내었으며, 이러한 결과는 말 샘플의 분석 구간에 쉼(pause)의 포함 여부와 관련될 수 있다고 생각된다. 마비말장애와 정상화자의 발화에서 쉼 구간을 포함하였을 때, 두 집단 간에 L/H ratio에 차이를 보였으나, 쉼 구간을 포함하지 않았을 때를 L/H ratio에 유의한 차이를 보이지 않았다(서인효, 2014). 본 연구의 경우 보통발화에 비해 명료발화에서 말 샘플의 길이(duration)가 전반적으로 길어지는 양상을 보였는데, 이러한 영향이 반영된 것으로 생각된다. 본 연구에서는 L/H ratio를 통해 명료발화 후에 음질개선에 대한 두드러지는 변화를 보이지는 않았으나, L/H ratio SD 값에서는 음질 개선의 효과를 살펴볼 수 있었다. 더 세부적으로 살펴보면, L/H ratio SD 값이 보통발화에서 11.44, 명료발화에서 10.52로 유의하게 낮아졌다. 이는 명료발화에서 L/H ratio의 퍼진 정도가 줄어들어 음성의 질 차원에서는 개선되었음을 의미한다.

명료발화에서 CPP F0는 통계적으로 유의한 차이를 보이지 않았으나, CPP F0 SD는 유의하게 낮아졌다(p<.01). CPP F0는 기본주파수에 상응하는 측정치로, 후두의 긴장 정도가 낮은 상태에서 산출되는 기식음성의 경우 정상음성에 비해 CPP F0가 낮게 나타난다(서인효 & 이옥분, 2015). 본 연구의 경우 CPP F0에 유의한 차이는 없었으나, 215.75 Hz에서 218.72 Hz로 다소 증가하는 양상을 보였다. 서인효(2014)는 발성노력으로 인한 음성산출 시 후두내부근육의 직접적인 변화와 후두외부근육의 긴장에 의한 간접적인 영향으로 성대 전반의 긴장도가 증가하여 CPP F0가 높아진다고 하였다. 이는 명료발화가 성대의 긴장도를 증가시킨 것으로도 해석될 수 있겠으나, 명료발화 후 CPP F0 SD 값이 유의하게 감소한 결과를 통해 음질이 다소 향상되었다고 볼 수 있겠다. CPP F0 SD의 감소는 CPP F0의 산포도가 좁아짐을 의미하여, CPP F0에 대한 주파수대의 퍼진 정도가 줄어들어 음질이 개선됨을 확인할 수 있었다.

파킨슨병 환자들의 가장 큰 특징으로 나타나는 기식성 음질과 음성 강도에 대하여 발화조건에 따른 청지각적 특성을 살펴본 결과, 명료발화 후 기식성이 5.74% 감소하였고, 강도는 17.86% 증가하는 양상을 보였다. 명료발화를 산출할 경우, 청자가 느끼는 지각적인 음질 개선이 즉각적으로 나타나는 것을 확인할 수 있었다. 특히, 명료발화를 통한 말명료도 향상을 명료발화 특장점으로 정의할 수 있으며, 본 연구의 청지각적 결과는 파킨슨병 환자들의 말명료도 향상에 기여할 수 있는 음성학적 측면에 대하여 영향을 줄 수 있을 것으로 보여진다.

파킨슨병 환자의 명료발화 음성을 분석하여, 켑스트럼과 스펙트럼 측정치와 청지각적 평가의 관련성을 살펴본 결과, CPP는 기식성과 부적 상관을, 강도와는 정적상관을 보였다. Brinca et al.(2014)은 30명의 음성장애 여성 환자의 모음연장발성, 직접화법, 네러티브 상황에서 모두 CPP와 기식성(B)이 -.665~-.565로 통계적으로 유의한 부적상관을 보였다. 대부분의 선행연구들에서 CPP가 증가할수록 기식성의 중증도가 증가하였고(심희정 외, 2016; Jannetts & Lowit, 2014), 전체 음성 중증도는 감소하는 결과를 보고하는데(이승진 외, 2017; Lowell et al., 2012), 본 연구에서도 같은 양상의 결과를 도출할 수 있었다. Jannetts & Lowit(2014)은 CPP와 CPPs가 파킨슨병환자의 전체 음성 중증도, 기식성, 무력성과 높은 수준의 상관성을 보인다고 보고하였는데, 이러한 결과는 켑스트럼 측정치가 청지각적 평가 결과와도 높은 상관성을 가지므로, 켑스트럼 측정치의 임상적 유용성을 지지하며, 음성 중재효과에 대한 켑스트럼 분석의 적용 가능성을 제시한다.

상기 결과와는 달리 CPP는 강도와 정적 상관성을 보였는데, 이는 음성산출 시 음성노력이 들어갈 경우에 CPP가 다소 증가하는 양상을 보인다는 Rosenthal et al.(2014) 결과와 일부 일치하였다. 음질에 문제가 있는 대부분의 화자들은 본인의 목소리 문제를 드러나지 않게 하고자, 스스로 후두주변부 근육을 긴장시켜 성대의 과내전을 유도하며, 이로 인한 성대폐쇄의 증가는 순간적으로 좀 더 나은 목소리를 산출할 수 있도록 한다(표화영 & 심현섭, 2002). 하지만 파킨슨병 환자는 기저핵 손상으로 인한 내적 동기체계의 문제와 운동 개시의 어려움으로, 외적단서와 되먹임 전략을 통해 이를 유도하게 된다(Cunnington et al., 1995). 명료발화를 사용할 때 CPP와 강도가 증가한 것은 명료발화라는 외적 단서가 파킨슨환자의 내적단서 결함 문제를 우회하는데 도움을 주어, 성도의 변화를 초래하여 나타난 결과로 볼 수 있다.

CPP F0 SD는 강도와 부적 관계를 나타냈으며, 이는 목소리가 커질수록 CPP F0 SD는 감소함을 의미한다. 발성노력으로 인한 비정상 음성은 CPP F0 SD가 낮아지며, 특히 모음에 비해 문장산출 시 이러한 양상이 두드러진다고 하였다(서인효, 2014; Stepp et al., 2012). 본 연구에서도 이와 같은 결과를 도출하였으며, 명료발화를 사용할 때 순간적으로 후두주변근육의 긴장을 동반하고, 구어속도는 평상시보다 천천히 정확하게 내려고 노력하며, 목소리는 커지며 음질 또한 향상되는 선순환을 보고하는데 이러한 양상이 본 연구 결과에 반영된 것이라 생각된다.

본 연구는 켑스트럼과 스펙트럼 분석을 통해 파킨슨병 환자의 명료발화 후 음질 변화에 대한 음향음성학적, 청지각적 특성을 기술하고자 하였으며, 후속 연구를 위해 다음과 같이 제언하고자 한다.

본 연구에서는 기식성과 강도에 국한하여 청지각적 평가를 수행하였는데, 파킨슨병 환자의 음질 특성을 더욱 고려하고, 조조성, 무력성 등에 대한 항목도 추가적으로 평가하여 진행한다면 임상적으로 유용한 결과를 제공할 것이라 생각된다. 또한 본 연구에서 파킨슨병 환자의 CPP와 강도의 상관성에 대해 성도 수축 범위의 영향으로 논의하였는데, 이는 나아가 CPP와 명료도, 모음공간 간의 상호관련성을 살펴보면 더욱 유용한 정보를 제시할 것이라 여겨진다. 또한 본 연구의 경우 PAS를 통해 마스크를 쓰고 음성 녹음을 하였는데, 이때 혹여라도 조음기관 중 입술의 움직임이 제한되었을 우려가 있으며, 마이크 사용이 아닌 마스크 사용으로 인해 발화시 성문저항의 차이 가능성으로 인해 명료발화의 발성특성과 별개로 성문하압에 영향을 미칠 수 있기 때문에, 추후연구에서는 머리장착형 마이크(head-worn microphone)를 사용할 것을 권고하며, 또한 파킨슨병환자들이 보통발화에 비해 명료발화에서 말 샘플의 길이가 전반적으로 길어지는 양상을 보였는데, 마비말장애 환자들이 문장발화 시 쉼의 빈도와 구간의 길이가 길어지는 특성을 고려하여, 쉼 구간의 포함 여부에 따른 음질 개선의 정도를 살펴보는 것도 좋을 것으로 여겨진다.

참고문헌(References)

1.

Brinca, L. F., Batista, A. P. F., Tavares, A. I., Gonçalves, I. C., & Moreno, M. L. (2014). Use of cepstral analyses for differentiating normal from dysphonic voices: A comparative study of connected speech versus sustained vowel in European Portuguese female speakers. Journal of Voice, 28(3), 282-286 .

2.

Bunton, K. (2005). Patterns of lung volume use during an extemporaneous speech task in persons with Parkinson disease. Journal of Communication Disorders, 38(5), 331-348 .

3.

Byeon, H., & Cho, S. (2016). Cepstral analysis of connected speech of hypokinetic dysarthria and normal speakers. Advanced Science and Technology Letters, 132, 212-215 .

4.

Cunnington, R., Iansek, R., Bradshaw, L., & Phillips, G. (1995). Movement-related potentials in Parkinson's disease: Presence and predictability of temporal and spatial cues. Brain, 118(4), 935-950 .

5.

Gillespie, A. I., & Gartner-Schmidt, J. (2016). Immediate effect of stimulability assessment on acoustic, aerodynamic, and patient-perceptual measures of voice. Journal of Voice, 30(4), 507.e9-507.e14 .

6.

Gilman, S., & Kluin, K. J. (1992). Speech disorders in cerebellar degeneration studied with positron emission tomography. In: A. Blitzer, F. Brin, T. Sasaki, S. Fahn, & S. Harris (Eds.) Neurologic disorders of the larynx. New York, NY: Thieme, 1992 .

7.

Goberman, A. M., & Elmer, L. W. (2005). Acoustic analysis of clear versus conversational speech in individuals with Parkinson disease. Journal of Communication Disorders, 38(3), 215-230 .

8.

Heman-Ackah, Y. D., Michael, D. D., & Goding, G. S. (2002). The relationship between cepstral peak prominence and selected parameters of dysphonia. Journal of Voice, 16(1), 20-27 .

9.

Hertrich, I., & Ackermann, H. (1998). Auditory perceptual evaluation of rhythm-manipulated and resynthesized sentence utterances obtained from cerebellar patients and normal speakers: A preliminary report. Clinical Linguistics & Phonetics, 12(6), 427-437 .

10.

Hillenbrand, J., Cleveland, R. A., & Erickson, R. L. (1994). Acoustic correlates of breathy vocal quality. Journal of Speech, Language, and Hearing Research, 37(4), 769-778 .

11.

Holmes, J., Oates, M., Phyland, J., & Hughes, J. (2000). Voice characteristics in the progression of Parkinson's disease. International Journal of Language & Communication Disorders, 35(3), 407-418 .

12.

Jannetts, S., & Lowit, A. (2014). Cepstral analysis of hypokinetic and ataxic voices: Correlations with perceptual and other acoustic measures. Journal of Voice, 28(6), 673-680 .

13.

Jiménez-Jiménez, F. J., Gamboa, J., Nieto, A., Guerrero, J., Orti-Pareja, M., Molina, A., García-Albea, E., & Cobeta, I. (1997). Acoustic voice analysis in untreated patients with Parkinson's disease. Parkinsonism & Related Disorders, 3(2), 111-116 .

14.

Jung, H. (2007). Nationwide survey on the prevalence of Parkinson's disease in Korea. Korea Center for Diease Control and Prevention. (정해관 (2007). 파킨슨병 유병률 및 실태조사. 질병관리본부 국립보건연구원 희귀난치성질환센터.) .

15.

Kang, Y. (2006). A normative study of the Korean Mini-Mental State Examination (K-MMSE) in the elderly. Korean Journal of Psychology, 25(2), 1-12. (강연욱 (2006). K-MMSE(Korean-mini mental state examination)의 노인 규준 연구. 한국심리학회지: 일반, 25(2), 1-12.) .

16.

Kent, R. D., Kent, J. F., Duffy, J. R., Thomas, J. E., Weismer, G., & Stuntebeck, S. (2000). Ataxic dysarthria. Journal of Speech, Language, and Hearing Research, 43(5), 1275-1289 .

17.

Kim, Y., Choi, Y., Kim, Y., & Choi, E. (2012). Treatment efficacy of LSVT program on individuals with Parkinson disease: A meta analysis. Journal of Speech-Language & Hearing Disorders, 21(1), 71-87. (김윤경·최예린·김윤정·최은희 (2012). Lee Silverman Voice Treatment (LSVT) 프로그램이 파킨슨병의 음강 개선에 미치는 효과: 메타분석. 언어치료연구, 21(1), 71-87.) .

18.

Lam, J., Tjaden, K., & Wilding, G. (2012). Acoustics of clear speech: Effect of instruction. Journal of Speech-Language & Hearing Research, 55(6), 1807-1821 .

19.

Lam, J., & Tjaden, K. (2016). Clear speech variants: An acoustic study in Parkinson's disease. Journal of Speech-Language & Hearing Research, 59(4), 631-646 .

20.

Lee, S., Lim, S., & Choi, H. (2017). A comparison of cepstral and spectral measures according to measurement position in a reading passage. Communication Sciences & Disorders, 22(4), 818-826. (이승진·임성은·최홍식 (2017). 문단 내 위치에 따른 켑스트럼 및 스펙트럼 측정치 비교. 언어청각장애연구, 22(4), 818-826.) .

21.

Logemann, J., Fisher, H., Boshes, B., & Blonsky, E. (1978). Frequency and cooccurrence of vocal tract dysfunctions in the speech of a large sample of Parkinson patients. Journal of Speech and Hearing Disorders, 43(1), 47-57 .

22.

Lowell, Y., Kelley, T., Awan, N., Colton, H., & Chan, H. (2012). Spectral-and cepstral-based acoustic features of dysphonic, strained voice quality. Annals of Otology, Rhinology & Laryngology, 121(8), 539-548 .

23.

Lowell, Y., Colton, H., Kelley, T., & Mizia, A. (2013). Predictive value and discriminant capacity of cepstral-and spectral-based measures during continuous speech. Journal of Voice, 27(4), 393-400 .

24.

Ramig, L., Pawlas, A., & Countryman, S. (1995). The Lee Silverman Voice Treatment: A practical guide for treating the voice and speech disorders in Parkinson disease. Iowa: National Centre for Voice and Speech .

25.

Rosenthal, L., Lowell, Y., & Colton, H. (2014). Aerodynamic and acoustic features of vocal effort. Journal of Voice, 28(2), 144-153 .

26.

Santos, M., Reis, D., Bassi, I., Guzella, C., Cardoso, F., Reis, C., & Gama, C. (2010). Acoustic and hearing-perceptual voice analysis in individuals with idiopathic Parkinson's disease in "on" and "off" stages. Arquivos de Neuro-Psiquiatria, 68(5), 706-711 .

27.

Seo, I. (2014). Acoustic measures of voice quality and phonation types across speech conditions in dysarthria. Ph.D. Dissertation, Chungnam National University. (서인효 (2014). 마비말장애의 발화조건에 따른 음질 및 발성유형의 음향음성학적 접근. 충남대학교 박사학위논문.) .

28.

Seo, I., & Lee, O. (2015). Cepstral and spectral analysis of whispery voice by healthy adults: Preliminary study. Journal of Speech-Language & Hearing Disorders, 24(4), 259-266. (서인효·이옥분 (2015). 정상성인 화자의 속삭임성에 대한 켑스트럼 및 스펙트럼 분석: 예비연구. 언어치료연구, 24(4), 259-266.) .

29.

Shim, H., Jung, H., Lee, S., Choi, B., Heo, J., & Ko, D. (2016). Cepstral and spectral analysis of voices with adductor spasmodic dysphonia. Phonetics and Speech Sciences, 8(2), 73-80. (심희정·정훈·이수안·최병흔·허정화·고도흥 (2016). 내전형연축성 발성장애 음성에 대한 켑스트럼과 스펙트럼 분석. 말소리와 음성과학, 8(2), 73-80.) .

30.

Shin, H., & Ko, D. (2017). An aerodynamic and acoustic characteristics of Clear Speech in patients with Parkinson's disease. Phonetics and Speech Sciences, 9(3), 67-74. (신희백·고도흥 (2017). 파킨슨 환자의 클리어 스피치 전후 음향학적 공기역학적 특성. 말소리와 음성과학, 9(3), 67-74.) .

31.

Stepp, E., Sawin, E., & Eadie, L. (2012). The relationship between perception of vocal effort and relative fundamental frequency during voicing offset and onset. Journal of Speech-Language & Hearing Research, 55(6), 1887-1896 .

32.

Tjaden, K. (2008). Speech and swallowing in Parkinson's disease. Topics in Geriatric Rehabilitation, 24(2), 115 .

33.

Tjaden, K., Sussman, J., & Wilding, G. (2014). Impact of clear, loud, and slow speech on scaled intelligibility and speech severity in Parkinson's disease and multiple sclerosis. Journal of Speech-Language & Hearing Research, 57(3), 779-792 .

34.

Whitfield, A., & Goberman, M. (2014). Articulatory-acoustic vowel space: Application to clear speech in individuals with Parkinson's disease. Journal of Communication Disorders, 51, 19-28 .

35.

Yuceturk, V., Yılmaz, H., Egrilmez, M., & Karaca, S. (2002). Voice analysis and videolaryngostroboscopy in patients with Parkinson's disease. European Archives of Oto-Rhino-Laryngology, 259(6), 290-293 .