1. 서론
삼킴은 음식물을 입에 넣어 목구멍으로 넘기는 행위이며, 중추 및 말초 신경계의 체계적인 역할을 바탕으로 운동 및 감각기관들이 조화롭게 움직여야 그 기능이 원활하다. 삼킴은 크게 구강 준비단계, 구강 운반단계, 인-후두단계, 식도단계로 나눠진다. 만일, 각 단계와 관련된 구조와 기능에 문제가 생기거나, 이들 단계간의 조화로운 협응이 불가하면 삼킴장애(dysphagia)가 발생하게 된다. 이로 인해 식사의 질이 떨어지고, 섭취할 수 있는 음식이 제한되어 영양실조와 탈수증을 유발할 수 있다. 또한 삼킴장애를 조기에 발견하여 치료하지 못하면 흡인성 폐렴 등의 합병증으로 심할 경우 사망에까지 이를 수 있다(Cabre et al., 2009). 그런데 이러한 삼킴문제는 노화의 진행에 따른 삼킴 조 절 능력의 저하로 정상노인들도 발생할 가능성이 높다(Forster et al., 2011; Yang et al., 2013). 특히 청년층과 비교했을 때 후두 근섬유의 위축(Schindler & Kelly, 2002), 후인두 감각의 저하, 설골후두 상승의 저하(Barikroo et al., 2015) 등과 같은 노년기 후두의 해부생리학적 변화는 삼킴장애의 위험성을 높이며, 이는 노년층의 삶의 질에도 영향을 미친다(김근희 외, 2014).
Yang et al.(2013)의 연구에서 우리나라 65세 이상 노인 415명을 대상으로 표준화 삼킴 검사(standardized swallowing assessment)를 실시한 결과, 삼킴장애 유병률(prevalence)은 33.7%였다. 물론 대상 노인들에는 질환자들이 다수 포함이 되어 있긴 하나 이들은 삼킴 후 목소리 변화(20.5%), 물 마시기의 어려움(18.1%), 입술 움직임의 어려움(2.2%), 혀 움직임의 어려움(1.7%) 순으로 주요 증상을 꼽았다.
이 중 삼킴 후 목소리 변화는 후두의 해부학적, 생리학적 기능변화로 인해 인후두 경계부에 남아있는 잔여물이 기도로 들어가 성대 전까지 침습(penetration)되거나 성대 아래까지 흡인(aspiration)될 가능성을 시사하며 잔여물로 인한 음성의 변화를 의미한다(Murugappan et al., 2010). 물 삼킴검사는 비교적 빠른 시간 내에 낮은 위험성과 적은 비용으로 삼킴문제를 보이는 이들을 선별해 낼 수 있다는 장점을 가지고 있으나 노년층을 중심으로 행해진 선행연구는 미비한 실정이다.
선행연구는 주로 삼킴장애를 유발할 수 있는 신경성 질환자(예: 뇌졸중)를 대상으로 비디오투시조영 삼킴검사(videofluoroscopic swallowing study, VFSS)를 실시하면서 소량의 조영제인 바륨을 마신 후 발성한 /a/ 소리와 실시 전 /a/ 소리를 음향학적으로 분석하여 차이를 살펴보았다. Visi-Pitch II, Time-Frequency Analysis for 32-bit Windows(TF32), Multi Dimensional Voice Program(MDVP)과 같은 음향 분석 프로그램으로 분석한 결과, 특정 음향학적 변수 값(예: F0, average fundamental frequency; Jitt, jitter percent; RAP, relative average perturbation; Shim, shimmer percent; NHR, noise to harmonic ratio; VTI, voice turbulence index)이 침습이나 흡인을 보이는 환자에게서 유의한 증가를 보였거나(Ryu et al., 2004; Groves-Wright, 2007) 정상인과 차이가 없었다(Waito et al., 2011; Chang et al., 2012). VFSS 이후 침습이나 흡인을 보인 환자에게서 발성 길이(Tsam), 분석구간(SEG)이 짧아지고 분석구간의 주파수 주기성(PER)이 줄어들었다는 연구결과도 있었다(강영애 외, 2017).
이전의 연구들을 종합하여 볼 때, 삼킴 후 잔여물로 인해 나타나는 음성 변화에 대해 공통된 결과는 없다. 이는 선행연구에서 환자에게 제시한 조영제의 양과 농도가 각각 달랐으며, VFSS 검사 시 발생되는 소음이 통제되지 않았고, /a/ 소리의 분석 구간이 연구마다 일정치 않았다는 점에서 비롯된 차이로 볼 수 있다. 또한 해부학적, 생리학적 기능변화에 따라 잠재적인 삼킴장애 위험군이라 할 수 있는 정상 노년층은 간과하고 삼킴장애 환자를 대상으로만 연구를 진행해 왔다.
이에 본 연구에서는 정상 노년층과 정상 청년층 두 군을 대상으로 삼킴 후 음성 변화를 음향학적 분석으로 확인하고 변화에 대한 임상적 의미를 논의하고자 ‘정상 노년층은 3온스 물 삼킴검사 전-후간, 그리고 정상 청년층과 음질에서 음향학적 차이를 보이는가’ 라는 연구문제를 설정하였다.
2. 연구방법
본 연구의 대상자는 서울과 경기 지역에 거주하는 만 65∼90세(mean±SD=76.9±6.66)인 정상 노년층 60명과 만 19∼29세(mean±SD=25.1±2.36)인 정상 청년층 60명을 포함하였다. 본 연구는 연세대학교 생명윤리위원회(institutional review board, IRB)로부터 사전승인을 받은 후 실시되었다(No.: 7001988-201709-HR-243-03). 모든 대상자는 실험 전에 연구와 관련된 충분한 설명을 들은 후 자발적인 동의하에 서면동의서를 작성한 후 참여하였다. 연구의 대상자를 선정하기 위해 증례기록지(<부록>)를 이용하여 뇌혈관질환, 치매, 파킨슨병, 만성하기도질환, 심장질환, 음성장애 경험 등 병력을 설문하여 대상자 기준에 부합하지 않으면 배제하였다. 또한 면담 과정에서 감기로 치료를 받고 있는 경우도 제외하였다. 모든 대상자는 한국판 간이정신상태 검사(K-MMSE)상 교육수준과 연령을 고려하였을 때 정상 범주에 속하였다. 연구에 참여한 대상자의 구체적인 정보는 <표 1>에 기술하였다.
Variables | Elderly(n=60) | Young adults(n=60) |
---|---|---|
Age(mean±SD) | 76.9(±6.66) | 25.1(±2.36) |
Gender(male: female) | 30:30 | 30:30 |
K-MMSE | 24.62(±3.33) | - |
대상자의 음성은 환경 소음 50 dB 이하의 조용한 방에서 수집하였다. 대상자는 의자에 앉아 편안한 자세를 취하고 대상자의 입과 마이크의 거리는 10 cm로 유지한 채 90도 각도로 고정된 콘덴서 마이크 SONY ECM-MS907(SONY Corp., Tokyo, Japan)을 통해 녹음했다(44.10 kHz, 16 bit). 전반적인 과제 수행 절차는 <그림 1>과 같이 크게 다섯 단계로 구성되며 완료까지 약 15분 정도 소요되었다.
3온스 물 삼킴검사를 실시하기에 앞서 대상자에게 소량의 물을 마시게 하여 삼킴 문제 여부를 사전에 확인했다. 이를 위해 일회용 15 cc 계량컵에 3 mL, 9 mL 양의 생수를 각각 측정한 후 마시게 했다. 물을 마신 후, 무증상 흡인(silent aspiration)의 위험을 제거하기 위해 대상자에게 강하게 기침을 여러 번 하여 물을 기도 밖으로 뱉어낼 것을 유도했다. 만약 물을 삼키는 도중, 혹은 삼킴 직후 목 가다듬기, 헛기침, 음성변화가 관찰된 경우, 침습이나 흡인의 위험성이 있다고 판단하여 평가를 중단하고 대상자에서 제외하였다.
3 mL, 9 mL의 물 삼킴 후, 문제를 보이지 않은 대상자에게는 곧바로 3온스 물 삼킴검사를 시행하였다. 연구자는 3온스(90 mL) 계량컵에 물을 측정하여 8온스(220 mL) 투명 PET 컵에 따른 뒤 대상자에게 다음과 같이 지시하였다. “입에서 컵을 떼지 말고 한 번에 꿀꺽꿀꺽 다 드세요.” 물을 삼키는 도중 혹은 삼킴 직후 목 가다듬기, 헛기침이 관찰된 경우, 침습이나 흡인의 위험이 있다고 판단하여 평가를 중단하고 대상자에서 제외하였다.
수집된 음성 자료는 Computerized Speech Lab(이하 CSL, Kay Elemetrics Corp., NJ, USA) model 5105의 한 모듈인 MDVP를 사용하여 분석하였다. 사전 녹음한 /아/ 모음의 경우, 약 5초간 발성한 총 3회 중 가장 안정적으로 발성한 5초를 택하여, 발성시작시간 30 ms 이후 초기 2초 구간을 분석했다(<그림 2>). 그리고 동일한 구간 내 중기 2초 부분을 선택하여 분석했다(<그림 3>). 마찬가지로 사후 녹음한 /아/ 모음의 경우도 발성시작시간 30 ms 이후 초기 2초 구간과 중기 2초 구간을 분석했다. 두 구간으로 나눈 이유는 물 삼킴 후 잔여물이 성대에 남아있다면 성대진동에 영향을 미치고, 발성이 진행됨에 따라 잔여물이 없어지는 상황을 고려하였기 때문이다. MDVP로 분석 가능한 음성 변수는 총 34개이며, 이중 일부는 분석되지 않거나 서로 상관성이 높다고 알려져 있으므로 본 연구에서는 선행연구(강영애 외, 2017; Chang et al., 2012; Groves-Wright, 2007; Ryu et al., 2004; Waito et al., 2011)에서 분석한 변수(F0, PER, Jitt, RAP, Shim, NHR, VTI)를 포함하여 총 12개의 음성 변수를 분석하였다(<표 2>).
Categories | Variables |
---|---|
Fundamental frequency | F0, STD, PER |
Frequency perturbation | Jitt, Jita, RAP, vF0 |
Amplitude perturbation | ShdB, Shim, vAm |
Noise | NHR, VTI |
F0, average fundamental frequency; STD, standard deviation of F0; PER, pitch periods; Jitt, jitter percent; Jita, absolute jitter; RAP, relative average perturbation; vF0, F0 variation; ShdB, shimmer in dB; Shim, shimmer percent; vAm, peak amplitude variation; NHR, noise to harmonic ratio; VTI, voice turbulence index.
두 구간에서 노년층과 청년층이 삼킴 전후로 음성 변수 차이가 있는지 확인하기 위해 <그림 4>에 기술한 (A)와 (C), (B)와 (D)를 노년층과 청년층에서 각각 비교하였다.
연구결과
노년층은 총 12개의 변수 중 10개의 변수가 물 삼킴 후 유의하게 높았다(<표 3>). 변수별로 상세히 기술해 볼 때, STD는 삼킴 후 8.074(±8.75)가 삼킴 전 2.714(±2.03)에 비하여(p<.001), Jitt는 삼킴 후 0.823(±0.59)이 삼킴 전 0.508(±0.36)에 비하여(p<.001), Jita는 삼킴 후 45.803(±40.50)이 삼킴 전 26.803(±22.06)에 비하여(p<.001), RAP는 삼킴 후 0.464(±0.36)가 삼킴 전 0.295(±0.22)에 비하여(p<.001), vF0는 삼킴 후 3.677(±2.74)이 삼킴 전 1.319(±0.86)에 비하여(p<.001), ShdB는 삼킴 후 0.333(±0.20)이 삼킴 전 0.196(±0.12)에 비하여(p<.001), Shim는 삼킴 후 3.687(±2.33)이 삼킴 전 2.243(±1.42)에 비하여(p<.001), vAm는 삼킴 후 17.471(±6.07)이 삼킴 전 8.742(±4.17)에 비하여(p<.001), NHR은 삼킴 후 0.140(±0.02)이 삼킴 전 0.120(±0.01)에 비하여(p<.001), 그리고 마지막으로 VTI는 삼킴 후 0.043(±0.01)이 삼킴 전 0.036(±0.01)에 비하여(p<.05) 유의하게 높았다. F0와 PER에서는 전후 차이가 통계적으로 유의하지 않았다(p>.05).
청년층은 총 12개의 변수 중 STD 1개 변수만이 삼킴 후 1.855(±0.91)가 삼킴 전 1.615(±0.78)에 비하여 유의하게 높았다(p<.01)(<표 4>).
M, male; F, female; F0, average fundamental frequency; STD,: standard deviation of F0; PER, pitch periods; Jitt, jitter percent; Jita, absolute jitter; RAP, relative average perturbation; vF0, F0 variation; ShdB, shimmer in dB; Shim, shimmer percent; vAm, peak amplitude variation; NHR, noise to harmonic ratio; VTI, voice turbulence index; SD, standard deviation. * p<.05, ** p<.01, *** p<.001.
M, male; F, female; F0, average fundamental frequency; STD, standard deviation of F0; PER, pitch periods; Jitt, jitter percent; Jita, absolute jitter; RAP, relative average perturbation; vF0, F0 variation; ShdB, shimmer in dB; Shim, shimmer percent; vAm, peak amplitude variation; NHR, noise to harmonic ratio; VTI, voice turbulence index; SD, standard deviation. * p<.05, ** p<.01, *** p<.001.
노년층은 총 12개의 변수 중 10개의 변수가 물 삼킴 후 유의하게 높았다(<표 5>). 중기 구간의 STD는 삼킴 후 5.601(±9.81)이 삼킴 전 2.362(±1.62)에 비하여(p<.01), PER은 삼킴 후 397.67(±129.86)이 삼킴 전 371.62(±133.06)에 비하여(p<.01), Jitt는 삼킴 후 0.787(±0.87)이 삼킴 전 0.490(±0.31)에 비하여(p<.01), Jita는 삼킴 후 45.671(±66.69)이 삼킴 전 25.959(±19.94)에 비하여(p<.01), RAP는 삼킴 후 0.457(±0.52)이 삼킴 전 0.286(±0.19)에 비하여(p<.01), ShdB는 삼킴 후 0.339(±0.31)가 삼킴 전 0.204(±0.12)에 비하여(p<.01), Shim는 삼킴 후 3.795(±3.37)가 삼킴 전 2.345(±1.41)에 비하여(p<.01), NHR은 삼킴 후 0.141(±0.05)이 삼킴 전 0.122(±0.01)에 비하여(p<.01), vF0 또한 삼킴 후 2.899(±5.72)가 삼킴 전 1.148(±0.68)에 비하여(p<.05), 그리고 vAm도 삼킴 후 12.410(±6.02)이 삼킴 전 7.306(±2.64)에 비하여 유의하게 높았다(p<.001). F0와 VTI에서는 전후 차이가 통계적으로 유의하지 않았다(p>.05).
노년층과는 대조적으로, 청년층은 12개의 변수 모두에서 삼킴 전후 간의 유의한 차이를 보이지 않았다(p>.05)(<표 6>).
M, male; F, female; F0, average fundamental frequency; STD, standard deviation of F0; PER, pitch periods; Jitt, jitter percent; Jita, absolute jitter; RAP, relative average perturbation; vF0, F0 variation; ShdB, shimmer in dB; Shim, shimmer percent; vAm, peak amplitude variation; NHR, noise to harmonic ratio; VTI, voice turbulence index; SD, standard deviation. * p<.05, ** p<.01, *** p<.001.
M, male; F, female; F0, average fundamental frequency; STD, standard deviation of F0; PER, pitch periods; Jitt, jitter percent; Jita, absolute jitter; RAP, relative average perturbation; vF0, F0 variation; ShdB, shimmer in dB; Shim, shimmer percent; vAm, peak amplitude variation; NHR, noise to harmonic ratio; VTI, voice turbulence index; SD, standard deviation. * p<.05, ** p<.01, *** p<.001.
4. 논의 및 결론
본 연구는 노화에 따른 삼킴 전후의 음질변화를 확인하고자 정상 노년층 만 65∼90세 60명과 정상 청년층 만 19∼29세 60명을 대상으로 3온스 물 삼킴검사를 실시하여 삼킴 후 목소리 변화를 음향학적으로 분석하였다.
물 삼킴 후 노년층은 초기 구간에서 F0, PER을 제외하고 기본주파수의 표준편차(STD), 기본주파수 변이(Jitt, Jita, RAP, vF0), 강도 변이(ShdB, Shim, vAm), 잡음 관련 변수(NHR, VTI)에서 유의한 증가를 보였다. 중기 구간에서도 F0, VTI를 제외하고 주파수 주기성(PER), 기본주파수의 표준편차(STD), 기본주파수 변이(Jitt, Jita, RAP, vF0), 강도 변이(ShdB, Shim, vAm), 잡음 관련 변수(NHR)에서 유의한 증가를 나타냈다. 즉, 노년층은 물을 삼키고 일시적으로 음도 및 강도의 불규칙성과 음성의 잡음이 높아져 삼킴 전과는 다른 음성을 보인 것으로 파악된다. 이러한 결과를 보인 이유는 다음과 같이 설명될 수 있다.
첫째, 성대 및 성도(vocal tract)에 남아있는 잔여물이 성대진동의 주기성에 영향을 주었을 수 있다. 일반적으로 음성이란 성대에서 성문음을 만들어내면 성문음이 성도를 통과하면서 여과되고 성도의 모양에 따른 특성에 따라 공명현상을 일으켜서 말소리로 나오는 것인데, 물 삼킴 후 성대를 비롯한 후두강뿐만 아니라 인두강, 구강을 포함한 성도에 남은 잔여물 또한 음성의 변화에 영향을 주었을 수도 있는 것이다. 이러한 잔여물에 대한 관찰은 선행연구에서 보고된 바가 있는데, 60세 이상에서 구강과 인두 잔여물의 빈도나 양이 증가하였고 연령이 증가함에 따라 후두 전정(laryngeal vestibule)에 음식물이 침투하는 빈도가 증가하였다(Robbins et al., 1992). 또한, 본 연구 결과와 유사하게 후두 전정에 잔여물이 관찰된 환자나 침습 및 흡인을 보인 환자에게서 특정 음향학적 변수들(Jitt, RAP, Shim, NHR, VTI) (Groves-Wright, 2007; Murugappan et al., 2010; Ryu et al., 2004)에서 유의한 증가를 보였다. 강영애 외(2017)의 연구에서 유의하게 줄어들었다고 보고한 변인 PER의 경우, 본 연구의 노년층에서 삼킴 후 중기 구간만에서 유의한 증가를 보였는데 이는 분석 구간의 차이에서 도출된 결과 차이로 보인다. 그러나 이 논의는 본 연구 결과만으로 구체적으로 확인할 수 없는 사항이므로 향후 후속 연구를 통하여 이에 대한 생리학적인 고찰이 필요할 것으로 사료된다.
둘째, 물 삼킴과 관계없이 노화로 인한 후두의 변화로 청년층과 다른 음질을 보일 수 있다. 여러 연구에서 노화에 따른 음성을 보고하였는데(김선우 외, 2010; 이효진 & 김수진, 2006; 진성민 외, 1997; Schötz, 2007), 기본주파수 변이 관련 변수(Jitt, vF0), 음성 강도 변이 관련 변수(Shim, vAm), 잡음 관련 변수(NHR) 모두 연령이 높아질수록 증가했다. 이는 성대의 질량 변화, 궁형 성대(vocal fold bowing)와 같은 해부생리학적 변화(Linville, 1995), 불완전한 성문 폐쇄를 보완하기 위한 후두의 긴장과 같은 보상작용으로 인해 나타나는 음성의 진전, 점막 파동의 비대칭성에 기인할 수 있다(Pontes et al., 2005). 이렇듯 노화로 인한 음질 변화를 보일 수 있으나 본 연구에서는 삼킴 전후 비교 시 삼킴 후 음질이 유의하게 나빠졌으므로 노년층의 삼킴 기능 저하를 의미할 수 있다.
한편, 청년층은 물 삼킴 후 초기 구간에서 STD가 유의하게 증가하였으나 중기 구간에서 통계적으로 유의한 변수는 없었다. 즉, 청년층의 경우 물 삼킴 후 약간의 음질 변화를 보였지만 노년층보다 유의한 변수가 적다는 점은 물 삼킴이 발성에 큰 부정적 영향을 주지 않았음을 시사한다.
이상의 내용을 종합해 볼 때, 정상 노년층의 물 삼킴 후 음질 변화는 그 원인을 한 가지로 단정 짓기는 쉽지 않으나 주로 노화로 인한 해부생리학적 변화에 기인하는 것으로 보인다. 노년층은 특별한 질환이 없더라도 노화로 인하여 청년층보다 성대인대의 유연성, 후두벽의 탄력성과 설골 움직임이 감소하고 감각 기능이 쇠퇴하는 등 발성능력과 삼킴능력 모두에 영향을 받는다(김근희 외, 2014; 김선우 외, 2010; 이효진 & 김수진, 2006; 진성민 외, 1997; Humbert & Robbins, 2008; Linville, 1995; Nagai et al., 2005; Onofri et al., 2014; Pontes et al., 2005; Robbins et al., 1992; Schötz, 2007; Yamamoto et al., 2003). 그리고 이러한 변화는 노인성 삼킴으로 나타나는 문제와 밀접한 관련이 있다. 본 연구에 참여한 노년층은 모두 사레들림, 헛기침, 목 가다듬기와 같은 침습 및 흡인을 나타내는 징후를 보이지 않았으나 삼킴 후의 음향학적 지표들이 삼킴 전과 비교하여 유의하게 증가한 점에 주목할 만하다. 이러한 결과는 노화로 인한 삼킴의 변화에 더 관심을 가져야할 필요성을 일깨워준다. 특히 선행연구와 비교하여 다수의 음성 변수들을 고찰함으로써 음향학적 음질 차이를 확실히 재확인하였다. 또한 삼킴 후 음질 변화를 두 구간으로 나누어 발성 구간에 따른 영향과 물 삼킴의 영향을 확인하고자 했다는 점에서 의의가 있다.
후속연구에서 노년층의 삼킴 후 변화를 음향학적 분석과 더불어 청지각적 평가를 동시에 실시하거나, VFSS, 후두 내시경 등의 장비를 활용하여 삼킴의 해부학적 상태를 확인할 수 있다면 삼킴 후 변화에 대한 객관적인 정보를 추가적으로 제공할 수 있을 것이다.