1. 서론
인간의 음성(human voice)은 물리적인 움직임의 결과물이다. 인간은 신체를 움직이는 것처럼 음성 산출에 필요한 근육들을 순차적으로 움직여서 진동을 만든다(Jeong, 2003). 숨을 내쉴 때 폐의 폐포에서 가스교환이 일어난 날숨이 기관지를 거쳐 기도를 타고 올라와 후두(larynx)를 지나게 된다(Jeong, 2003; Seikel et al., 2013). 이때 후두를 지나는 공기가 성대(vocal folds)에 부딪혀 성대의 진동을 만들게 되고, 이 진동은 말소리를 생성한다(Jeong, 2003). 이는 소리의 높이를 결정하는 기본주파수(fundamental frequency, 이하 Fo)와 크기를 결정하는 진폭(amplitude, 이하 Am)으로 구성된다(Ferrand, 2011; Sataloff, 2005).
말소리는 호흡, 발성, 공명, 조음 기관들의 상호 협응 작용에 의해 산출되며, 중추신경계와 말초신경계에 의해 통제되고 조절된다(Ferrand, 2011). 성문(glottis)에서 만들어진 지속적인 성대 진동은 성도(vocal tract)를 지나면서 다양한 종류의 말소리로 변화되어 구강과 비강을 통해 대기로 나오게 된다(Seikel et al., 2013). 공기입자들의 충돌을 통해 전달된 말소리 진동은 고막을 다양하게 두드리고, 이소골 연쇄와 내이를 지나면서 신경 임펄스로 변환되어 청신경을 통해 뇌로 전달된다. 뇌로 전달된 신경 임펄스는 청각언어센터로 전달되어 인식되고 해석된다. 성문에서 만들어진 성대 진동은 이와 같은 경로를 거쳐 언어의 재료가 된다(Benninger et al., 2016; LaPointe et al., 2010; Sataloff, 2005).
후두는 출생 후 성장하면서 급격한 위치의 변화를 가져온다. 선행 연구에 따르면, 신생아와 영아들의 후두는 포유류와 유사하게 높게 위치 해 있는데, 이로 인하여 호흡을 하는 동시에 삼킴이 가능하다고 보고하였다(Laitman et al., 1977). 또한 Magriples & Laitman(1987)은 신생아와 영아들의 높은 후두 위치가 생후 1세 6개월에서 2세 전까지는 1번 경추(cervical vertebrae, 이하 C1)의 기저부와 4번 경추(C4)의 상부 사이에 위치 하지만, 2세 이후 천천히 하강하여 C2와 C5 사이 높이로 위치한다고 보고하였다.
언어학적인 관점에서 신생아의 높은 후두 위치는 소리를 다양하게 변화시키지 못하는 결과를 초래한다. 비록 높은 후두의 위치 때문에 호흡 통로와 삼킴 통로가 동시에 존재 하는 것이 가능하지만, 이로 인해 신생아와 영아들은 다양한 소리를 발생시키기 어렵다(Laitman et al., 1977; Lieberman, 1984; Sasaki et al., 1977). Lieberman(1984)은 그의 저서에서 높게 위치한 후두가 상인두 공간을 좁게 만들면, 성대가 다양한 소리를 산출하는 것이 크게 제한된다고 보고하였다. 따라서 신생아나 원숭이처럼 후두의 높이가 높으면, 그렇지 않을 때와 비교하여 발성의 범위가 현저하게 제한하는 것으로 보고하였다.
Laitman & Crelin(1976)과 Lieberman et al.(1992)은 신생아와 원숭이에게 산출되어지는 비연속적으로 발성된 모음을 확인한 결과, 특정 모음 /i/, /u/, /a/ 가 인간의 신생아와 다른 포유류들이 만들어낼 수 없는 소리였다고 보고하였다(Laitman & Reidenberg, 1993). 후두는 2세 이후 계속 하강하여 7세에는 C3와 C5의 기저부 사이에 위치하게 된다. 성인이 되면 C4와 C7의 상단부까지 하강하게 되며, 이런 장기간에 걸쳐 지속적으로 이루어진 후두의 하강은 매우 다양한 종류의 소리 산출을 가능하게 하고, 이와 같은 후두의 하강은 다른 동물들과 구별되는 인간의 뚜렷한 특징이라고 보고하였다(Laitman & Crelin, 1976).
Türkmen et al.(2012)은 x-Ray 방사선 촬영을 통해 300명의 측면 경부 촬영(lateral cervical imaging)을 분석하여 후두에 위치한 연골들의 변화 정도를 보고하였는데, 갑상연골과 윤상연골은 생후 10년이 지나면서 골화가 진행되는 게 방사선 사진에서 점차 관찰된다고 보고하였다. 모든 후두 내의 연골들은 매우 느리게 경화가 지속되는 반면에, 설골은 10세 전에 경화가 이루어져서 몸통(body) 부분과 대각(greatest horn) 부분의 구별이 가능해지고, 30세가 지나면서 단일의 뼈로 완성된다고 보고하였다.
한편, 신경발달장애(neurodevelopmental disorders)로 분류되는 자폐스펙트럼장애(autism spectrum disorders, 이하 ASD)는 사회적 의사소통 및 상호작용의 지속적인 제한을 보이며, 반복적인 운동이 나타나고 동일성에 대한 고집을 보이는 장애이다(diagnostic and statistical manual of mental disorders 5th, DSM-5; American Psychiatric Association., 2013).
몇몇 선행 연구들에서 ASD 아동들의 비정상적인 음성 특성을 확인해 볼 수 있다. Wing(1992)은 정상 유아들과는 다르게 ASD 유아들이 주고받는 전략(turn-taking strategy)이나 적절한 비언어 의사소통(body language)뿐만 아니라, 발화 시에도 음성의 높이와 억양을 사용하는 것에 제한이 있다고 보고하였다. Bregman(2005)은 ASD 아동들이 사회적인 얼굴표정(socially facial expressions)을 상황에 맞게 사용하지 못할 뿐만 아니라, 정서를 제스처로 표현하거나 억양과 같은 언어의 초분절적인 요소를 사용하여 발화하는데 심각한 손상이 있다고 보고하였다.
최근에, Nakai et al.(2014)은 ASD 아동 26명과 동일 연령대의 정상 아동 37명의 말소리의 높낮이(speech intonation)를 분석한 결과, ASD 아동들의 발화 시 최고 음도(great pitch)가 정상 대조군 아동들의 음도보다 더 낮은 것으로 나타났으며, 결과적으로 ASD 아동들이 정상 대조군 아동들에 비하여 단조로운 말소리 억양(monotonous speech)을 사용한다고 보고하였다.
또한, Smerbeck(2015)은 ASD 아동들과 동일 연령대의 정상 아동들의 발화 시 비음도를 청지각적으로 평가한 결과, ASD 아동들의 음성이 정상 대조군 아동들에 비해 더많은 비음이 산출된다고 보고하였고, Baltaxe(1981)는 정상 아동들이 발화 시 구문의 형태를 음도 변화로 표현하는데 반해, ASD 아동들은 강도 변화로 구문의 형태를 표현하는 운율특성을 보이며, 정상아동들에 비해 매우 넓은 강도 범위를 사용한다고 보고하였다.
앞선 선행연구들을 종합해 보면, 정상 아동들의 후두 발달이나 연골들의 구조적 변화에 대한 연구는 찾아볼 수 있지만, 언어발달이 지연되는 아동들의 후두 특징 및 후두 발달에 대한 연구는 아직까지 보고된 바 없었다. 특히 지속적인 언어발달 지연을 보이는 ASD 아동의 후두 특징은 아직까지 보고된 바 없다.
또한, ASD 아동들의 발화 시 운율, 기본주파수, 비음 등과 같은 초분절적 요소들에 대한 연구는 지속적으로 보고되고 있으나, 발성장애의 유무를 평가할 수 있는 모음발성 시 음향학적 변수들의 이상 유무를 보고한 연구는 아직까지 없는 실정이다. 발성기능 평가에서 모음연장 발성은 음질을 판단하는데 유용하며, 정상적인 모음 발성 시 음질은 안정되고 균일하며 부드럽고 명확하다. 또한 모음 연장 발성은 거친 음질이나 쥐어짜는 음질 그리고 낮은 음도 등과 같은 발성기능 결함을 찾아내는데 매우 유용하다고 보고된 바 있다(Freed, 2012).
이에 본 연구는 ASD 아동들의 후두 위치 특성과 모음 발성 시 나타나는 음향학적 변수들의 특징을 동일 연령대 정상 아동들과 비교해 보고 어떠한 차이가 있는지 확인해 보고자 하였다.
2. 대상 및 방법
ASD로 진단되어 언어치료실에 내원한 2세에서 4세까지 ASD 아동 15명과 동일 연령대의 정상 아동 94명, 총 109명을 대상으로 하였다. 본 연구는 동신대학교 생명윤리위원회(Institutional Review Board, IRB)의 승인을 얻어 진행하였다. 대상자들은 한국형 아동기 자폐증 평정 척도(The Korean Version of Childhood Autism Rating Scale, CARS), 영·유아 언어발달검사(sequenced language scale for infants, SELSI; Kim, 2014)를 사용하여 자폐성 척도를 측정하고 언어발달을 평가하여 연구의 목적에 부합하는 아동을 선정하였다.
대상자는 모두 남아로 제한하였으며, 연령분포는 2세에서 4세로 하였다. 대상자의 연령과 성별을 제한 한 이유는 후두의 하강이 2세 전후로 나타나기 시작하며 남아가 ASD 출현율이 높기 때문에 실험군과 대조군을 모두 남아로 선정하였다.
연구에 앞서 모든 대상들 중 다음과 같은 사항을 가진 대상자들은 연구에서 제외하였다.
첫째, 만성 호흡기 질환 또는 상기도 감염 소견이 있는 자.
둘째, 기타 질병으로 약물을 장기 복용해 왔거나 복용하는 자.
셋째, 경도 이상의 청력손실을 가진 자.
넷째, 장기간 삽관을 시행한 수술이나 기관절개술을 받은 자.
다섯째, 다운증후군 등과 같은 기타 유전적 장애가 있는 자.
여섯째, 시각장애나 뇌병변과 같은 신체적 장애가 있는 자.
일곱째, 구개파열, 설소대 단축증 등 기질적 문제가 있는 자.
여덟째, 정상 대조군 중 언어발달 지연 또는 발달 지연이 의심되는 자.
15명의 ASD 아동 중 7명은 X-Ray 사진 촬영 시 측면검사 결과 촬영 실패로 간주하여 대상에서 제외되어, 나머지 8명의 ASD 아동만이 실험에 참가할 수 있었다(표 1). 8명의 ASD 아동 음성샘플 중에서도 발성 지속시간이 짧거나 강도가 적절하지 않은 2개의 음성샘플은 본 연구에서 제외되어 6개의 음성샘플만 실험에 사용할 수 있었다.
정상 대조군 아동 94명 중 측면 검사 상 촬영에 실패하거나 개인적인 이유로 실험에 참여하지 못한 48명 아동이 제외되었고, 언어발달 지연이 의심되는 정상 아동 3명, 설소대 단축증을 갖은 정상 아동 1명 또한 연구에서 제외되어 42명(2세, 11명; 3세, 17명; 4세, 14명) 아동만이 최종적으로 본 연구에 참여할 수 있었다.
또한 정상 아동들 중 언어치료실에 내원하여 음성샘플 수집에 참여한 아동은 모두 15명 이었는데, 그 중 2명의 아동은 음성장애가 의심되거나 불안정한 음성때문에 실험에서 제외되었고, 또 다른 2 명의 아동도 음성 녹음 시 지나치게 긴장하여 음성분석이 가능한 음성이 수집되지 않았기 때문에, 11명의 음성샘플로 실험을 진행할 수밖에 없었다. 이리하여 ASD 아동 8명과 정상 대조군 아동 42명을 포함한 총 50명의 대상자들로 실험을 진행하였다.
HITACHI사의 Disital Rediography system을 사용하여 방사선 촬영을 하였고, 정중시상면(midsagittal plane)을 촬영하여 기록 하였다. 경추를 기준으로 한 설골바디(body of hyoid bone, BH)의 상단 높이, 외이도(external acoustic meatus, EAM)에서 BH 상단까지의 거리, 하악모서리점(gonion of mandible, GM)에서 BH 상단의 거리를 각각 측정하였다. EAM과 GM은 X-ray 시상면 판독 시 기준점이 되는 좌표로 각각의 기준 지점과 설골까지의 거리를 측정하여 그 차이를 함께 비교하였다.
X-ray 촬영 시 아동은 수직격자장치 앞에 측면자세(lateral position)로 서고 검사면 쪽 어깨를 상수용판(image receptor)에 밀착시킨 후, 수직 격자 장치나 촬영대의 중앙선에 관상면(coronal plane)의 중심을 일치시켰다. 외이도(EAM)의 위쪽 약 5 cm의 위치에 상수용판(IR) 끝을 맞추었고, 양 어깨는 같은 수평면에 놓이게 조정하였다. 또한 하악골(mandible)과 경추 윗부분이 겹쳐지는 것을 방지하기 위하여 턱을 약간 앞쪽으로 내밀게 하여 촬영하였다(Bontrager et al., 2005).
ASD 아동과 정상 대조군 아동의 음성을 분석하여 비교하기 위해 CSL(Model 4300B, Kay Elemetrics Corporation, Lincoln Park, NJ., U.S.A.)의 MDVP를 시행하여 대상자들의 음성을 평가하였다. MDVP를 사용하여 기본주파수(Fo), 최대기본주파수(Fhi), 최저기본주파수(Flo), 기본주파수범위 세미톤(PFR), 주파수변동률(jitter), 진폭변동률(shimmer), 소음대배음비(NHR), 음성난기류지수(VTI), 약한음성지수(SPI), 주파수변화량(vFo), 진폭변화량(vAm) 같은 음성 파라미터들을 분석하여 비교하였다.
X-ray 촬영 시 촬영자는 아동의 보호자에게 촬영에 대한 기본 정보를 제공하였고, 방사선을 이용한 촬영에 대한 과도한 불안감을 감소시키기 위하여 X-ray 방사선 촬영의 안전함에 대해 충분하게 숙지하도록 설명 하였다. 촬영 시 아동이 불안을 느끼거나 긴장을 했을 때 부모의 협조를 구하여 아동의 불안과 긴장을 낮추어 성공적인 촬영을 유도하였다.
특히, ASD 아동들은 낯선 공간에 대한 거부감과 의료장비에 대한 두려움을 느낄 수 있기 때문에 아동의 불안감과 긴장을 최소화하기 위해 부모 혹은 담당 언어재활사가 동행하여 편안하게 촬영을 할 수 있도록 협조하였다. 또한, 방사선 선량을 최소로 낮추고 촬영하였고 촬영 도중 아동이 발화를 시도하거나 턱을 당기는 등의 부적절한 자세를 취할 경우 자세 보정 후 재촬영하였다.
판독에 사용된 촬영사진은 GM이 경추 윗부분(C1~C2)과 겹쳐지지 않고 양쪽 하악 가지는 똑같이 겹쳐져 있으며, 뼈와 연조직을 잘 볼 수 있을 정도로 적정한 사진들만 연구에 사용하도록 분류하였다. 이렇게 촬영된 X-ray 사진을 분석하여 정상발달 아동들의 BH 상단의 높이, EAM에서 BH 상단까지의 거리, GM에서 BH 상단까지의 거리를 측정하여 연령별 특징을 분석하였고 이를 ASD 아동과 비교하였다.
또한 정확한 후두 방사선 촬영 소견을 확인하기 위하여 방사선과 전문의 1인과 이비인후과 전문의 1인의 판독을 통하여 공통된 판독 결과를 채택하였고, 정상 아동들과 후두 방사선 촬영 소견을 비교하여 그 차이를 객관적으로 수치화하고 기록하였으며 대상자들의 방사선 촬영 기록을 비교 분석하였다.
ASD 아동과 정상 대조군 아동의 음성샘플은 SONY PCM-D100 voice recorder를 사용하여 수집하였다. 특히, 의미있는 음성분석이 가능한 음성녹음기준인 44,100 Hz 표본추출률과 16 bit로의 양자화로 음성 샘플을 표집하였다.
MDVP 검사 시 환경음과 같은 소음이 차단된 방에서 녹음을 실시하였고, 아동의 입에서부터 녹음기 마이크까지의 거리는 약 5 cm로 하였으며, 지속적인 모음 /a/를 3회 정도 발성하여 2초 이상 지속모음을 채택하였고 이 중 안정구간을 구하여 분석했다. 이 때, 편안한 상태의 발성을 유도하기 위해 음성 수집 전에 충분한 연습을 시행하였다.
3. 결과
연령별 설골 높이를 비교하기 위해 X-ray 촬영 후 정상 아동들의 BH 상단 높이를 경추 높이와 비교해 본 결과, 2세 아동의 설골 높이(2.36±1.43)가 가장 높았고, 그 다음으로 4세 아동의 설골 높이(3.64±1.94)가 두 번째로 높았으며, 3세 아동의 설골 높이(4.41±0.84)가 가장 낮은 것으로 확인되었다(표 2, 그림 1). 연령별 설골의 높이를 비교해 본 결과, 연령 간에 설골 높이는 통계학적으로 유의미하게 차이가 있는 것으로 나타났다(p<.05, 표 3). 연령대별로 설골의 높이가 어떤 차이가 있는지 확인하기 위해 Dunnett 사후검정을 실시한 결과, 2세와 3세의 설골의 높이가 통계학적으로 유의미하게 차이가 있는 것으로 나타났다(p<.05, 표 4). 반면, 2세와 4세의 설골 높이는 유의미한 차이가 없는 것으로 나타났으며, 3세와 4세간의 설골 높이도 통계학적인 차이는 없는 것으로 나타났다.
연령별 설골 위치를 비교해 보기 위해 X-ray 촬영 후 정상 아동들의 경추측면촬영영상의 랜드마크(표지점)인 EAM에서 설골까지의 거리를 측정하여 비교분석 하였다. 그 결과, 4세 아동의 EAM에서 설골까지의 거리(6.71, ±0.73)가 가장 긴 것으로 나타났으며(표 2), 그 다음으로 3세 아동의 EAM에서 설골까지의 거리(6.47±0.51)가 두 번째로 길었고, 2세 아동의 EAM에서 BH까지의 거리(6.09±0.30)가 가장 짧은 것으로 확인되었다(표 2). 연령별 EAM에서 BH까지의 거리를 비교해 본 결과, 연령 간에 EAM에서 BH까지 거리가 통계학적으로 유의미하게 차이가 있는 것으로 나타났다(p<.05, 표 3).
EAM와 BH 간의 거리가 연령 별로 어떠한 차이가 있는지 사후검정을 실시해 본 결과, 설골 높이와 달리 2세와 4세간에 EAM과 BH간의 거리가 통계학적으로 유의미하게 차이가 있는 것으로 확인되었다(p<.05, 표 4). 반면 2세와 3세 간의 EAM과 BH간의 거리는 통계학적인 차이가 없는 것으로 나타났으며(표 4), 3세와 4세 간의 EAM과 BH간의 거리도 유의미한 차이가 없는 것으로 나타났다(표 4).
X-ray 촬영 후 연령별 정상 아동의 설골 높이를 비교해 보기 위해, 경추측면 촬영 영상의 또 다른 랜드마크(표지점)인 GM에서 BH까지의 거리를 측정하여 비교해 본 결과, 2세의 GM에서 BH까지의 거리(1.91±0.30)와 4세의 GM에서 BH까지의 거리(1.93±0.62)가 3세(1.59±0.51)세보다 긴 것으로 확인되었다. 하지만 연령 간의 GM에서 BH까지의 거리는 통계적으로 유의미한 차이가 나타나지 않았다(표 3, 표 4).
그림 1은 2~4세 정상 대조군 아동들과 4세 ASD 아동의 측면 경추 X-ray 사진으로, 정상 대조군 아동들의 연령별 후두 위치와 4세 ASD 아동의 후두 위치를 확인할 수 있다.
ASD 아동의 연령별 설골의 높이를 비교하기 위해 X-ray 촬영 후 ASD 아동들의 BH 상단 높이를 경추 높이와 비교하였다. 그 결과, 4세 ASD 아동 설골의 높이(4.5±0.71)가 가장 높은 것으로 나타났으며, 2세 아동의 설골 높이(5±0)와 3세 아동의 설골 높이(5±0.82)는 두 연령 모두 평균 5점으로 평가되어, 4세 ASD 아동의 설골 높이보다 낮은 것으로 확인되었다(표 5).
X-ray 촬영 후 ASD 아동의 EAM에서 BH 사이의 거리를 비교해 본 결과, 3세 ASD 아동의 EAM에서 BH 사이의 거리(6.56± 0.65)가 가장 길었고, 4세 아동의 EAM에서 BH 사이의 거리(6.48±0.93)가 그 다음으로 길었으며, 2세 아동의 EAM에서 BH 사이의 거리(5.91±0.40)가 가장 짧은 것으로 평가되었다(표 5). 이 결과를 정상 대조군과 비교해 보면, ASD 아동과 정상 대조군 아동의 EAM에서 BH 사이 거리는 공통적으로 2세가 가장 짧았다. 또한, 정상 대조군 아동의 EAM에서 BH 사이의 거리는 4세가 가장 길었으나, ASD 아동의 EAM에서 BH 사이의 거리는 3세가 가장 긴 것으로 측정되었다(표 5).
X-ray 촬영 후 ASD 아동의 GM에서 BH 사이의 거리를 비교해 본 결과, 2세 ASD 아동의 GM에서 BH 사이의 거리(3.16± 0.54)가 가장 길었고, 3세 아동의 GM에서 BH 사이의 거리(3.09±1.24)는 그 다음으로 길었으며, 4세 아동의 GM에서 BH 사이의 거리(3.04±0.10)가 가장 짧은 것으로 평가되었다(표 5).
이 결과들을 ASD군과 정상군을 비교해 보면, 정상 대조군 아동의 GM에서 BH 사이의 거리는 4세가 가장 길었던 것에 비하여 ASD 아동의 GM에서 BH 사이의 거리는 4세가 가장 짧은 것으로 평가되었다. 그리고, ASD 아동과 정상 대조군 아동 모두 2세의 GM에서 BH 사이의 거리가 3세의 GM에서 BH 사이의 거리보다 더 긴 것으로 나타났다(표 5). 물론, 앞에서의 결과와 마찬가지로 실험에 참가한 ASD 아동의 수가 적어 통계적 유의성은 확인할 수 없었다.
ASD 아동들과 정상 아동 간의 모음 연장 발성 시 음향학적 변수들을 비교해 본 결과, 기본주파수범위 세미톤(PFR)은 ASD 군이 정상 대조군에 비해 통계학적으로 유의미하게 높은 것으로 나타났다(p<.05, 표 6). 그러나 기본주파수(Fo), 최대기본주파수(Fhi), 최소기본주파수(Flo) 등은 두 군간 유의미한 차이가 없는 것으로 확인되었다.
ASD 아동들과 정상 대조군간의 모음 연장 발성 시 음질 변수들을 비교해 본 결과, 주파수 변동율(jitter), 진폭 변동율(shimmer) 그리고 소음관련 변수(NHR, VTI, SPI) 등은 두 군간 통계적으로 유의미한 차이가 없는 것으로 확인되었다(표 6).
ASD 아동들과 정상 대조군간의 모음 연장 발성 시 vFo와 vAm을 비교해 본 결과, ASD 아동들이 정상 대조군에 비해 vFo와 vAm이 통계학적으로 유의미하게 높은 것으로 나타났다(p<.05, 표 6).
4. 논의
본 연구는 ASD 아동들의 후두 양상과 음향학적 특성을 알아보기 위해서 2~4세 정상 대조군 아동들의 경추 대비 BH 상단의 높이, EAM에서 BH 상단까지의 거리, GM에서 BH 상단까지의 거리를 측정하고 그 결과를 ASD 아동들과 비교하였다. 또한 음성분석을 통해서 정상 대조군 아동과 ASD 아동의 음향학적 파라미터들을 함께 비교분석 하였으며, 그 결과는 다음과 같다. 첫째, 정상아동들의 경우 3세의 설골 높이가 2세의 설골 높이보다 낮았지만, 4세의 설골 높이는 3세보다도 높았다. 또한, 4세 아동의 EAM에서 설골까지 거리는 3세 아동의 EAM에서 설골까지 거리보다 길었다. 3세 아동의 설골 높이가 2세 아동에 비해서 낮아졌다는 것은 발달에 따른 후두의 하강을 의미하며, Laitman et al.(1977)도 1세 영유아 갑상연골의 상단과 하단은 각각 C1과 C4 높이에 위치하였다가, 2세 전후로 후두가 하강하기 시작하면서 7세가 되면 C3 와 C5 높이에 위치하게 된다고 보고하였다(Lieberman, 1984; Sasaki et al., 1977).
본 실험에서 3세 아동의 설골 높이가 2세 아동의 설골 높이보다 더 낮은 결과가 나온 것은 Laitman et al.(1977)의 연구와 정확하게 일치한다. 물론, 기존의 연구자들은 본 연구와는 달리 영유아 카데바(cadaver; 해부용 시신)에서 갑상연골(thyroid cartilage)의 경추 대비 높이를 측정하여 보고하였지만, 2세를 전후하여 후두가 하강된다는 결과는 두 연구가 일치하였다. 본 연구에서 X-ray를 사용하여 설골(hyoid bone)을 촬영한 이유는 후두연골의 골화가 매우 서서히 진행되어, X-ray 촬영을 통해서는 영유아의 갑상연골 형태를 정확하게 알 수 없기 때문이었다(Türkmen et al., 2012).
본 연구 결과에서 주목할 만한 사실은 4세 아동의 설골 높이가 3세 아동의 설골 높이보다 오히려 더 높아진 것으로 확인되었다는 것이다. 이와 같은 현상은 4세 아동의 언어발달 특징과 연관이 있을 것으로 사료된다. 4세 아동의 언어발달은 ‘구문-문법적 이해기’를 거치면서 3세 아동에 비해 문장 사용이 양적, 질적으로 매우 많아진다. 뿐만 아니라, 평균발화 길이(mean length of utternace, MLU)도 매우 길어져서 4~8개 낱말로 구성된 문장의 사용이 증가하며, 900~2,000개의 표현어휘를 습득하고, 분당 185개 낱말 정도를 말할 수 있게 된다고 보고하였다(Kim, 2014). 특히, 더듬는 횟수가 줄어들며 90% 정도의 자음 정확도를 획득하고, 자주 나타내던 생략이나 대치와 같은 조음 오류도 많이 줄어들게 된다고 보고하였다. 이와 같은 폭발적인 언어발달을 가져오는 4세 시기가 상대적으로 표현어휘 사용 빈도가 적은 3세에 비해 후두 높이가 오히려 높아지는 것으로 생각되어진다.
또한, 4세 아동 EAM에서 설골까지 거리는 3세 아동 EAM에서 설골까지 거리보다 길었다(표 2). 이는 후두가 위로 상승하면서 전방화(anteriorization) 되었기 때문에 나타난 결과로 해석된다. 이 결과도 3세 아동에 비해 폭발적인 언어사용을 보이는 4세 아동의 언어발달 시기와 관련이 있을 것으로 사료된다.
설골과 혀의 상승은 삼차신경(Trigeminal Nerve, CN Ⅴ)의 지배를 받는 악설골근(mylohyoid muscle)의 수축으로 이루어지고, 설골과 후두의 상승은 설하신경(hypoglossal nerve, CN Ⅻ)의 지배를 받는 이설골근(geniohyoid muscle)과 삼차신경(CN Ⅴ)과 안면신경(facial nerve: CN Ⅶ)의 지배를 받는 이복근(digastric muscle 5,7), 안면신경(CN Ⅶ)의 지배를 받는 경상설골근(stylohyoid muscle)의 수축으로 이루어진다.
설골의 상승은 설하신경(CN Ⅻ)의 지배를 받는 설하근(hyoglossus muscle)과 갑상설골근(thyrohyoid muscle)의 수축으로 이루어진다. 또한 후두의 상승은 부신경(accessory nerve, CN Ⅸ)의 지배를 받는 경상인두근(stylopharyngeus muscle)의 수축으로 이루어지며 혀의 수축은 설하신경(CN Ⅻ)의 지배를 받는 이설근(genioglossus muscle)의 수축으로 이루어진다(Jeong, 2003; Johnson-Root, 2015; Logemann, 1998; Seikel et al., 2013).
4세 아동처럼 후두가 상승하고 전방화 되면 조음자(혀)와 조음점(치조, 경구개, 입술 등)의 거리가 더 가까워지게 된다. 이렇게 조음자와 조음점의 거리가 좀 더 가까워지게 되면 조음이 훨씬 쉽고 빠르게 이루어질 수 있으며, 이로 인해서 조음의 명료도도 상승하고 유창성도 더 잘 획득될 수 있다. 이것은 4세의 폭발적인 언어발달과 연관이 있을 것으로 사료된다. 이러한 후두의 상승과 전방화로 여겨지는 BH의 상승과 EAM에서 BH 거리의 유의미한 증가는 4세 아이들의 언어 발달 특성과도 연관이 있을 것으로 사료된다.
두번째 결과로, 2세와 3세, 그리고 4세 ASD 아동의 설골 높이가 전 연령의 정상 대조군 아동 설골 높이보다 낮게 위치하고 있는 것으로 확인되었다. 또한 ASD 아동의 EAM에서 BH까지의 거리는 연령 간 유의미한 차이가 발견되지 않았다. 이것은 ASD 아동들의 설골 상승 및 전방화가 정상적으로 이루어지지 않았을 가능성을 시사하는 것으로 사료되며, 아마도 ASD 아동들이 겪고 있는 언어발달 지연과 관련이 있는 것으로 사료된다.
후두 높이의 차이는 다양한 주변 근육조직 및 운동 기전에 영향으로 발생한다. Shipp & Izdebski(1975)는 발성을 하게 되면 후두 외근들의 수축작용으로 인해서 후두가 위로 상승하는 동시에 앞쪽으로 이동하게 된다고 보고하였고, 발성 시 후두의 상승은 갑상설골근(thyrohyoid muscle)의 수축 작용과 밀접하게 연관이 되어 있다고 보고한 바 있다(Shipp, 1975). 결과적으로 ASD 아동들의 낮아진 설골 높이는 정상 아동들에 비해 발성 시 적절한 후두 높이를 유지하는데 불리하게 작용할 것으로 사료된다.
특히, 후두의 상승은 음도의 상승과 관련이 있으며, 후두의 하강은 저음 산출에 용이하다고 보고한 바 있다(Shipp, 1975). ASD 아동은 음도 변화가 적은 음성을 사용하며(Kanner, 1943), 이는 ASD 아동의 제한적인 운율 사용을 나타낸다. 본 연구에서도 확인되었듯이 ASD 아동의 후두 높이가 정상 대조군에 비해 낮아져 있으며, 이는 ASD 아동의 제한적인 운율 사용과도 관련성이 있는지 후속 연구를 통해 조사해 볼 필요가 있을 것이라 사료된다.
또한 정상 대조군 아동들의 설골 높이는 2세, 4세, 3세 순으로 높았었던 것과 다르게, ASD 아동들의 설골 높이는 4세가 가장 높았고, 2세와 3세는 같았다. 흥미로운 점은 ASD 아동의 설골 높이도 정상 대조군 아동처럼 3세보다 4세가 더 높았다는 것이다. 물론, 실험에 참가한 ASD 아동의 수가 적어 통계적 유의성은 확인할 수 없었다.
실험 초기에는 연령별 ASD 아동 수가 5명씩 계획되었으나 실험에 대한 거부와 건강 등의 원인으로 인해서 총 8명의 ASD 아동만이 최종적으로 실험에 참가할 수 있었기 때문이다. 참고로, 8명 중 1명(S2)을 제외한 나머지 7명의 참가자 모두 무발화 ASD 아동들이었으며, 다행스럽게도 대부분 발성은 활발한 편이라 실험을 진행할 수 있었다.
이와 같이, ASD 아동의 EAM에서 BH 사이 거리는 정상 대조군 아동과 다르게 연령 간 유의미한 차이가 나타나지 않았다. 이는 후두의 상승과 전방화가 되지 않았다는 것을 의미하는데, 언어발달이 제한되어 있는 ASD 아동의 후두는 연령이 증가함에도 불구하고 상승이나 전방화와 같은 다이나믹한 변화가 일어나지 않는다는 것을 의미한다. 또한 설골 높이가 연령이 증가함에도 불구하고 정상 대조군 아동과 다르게 일정했었던 것과 마찬가지로, EAM에서 BH 사이 거리가 정상 대조군 아동과 다르게 연령 간 유의미한 차이가 나타나지 않았다는 것은 ASD 아동의 언어발달지연을 확인할 수 있는 중요한 지표라고 판단된다. 물론, 실험에 참가한 ASD 아동의 수가 적어 통계적 유의성은 확인할 수 없었다.
특히, 모음 발성 시 음질은 실험 결과에서 보듯이 쉰목소리 정도를 평가하는 대표적 변수인 jitter, shimmer, NHR 값이 정상대조군과 차이가 없는 정상 범주로 나타나 정상대조군과 차이를 보인 조절 변수들(PFR, vFo, vAm)과는 다른 양상을 보인 점도 주목할만한 결과로 보인다.
음향학적 평가 결과, ASD가 정상 아동에 비해 음질유지 능력을 나타내는 변화량 변수(PFR, vFo, vAm)에 조절 문제가 있는 것으로 확인되었는데 최근 선행 연구에서도 같은 결과를 보고한 바 있다. Lee et al.(2020)은 자폐성 정도가 각기 다르며, 언어발달 점수가 다양한 10명의 ASD 아동들과 동일 연령대의 정상 대조군 10명을 대상으로 모음 /a/ 연장 발성 시 음성을 분석하여 비교해 본 결과, 주파수 관련 변수들 중 넓은 구간의 기본주파수 변동률을 측정하는 PFR에서 통계학적으로 유의미한 차이를 발견하였으며, jitter, shimmer와 같은 음질의 중요한 변수들은 모두 정상 대조군과 차이가 없는 것을 확인하였다. 또한, 발성 시 주파수변화량과 진폭변화량 변수인 vFo와 vAm이 정상 아동들에 비해 ASD 아동들이 통계학적으로 유의미하게 높은 것으로 나타났으며, 본 연구와 일치하는 결과를 확인하였다. 이는 ASD 아동의 경우, 모음 발성 시 성대 진동을 포함한 발성에 관여하는 후두 내외근의 안정성을 유지하지 못하고 조절에 실패한 결과로 해석된다.
ASD 아동이 모음 발성 시 PFR, vFo, vAm 값이 정상 아동보다 높다는 것은 발성기관에 대한 조절능력(phonatory control)의 어려움을 나타내는 지표로 사료되며, 이 지표는 이전의 많은 연구들에서도 확인할 수 있었다(Kent et al., 1999; Kent et al., 2000). 특히, Kent et al.(1999)의 연구에서는 다양한 마비말장애 환자들이 보이는 조절능력 부재를 나타내는 지표로 PFR, vFo, vAm을 제시하였으며, 이는 본 연구결과와 일치하는 지표로서, ASD 아동의 뇌신경발달 문제(neurogenic developmental problem)를 간접적으로 시사하는 결과로 해석될 수 있어 향후 이에 대한 검증이 필요할 것으로 사료된다.
본 연구의 제한점으로, ASD 대상자 수가 적어 통계학적인 해석이 어려운 점을 들 수 있다. 실험과정에서 실패율이 매우 높은 대상임을 감안하여 많은 수의 ASD 아동을 실험군에 포함할 필요가 있다. 또한 5세 이후 ASD 아동의 후두 특성도 확인할 필요가 있을 것으로 사료되며, 후속 연구에서는 ASD 아동의 후두 위치 및 발성 능력을 개선시킬 수 있는 치료법에 대한 연구가 필요할 것으로 사료되어 이를 제언한다.