1. 서론
말소리장애(Speech Sound Disorders, SSD)는 생략, 대치, 왜곡 등 다양한 조음 오류가 나타나는 장애군으로, 연령에 적합한 정확도에 도달하지 못할 경우 일차적으로 의사소통에 어려움을 초래하며(APA, 2016), 나아가 어휘 습득, 문법 발달, 읽기 능력 등 언어 전반에 부정적인 영향을 미치게 된다(Anthony et al., 2011; Kim et al., 2015; Kim et al., 2020a; Lee, 2022; Lewis et al., 2015; Nathan et al., 2004; Rvachew & Grawburg, 2006). 이로 인해 말소리장애의 조기 평가와 중재는 매우 중요하다.
관련 연구에 따르면, 말소리장애는 전체 의사소통장애의 약 32%에서 80%에 이르는 유병률을 보이며(Bernthal et al., 2012; van Riper & Emerick, 1984), 국내 약 7,100명의 아동을 대상으로 한 대규모 조사에서도 의사소통장애 아동 중 약 44%가 말소리장애에 해당하는 것으로 보고하였다(Kim et al., 2015). 이러한 높은 유병률은 말소리장애가 단일한 진단 범주가 아니라 다양한 이질적 특성을 지닌 하위집단의 집합체일 수 있음을 시사하며, 이에 따른 하위집단 구분의 필요성이 꾸준히 제기되고 있다(Dodd, 2014; Pi & Ha, 2021; Shriberg et al., 2017; Yi & Kim, 2022).
그 중 하나가 언어지체 동반 여부에 따른 구분으로, 여러 연구에서 말소리장애 평가 및 중재 시 언어장애의 동반 가능성을 고려하자고 제안하고 있다(Kim et al., 2015; Ko et al., 2017; Pi & Ha, 2021). 예를 들어, Kim et al.(2015)은 전체 의사소통장애 아동 중 말소리장애로 분류된 44% 가운데 순수 말소리장애는 약 11% 정도이며, 나머지 33%는 기질적 문제나 언어장애를 동반할 수 있다고 설명하였다. 특히 언어지체를 동반한 말소리장애 아동은 학령기에 이르러 언어학습장애나 특정학습장애로 진단될 가능성이 높기 때문에 언어지체의 동반 유무에 따른 구분과 이에 따른 중재 방향 수립의 중요성을 강조하였다(Kim et al., 2015). Ko et al.(2017)은 4–6세 말소리장애 아동 92명을 분석한 결과, 언어문제를 동반한 비율이 57.5%에 이르고, 그 중 수용 및 표현언어지체 동반 아동은 32.4%, 표현언어지체 동반 아동은 21.1%, 수용언어지체 동반 아동은 4.4%, 순수 말소리장애 아동은 42.3%로 나타났다고 보고하였다. 이들 연구는 말소리장애와 언어문제의 동반 가능성을 실증적으로 제시하며, 두 영역 간 내적인 관련성을 강조한다.
이러한 관련성은 다양한 연구에서 반복적으로 지적되고 있다(Bleile, 2002; Lee, 2022; Vuolo & Goffman, 2018). 예를 들어, Lee(2022)는 말소리장애 중증도가 심할수록 어휘 발달에 부정적 영향을 준다고 하였고, Kim et al.(2017)은 말이 늦은 아동이 말언어문제를 함께 동반할 위험이 높다고 보고하였다. 또한 Vuolo & Goffman(2018)은 언어처리부하(language load)에 따른 말운동 변동성(articulatory variability)이 언어능력에 의해 매개됨을 실험적으로 입증함으로써, 언어능력이 말산출에 직접적인 영향을 줄 수 있음을 보여주었다. 이는 언어능력이 낮은 아동일수록 음운 처리 과정에서 더 큰 불안정성과 비효율성을 경험할 수 있음을 시사한다(Vuolo & Goffman, 2018). 따라서 말소리장애 아동을 언어문제 동반 여부에 따라 세분화하고, 이들의 말산출 특성을 비교 분석하는 것은 진단과 중재의 정밀도를 높이기 위한 중요한 전략이라 할 수 있다(Kim et al., 2015; Ko et al., 2017).
임상 현장에서는 아동의 말소리 능력을 다면적으로 이해하기 위해, 산출된 말소리가 목표음운에 얼마나 일치하는지 정확도를 측정하는 음운지표와 말의 속도나 조절능력 등 운동실행 능력을 평가하는 말산출지표를 통해 평가가 이루어지고 있다. 음운기반 지표로는 전통적으로 말소리 산출의 정확도를 중심으로 한 자음정확도(Percentage of Consonants Correct, PCC)와 모음정확도(Percentage of Vowels Correct, PVC) 평가를 중심으로 실시하나(Shriberg et al., 1997) 단어단위 음운평가의 필요성과 중요성도 꾸준히 제안되었다(Ingram, 2002; Park et al., 2011; Park & Yoon, 2016; Yoon, et al., 2013).
이에 2020년 우리말 조음음운평가2(Urimal Test of Articulation and Phonology 2, U-TAP2) 검사가 표준화작업을 마무리하면서 임상에서도 단어단위 음운지표들이 말산출능력을 정밀하게 파악하는 데 중요한 역할을 하고 있다(Kim et al., 2020c). 이러한 지표들은 발화 길이, 단어구조, 변동성 등 복합적인 음운 발달 수준을 파악할 수 있게 해준다(Ha et al., 2019). 그 예로 평균음운길이(Phonological Mean Length of Utterance, PMLU), 단어단위근접률(Proximity Whole Word Proximity, PWP), 단어단위정확률(Proportion of Whole-Word Correctness, PWC) 등이 활용되고 있으며(Ha et al., 2019; Kim et al., 2020b), 이는 아동의 말소리 산출 능력을 보다 정교하게 평가할 수 있도록 한다(Ha et al., 2019; Kim & Ha, 2019; Kim et al., 2020b; Kim et al., 2020c). PMLU는 발화된 단어의 음운적 복잡성과 정확도를 통합적으로 반영하는 지표이고, PWP는 아동의 발화가 목표 단어에 얼마나 근접했는지를 나타내며 PWC는 전체 단어 중 정확하게 산출한 단어의 비율을 의미한다(Ha et al., 2019; Kim et al., 2020b; Yoon et al., 2013). 이러한 지표는 아동의 연령에 따라 발달적인 향상을 보이며, 초기 및 후기 말소리 발달 평가에 민감한 도구로 활용되고 있다(Ha et al., 2019; Kim et al., 2020b).
말산출지표에는 교대운동속도(Alternate Motion Rate, AMR), 일련운동속도(Sequential Motion Rate, SMR), 모음연장발성시간(Maximum Phonation Time, MPT) 등이 있으며, 이를 통해 조음기관의 속도, 협응력, 발성지속력 등을 평가한다(Kim et al., 2018; Yoo, 2018). Kim & Lee(2018)는 뇌성마비 아동이 일반 아동에 비해 유의미하게 낮은 AMR, SMR과 짧은 MPT를 보인다고 하였고, Kim(2019)은 말소리장애 아동이 일반 아동에 비해 낮은 수행력을 보인다고 밝힘으로써 말산출지표의 진단적 유용성을 제시하였다.
이처럼 다양한 음운 및 말산출 지표들이 임상적으로 유용하게 활용되고 있음에도 불구하고, 언어능력 지체 동반 여부에 따른 말소리장애 하위집단 간 차이를 구체적으로 분석한 연구는 매우 제한적이다. 이에 본 연구는 말소리장애 아동을 순수 말소리장애(pure speech sound disorders, Pure SSD), 표현언어지체 동반 말소리장애(speech sound disorders with expressive language disorders, SSD+E), 수용 및 표현언어지체 동반 말소리장애(SSD+RE)의 세 집단으로 분류하여, 이들 간 음운 및 말산출지표의 차이를 분석하고, 하위집단을 효과적으로 구분할 수 있는 핵심 지표를 탐색하고자 하였다. 이를 통해 각 하위집단의 특성을 반영한, 보다 정밀한 중재 전략 수립을 위한 기초자료를 제공하는 데 본 연구의 목적이 있다.
연구에서 설정한 구체적인 연구문제는 다음과 같다.
첫째, 말소리장애 하위집단 간 음운 및 말산출 지표(PMLU, PWP, PWC, AMR, SMR, MPT)에서 차이가 있는가?
둘째, 말소리장애 하위집단을 구분하는 핵심 음운 및 말산출 지표는 무엇인가?
2. 연구방법
본 연구에는 3세에서 6세의 Pure SSD 아동 22명, SSD+E 아동 8명, SSD+RE 아동 18명, 총 48명이 참여하였다. 모든 참여 아동은 부모의 구두동의를 받고 연구에 참여하였다. 선행연구(Kim & Ha, 2019)와 같이 부모보고를 통해 모든 참여아동은 시각 및 청각의 문제가 없고, 인지, 정서문제도 없으며, 신경학적 손상과 관련된 의학적 진단이 없고, 구강 구조와 기능에서의 결함도 없다는 것을 확인하였다. 말소리장애 하위그룹 구분을 위해 선행연구와 같은 기준을 적용하였다(Kim & Ha, 2019). Pure SSD 아동은 수용 · 표현어휘력 검사(Receptive & Expressive Vocabulary Test, REVT, Kim et al., 2009)에서 –1SD 이상에 속하고 취학전 아동의 수용언어 및 표현언어척도(Preschool Receptive & Expressive Language Scale, PRES; Kim et al., 2003)에서 수용 및 표현언어 연령이 생활연령과 1년 이내이며 U-TAP2(Kim et al., 2020c)에서 단어수준 자음정확도가 –2SD이하에 속하는 아동을 대상으로 하였다. SSD+E는 REVT 수용어휘력은 –1SD이상이나 표현어휘력이 –2SD이하에 속하고, PRES 수용언어 연령이 생활연령 1년 이내이나 표현언어 연령이 1년 이상 지체되며 U-TAP2 단어수준 자음정확도가 –2SD에 속하는 아동을 대상으로 하였다. SSD+RE는 REVT 수용 및 표현어휘력이 모두 –2SD이하에 속하고, PRES 수용 및 표현언어 연령이 1년 이상 지체되며 U-TAP2 단어수준 자음정확도가 –2SD에 속하는 아동을 대상으로 하였다.
표 1에 말소리장애 하위집단별 평균 연령, 남:여 성비, 개정자음정확도(percentage of consonants correct-revised, PCC-R), 수용 및 표현어휘력 원점수, 수용 및 표현언어능력 등가연령을 제시하였다. 참여 아동의 평균 연령과 성별에서 집단 간 유의미한 차이가 없었으나(p>.05) 수용 및 표현어휘력과 수용 및 표현언어능력에서 집단 간 유의한 차이가 있었다(all p<.01).
본 연구는 말산출과제(MPT, AMR, SMR), U-TAP2(Kim et al., 2020c), REVT(Kim et al., 2009), PRES(Kim et al., 2003) 검사 순으로 진행하였다. 평가는 아동이 재원 중인 기관이나 거주하는 가정의 조용한 공간에서 1:1로 실시하였다.
말산출 평가는 MPT, AMR, SMR 순으로 진행하였고, 선행연구(Kim & Kim, 2016; Kim et al., 2018)와 같이 연구자가 1–2회 정도 시범을 보여준 후 MPT는 총 3회, AMR과 SMR은 총 2회 측정하였다. MPT 과제를 실시하기 전에 아동에게 “나는 유치원/어린이집 OOO입니다,” 라고 소개를 한 다음 숨을 최대한 길게 들이마시고, 말할 때 처럼 편안한 소리로 /아/를 최대한 길게 발성하도록 하였다(Kim & Kim, 2016; Kim et al., 2018). AMR은 /퍼/, /터/, /커/를, SMR은/퍼터커/를 5초 동안 빠르고, 정확하게 반복하도록 지시하였다. 연구자는 발화 시작 시점에 ‘시작’, 종료 시점에 ‘그만’이라는 구두지시를 제공하여 5초간의 산출을 일관되게 설정하였다. 그 다음으로 U-TAP2는 30개 단어를 평가하였다. 그림과제를 보여주고, 이름을 말하도록 하였고, 오반응 하거나 모른다고 대답한 경우 연구자를 따라 말하도록 하였다. MPT, AMR, SMR, U-TAP2 등 모든 음성산출 과제는 SONY ICD-UX512F(SONY, Tokyo, Japan) 녹음기를 사용하여 녹음하였다.
REVT 수용어휘력 평가는 주어진 4개 그림 가운데 목표어휘에 해당하는 그림을 선택하도록 하였고, 표현어휘력은 제시하는 목표어휘의 이름을 말하도록 하였다. PRES는 수용언어검사를 먼저 한 후 표현언어 검사를 실시하였다. 부모보고가 필요한 경우 보호자에게 질문하여 반응을 기록하였다. 참여 아동은 모든 과제를 수행 완료하였고, 총 평가시간은 50분–1시간 20분 정도 소요되었다.
음운지표(PMLU, PWP, PWC) 분석은 아동의 발화를 U-TAP2 우리말조음음운검사2 분석프로그램 엑셀파일에 입력하여 자동 계산된 값을 사용하였다. PMLU는 아동이 산출한 단어에서 산출된 음소 수+정확히 산출된 음소 수를 합산한 점수이다. 예를 들어 ‘바나나’를 ‘다나’로 발음했다면 산출한 음소 수(4)+ 정확하게 산출한 음소 수(3)=7로 계산된다. PWP는 아동이 산출한 단어의 PMLU를 목표 단어의 최대 PMLU로 나눈 비율이다. 예를 들어 바나나의 정확한 PMLU는 12이므로 PWP는 0.583(7/12)으로 목표단어에 절반 이상 근접한 것으로 볼 수 있다. PWC는 아동이 제시된 단어 중 전체를 정확히 산출한 단어의 수로 나눈 값으로 측정한다. 현 예시에서 PWC는 0(0/1)이므로 목표단어 전체를 정확하게 산출하지 않았다는 것을 의미한다.
말산출지표는 Praat(version 6.4.34)을 사용하여 분석하였다. 녹음된 음성파일을 Praat에 불러온 후, View & Edit 창을 통해 파형을 시각적으로 분석하였다. MPT는 음성 파형의 시작점과 종료점을 설정한 후 해당 구간의 지속 시간(초)을 소수점 둘째자리까지 측정하였다. AMR 및 SMR의 경우, 5초 동안 반복된 음절의 개수를 세어 초당 음절 수(syllables per second, SPS)로 산출하였다. 예를 들어, /퍼/를 5초 동안 10회 반복했다면 AMR(/퍼/)은 2.0SPS로 기록하였다. 만약 파형 상에서 음절이 서로 겹치거나 구분이 불명확한 경우에는 1회 산출로 분석하지 않았으며, 명확히 분리된 음절만을 계수하였다.
자료분석을 위해 MPT는 3회 중 최대 측정치를, AMR과 SMR은 2회 수행한 평균값을 사용하였다(Kim & Kim, 2016; Kim et al., 2018).언어능력은 REVT는 원점수를, PRES 검사는 등가연령을 사용하였다(Kim & Ha, 2019).
U-TAP2의 단어 전사 신뢰도 분석을 위해 전체 자료 중 약 10%에 해당하는 5명의 녹음된 말소리 샘플을 말소리장애 치료 경력 13년의 1급 언어재활사가 평가하였다. 두 전사자간 일치한 단어의 비율로 신뢰도분석을 실시한 결과, 96.67%였다. 일치하지 않는 단어인 경우 반복 청취를 통해 전사자 간 최종 합의를 거친 단어를 분석에 포함하였다.
말소리장애 하위그룹 간 음운 및 말산출 능력의 차이를 분석하기 위해 각 변수에 대한 정규성 검정 및 등분산성 검정을 실시한 결과, 대부분의 변수에서 정규성 가정(Shapiro-Wilk test, W=0.88, p<0.05) 및 등분산성 가정(Levene’s test, p<0.05)이 충족되지 않았다. 또한, 집단 간 표본 크기 불균형(Pure SSD=22, SSD+E=8, SSD+RE=18)을 고려하여, 비모수적 다변량 분석인 PERMANOVA(Permutational Multivariate Analysis of Variance)로 분석하였다.
말소리장애 하위집단 간 예측요인을 탐색하고 분류 성능을 검증하기 위하여 균형 랜덤포레스트(Balanced Random Forest, BRF) 알고리즘을 활용하였고, 데이터 전처리, 특징 추출 및 클래스 균형화, 모델 학습 및 검증, 성능평가를 실시하여 변수중요도를 추출하였다.
데이터 전처리는 전체 48명의 아동 데이터를 대상으로 하였다. 종속변수는 세 개의 집단(Pure SSD, SSD+E, SSD+RE)으로 구성된 집단 구분 변수였으며, 독립변수는 6개의 음운 및 말산출 지표(PMLU, PWP, PWC, MPT, AMR, SMR)였다. 모든 연속형 독립변수는 예측 편향을 방지하기 위해 Z점수로 표준화하였다.
특징 추출 및 클래스 균형화 과정에서는 집단 간 표본 수 차이로 인한 예측 편향을 완화하기 위하여 BRF 알고리즘의 클래스 균형 샘플링 전략을 적용하였다. BRF는 각 결정트리 학습 시 다수 집단에서 소수 집단과 동일한 수의 사례를 무작위로 추출하여 데이터 불균형의 영향을 최소화한다(Breiman, 2001; Chen et al., 2004). 이러한 방식은 소수 집단의 사례가 충분히 반영되어 예측에 기여하도록 하며, 상대적으로 소규모의 자료에서도 안정적인 분류 성능을 보인다는 점에서 유용하고(Raschka, 2018), 표본 수가 제한적인 집단에서도 비교적 신뢰도 높은 분류 결과와 변수 중요도 추정을 가능하게 한다(Chen et al., 2004). 따라서 본 연구에서 SSD+E 집단의 사례 수가 상대적으로 적었음에도 불구하고, 분석 결과는 집단 특성을 반영하는 의미 있는 정보를 제공할 수 있다.
모델 학습 및 검증은 전체 데이터셋에 대해 10겹 교차검증(stratified 10-fold cross-validation)을 실시하여 모델의 일반화 성능을 평가하였고, 총 500개의 결정트리(n=500)를 구성하여 각 트리가 독립적으로 학습되었으며, 최종 예측은 다수결 투표(majority voting) 방식으로 이루어졌다(Breiman, 2001; Raschka, 2018). 모델의 분류 성능 평가를 위해 정확도(accuracy), 정밀도(precision), 재현율(recall), F1-score, 그리고 ROC AUC 지표를 통해 검증하였다(Chen et al., 2004). 분석 결과는 불균형 데이터 상황에서도 소수 집단의 분류 성능을 안정적으로 확보할 수 있었음을 보여주었다. 통계분석은 R(version 4.5.1) 환경에서 vegan, randomForest, ranger, caret 패키지를 사용하였다.
3. 연구결과
말소리장애 하위집단 별 음운 및 말산출지표값은 표 2에 제시하였다. PMLU의 평균은 Pure SSD 그룹이 7.83(±0.72)으로 가장 높았으며, SSD+E 그룹이 7.76(±0.44), SSD+RE 그룹이 7.23(±1.22) 순이었다. PWP의 평균은 SSD+E 그룹이 0.90(±0.05)으로 가장 높았고, 그 다음은 Pure SSD 그룹 0.89(±0.13), SSD+RE 그룹 0.84(±0.14)였다. PWC의 평균은 Pure SSD 그룹이 0.59(±0.28)로 가장 높았으며, SSD+E 그룹 0.52(±0.23), SSD+RE 그룹은 0.44(±0.28) 순이었다. PMLU와 PWC는 Pure SSD > SSD+E > SSD+RE 순이었으며, PWP는 SSD+E > Pure SSD > SSD+RE 순으로 나타났다.
Pure SSD, pure speech sound disorders; SSD+E, speech sound disorders with expressive language disorders; SSD+RE, speech sound disorders with receptive and expressive language disorders; PMLU, phonological mean length of utterance; PWP, proximity whole word proximity; PWC, proportion of whole-word correctness; AMR, alternate motion rate; SMR, sequential motion rate; MPT, maximum phonation time; SPS, syllables per second; s, second.
말산출지표인 AMR의 평균은 SSD+RE 그룹이 3.26(±1.47)회로 가장 높았으며, Pure SSD 그룹이 3.05(±1.37)회, SSD+E 그룹이 2.38(±0.87)회 순이었다. SMR은 Pure SSD 그룹이 1.39(±0.65)회로 가장 높았고, SSD+RE 그룹이 1.11(±0.32)회, SSD+E 그룹이 0.98(±0.78)회 순이었다. MPT는 SSD+RE 그룹이 5.50(±2.75)초로 가장 길었으며, Pure SSD 그룹이 4.65(±2.67)초, SSD+E 그룹이 3.92(±1.84)초 순으로 나타났다. AMR과 MPT는 SSD+RE > Pure SSD > SSD+E, SMR은 Pure SSD > SSD+RE > SSD+E 순이었으며, 세 지표 모두에서 SSD+E 그룹의 수행이 가장 낮았다.
PERMANOVA 분석 결과, 집단 간 전체 음운 및 말산출 특성에서 통계적으로 유의한 다변량 차이는 없는 것으로 나타났다[adonis2: F(2,45)=1.52, R2=0.107, p>.05].
집단 구분 예측 변수 탐색을 위한 균형 랜덤 포레스트 분류 분석을 실시한 결과, 정밀도(precision) 0.59, 재현율(recall) 0.64, F1 점수(F1-score) 0.60, 정확도(accuracy) 0.62, ROC-AUC 0.72 수준의 분류 성능을 보였다.
변수 중요도(Feature Importance)에서 가장 높은 예측 변수는 PMLU(0.179)였고, 그 다음으로 SMR(0.169), PWC(0.166), AMR(0.148), MPT(0.129), PWP(0.122) 순으로 예측 기여도를 나타내었다. PMLU와 SMR, PWC 변수가 집단 예측에 큰 기여를 하였으며, 뒤이어 AMR, MPT, PWP 순으로 나타났다(그림 1).
4. 논의 및 결론
본 연구는 언어지체 동반 여부에 따라 말소리장애 아동을 세 하위집단(Pure SSD, SSD+E, SSD+RE)으로 구분하고, 이들 간 음운 및 말산출 지표의 차이를 분석하였으며, 각 집단을 구분하는 핵심 예측 변인을 탐색하고자 하였다. 연구 결과를 토대로 다음과 같이 논의 하였다.
첫째, 음운 및 말산출 지표에 대한 다변량 분석에서는 세 집단 간 유의한 차이가 나타나지 않았다. 이는 특정 단일 지표만으로 집단 간 차이를 명확히 설명하기보다 음운의 복잡성이나 말운동 실행 능력 등 다양한 요인이 상호작용함으로써 각 집단의 특성이 구성된다는 점을 시사한다. 다시 말해, 말소리장애 아동의 말 특성은 단편적인 지표 하나로 설명하기 어려우며, 보다 통합적이고 다차원적인 평가 접근이 요구된다는 것이다(Storkel & Morrisette, 2002).
이러한 결과는 기존 연구에서 제기된 말소리장애의 이질성과 복합성을 뒷받침하며(Pi & Ha, 2021; Yi & Kim, 2022), 임상에서는 단일 정확도 수치에 의존하기보다는 여러 지표 간의 상호관계를 고려하는 정밀 평가체계를 적용할 필요가 있다는 것을 시사한다. 예를 들어, PMLU와 SMR, PWC는 음운 복잡성과 말운동 조절 능력을 반영하는 지표로, 이들의 통합 해석은 아동의 말산출 특성을 보다 정교하게 파악하는 데 도움이 될 것이다.
중재 전략 역시 이 같은 복합적 특성을 반영하여 설계되어야 할 것이다. 특히 표현언어지체(SSD+E) 아동의 경우, 단순한 조음 오류 수정에 그치지 않고, 말운동의 기획 및 실행 능력을 향상시키기 위한 접근이 병행되어야 할 것으로 사료된다. 이때 AMR, SMR과 같은 운동기반 지표는 중재 효과를 측정하는 데 유용한 자료로 활용될 수 있을 것이다. 이는 말소리장애 아동의 이질적 특성을 고려한 정밀한 중재 계획의 근거가 될 수 있을 것으로 생각된다(Dodd, 2014; Shriberg et al., 2017; Pi & Ha, 2021; Yi & Kim, 2022).
한 가지 흥미로운 점은 SSD+E 집단이 다른 집단에 비해 말산출 지표에서 일관되게 낮은 평균값을 보였다는 사실이다. 이는 해당 집단의 경우, 말운동 조절력, 발성 지속성, 호흡-발성 간 협응 등 전반적인 운동 실행 능력의 저하가 동반되고 있음을 시사한다. AMR과 SMR은 구강-조음계의 협응성과 말운동 조절 능력을 반영하는 지표로서(Kim, 2019; Kim & Lee, 2018) SSD+E 집단의 저조한 수치는 말운동 계획의 불안정성과 실행의 비효율성을 나타낸다고 볼 수 있다. 또한 MPT의 저하는 호흡과 발성 간 협응체계의 미성숙을 의미하며, 물리적 발화 지속성의 어려움으로 연결된다.
한편 SSD+RE 집단 역시 표현언어지체를 동반하고 있음에도 SSD+E 집단에 비해 말산출 수행력은 더 높은 평균값을 나타내었다. 이러한 차이는 언어처리 경로의 기능적 차이에 기인할 수 있을 것으로 보여 진다(Vuolo & Goffman, 2018). SSD+RE 아동은 수용 언어에서부터 어려움을 보이며, 이로 인해 표현언어도 제한되나, 말산출의 물리적 실행 자체는 비교적 보존되는 경향이 있다(Paul & Norbury, 2012). 반면 SSD+E 아동은 수용 능력은 상대적으로 유지되나, 발화 기획 및 운동 실행 과정에서의 지연이나 비효율이 나타날 수 있으며(McNeill et al., 2009), 이는 AMR, SMR, MPT의 저하로 이어지게 된다. 이 같은 차이는 언어-운동 통합 경로의 비효율성(Duffy, 2013; Kent, 2000)에 근거하여 설명될 수 있으며, 표현언어지체 아동의 경우 구어운동 조직화, 호흡 및 발성 협응이 취약하다는 점을 시사한다(McNeill et al., 2009).
이에 따라 중재 접근도 달리 적용할 필요가 있을 것으로 보인다. 즉 SSD+RE 아동에게는 어휘나 문장 이해를 중심으로 한 언어 기반 접근이 필요하고, SSD+E 아동에게는 구어운동 기반의 반복훈련과 호흡조절 및 연장 과제를 병행한 중재 전략이 보다 효과적일 수 있을 것이다(Maas et al., 2008; Mccauley & Strand, 2008).
균형 랜덤 포레스트 분석 결과, 집단 구분에 기여하는 주요 예측변수는 PMLU, SMR, PWC, AMR 순으로 나타났다. 이 중 PMLU는 음운적 복잡성과 정확성을 동시에 반영하는 지표로(Ha et al., 2019; Ingram, 2002), 세 집단 간 차이를 가장 잘 설명하는 핵심 변수였다. 본 연구 참여아동의 PMLU 평균은 7.23–7.83으로 선행연구(Ha et al., 2019)에서 보고된 2세 후반부터 3세 초반의 평균값(7.31–7.64)과 유사하였다. 그러나 본 연구 참여아동의 평균 연령대가 4세 후반–5세 초반임을 감안할 때 동일 연령대 평균(8.23–8.44)에 비해서는 낮은 수치에 해당된다(Ha et al., 2019). 이는 해당 아동들이 조음 복잡성 처리에서 발달적 결함을 보이고 있음을 반영하며 중재 시 음운 구조의 복잡성을 반영하여 난이도를 조절하면서 점진적 확장을 유도할 필요가 있음을 시사한다(Combiths et al., 2022).
PWC는 단어 전체의 정확한 산출 여부를 평가하는 지표로, PCC-R보다 더 엄격한 기준이 적용되는 수치이다. 본 연구에서의 PWC 평균은 0.44–0.59로 역시 선행연구(Ha et al., 2019)의 2세 후반에서 3세 초반 아동(0.46–0.54)과 유사하며 본 연구 참여아동은 동일 연령대 평균값(0.80–0.91)에 비해 현저히 낮은 수준에 해당된다(Ha et al., 2019). 이처럼 PWC 수치가 낮은 경우, 전체 단어 구조를 통합적으로 조직하거나 유지하는 데 어려움이 있음을 시사하며 중재 과정에서 단어 전체를 모방하는 과제나 단어 구조의 보존을 강조할 필요가 있을 것으로 사료된다.
PMLU와 PWC는 서로 다른 측정 수치이지만 두 지표를 통합한 접근은 말소리장애 아동의 발화 특성을 보다 입체적으로 이해하고 중재할 수 있는 이점을 제공해 줄 수 있을 것이다. 따라서 중재 설계 시 정확성과 복잡성을 통합한 목표를 설정하는 것이 도움이 될 것으로 생각된다.
SMR과 AMR은 각각 말운동의 협응과 반복을 통해 정확성과 속도를 측정하는 지표로서, SSD+E 집단과 같이 말운동 실행에 어려움을 보이는 아동을 변별하는 데 민감하게 작용하였다. 본 연구 참여아동의 AMR은 2.38–3.26이었고, SMR은 0.98–1.38로 선행연구에서 제시한 4–5세 일반아동 연령 기준을 참고하면 AMR(3.78-4.09)과 SMR(1.29–1.43)에서 모두 상대적으로 낮은 수행을 보인 것으로 말소리장애아동과 일반아동을 구분하는 선별자료로 유용함을 보여준다(Km et al., 2018). 이에 SMR과 AMR 두 지표에서 낮은 수치를 보이는 아동에게는 운동기반의 순차적 조음 연습을 병행한 접근이 필요할 것으로 사료된다.
본 연구의 결과는 말소리장애 아동의 하위집단을 평가하고 중재할 때 음운 및 말산출 능력을 반영하는 다차원적 통합 지표를 사용하고, 중재의 세부 전략 설정에도 적극적으로 활용해야 함을 시사한다.
본 연구의 제한점과 후속 연구를 위한 제언은 다음과 같다.
첫째, 본 연구는 특정 집단을 대상으로 한 제한된 표본을 사용하였으므로, 결과는 현상의 기술과 해석에는 기여할 수 있으나 일반화에는 한계가 있다. 특히 SSD+E 집단의 사례 수가 상대적으로 적어 통계적 검정력의 제약이 있었으며, 이로 인해 실제 집단 간 차이가 존재하더라도 통계적으로 유의하게 나타나지 않았을 가능성을 배제하기 어렵다. 따라서 향후 연구에서는 보다 충분한 표본 수와 다양한 조건을 확보하여 분석의 신뢰도와 외적 타당도를 높일 필요가 있다.
둘째, 수용언어만 지체된 아동은 본 연구 대상에 포함되지 않았다. 선행연구(Kim et al., 2015)에서도 수용언어 단독 지체 아동은 비교적 낮은 비율로 보고되었으며, 본 연구의 48명 대상자 가운데에서도 해당 사례는 관찰되지 않았다. 그러나 수용언어지체 아동의 특성은 표현언어지체나 복합 언어지체 아동과는 구분되는 양상을 보일 수 있으므로, 향후 연구에서는 수용언어지체 아동을 포함한 비교 분석이 필요하다.
셋째, 참여 인원이 적은 특성을 고려하여 균형 랜덤 포레스트분석을 활용하였다. 이는 예측 변수 탐색에는 유용하나, 다양한 모형 간 비교나 변수의 선형성 확인에는 한계가 있다. 후속 연구에서는 보다 대규모의 데이터를 기반으로 한 판별분석(discriminant analysis)이나 다항 로지스틱 회귀모형(multinomial logistic regression) 등 다양한 통계적 분석기법을 병행함으로써 예측 변수의 타당성과 설명력을 보다 정밀하게 검증할 필요가 있다.






