표 1. | Table 1. 어린이 음성 인식 결과 | Children speech recognition results

모델 엘솔루 어린이 데이터셋 음절인식률 (%) ETRI 어린이 데이터셋 음절인식률 (%) 평균 음절 인식률 (%)
LAS 89.49 99.12 93.25
제안된 방법 Basic SEQFORMER 88.53 96.43 91.61
SEQFORMER+ADA 94.50 97.43 95.64
SEQFORMER+MLP 95.34 97.79 96.30
SEQFORMER+ADA+MLP 96.83 98.32 97.41
LAS, listen, attend, and spell; SEQFORMER, sequence-to-transformer; ADA, acoustic data augmentation; MLP, masked linguistic prediction.