A quantitative study on the minimal pair of Korean phonemes: Focused on syllable-initial consonants

Jung, Jieun

doi:10.13064/KSSS.2019.11.1.029

Phonetics Speech Sci. 2019; 11(1):29-40

pISSN: 2005-8063, eISSN: 2586-5854

DOI: https://doi.org/10.13064/KSSS.2019.11.1.029

Phonetics

한국어 음소 최소대립쌍의 계량언어학적 연구: 초성 자음을 중심으로

정지은 ¹ ^, ^*

A quantitative study on the minimal pair of Korean phonemes: Focused on syllable-initial consonants

Jieun Jung ¹ ^, ^*

Author Information & Copyright ▼

¹한국외국어대학교 국어국문학과

¹Department of Korean Language and Literature, Hankuk University of Foreign Studies, Seoul, Korea

^*Corresponding author : jieunkjung@gmail.com

© Copyright 2019 Korean Society of Speech Sciences. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: Feb 02, 2019; Revised: Mar 16, 2019; Accepted: Mar 18, 2019

Published Online: Mar 31, 2019

국문초록

이 연구의 목적은 한국어 음소의 최소대립쌍 출현 양상에 대해 계량언어학적으로 알아보는 것이다. 최소대립쌍은 한 언어에서 음소의 체계를 세우는 데 중요한 역할을 하고, 기능부담량의 측정에도 중요한 척도가 됨에도 불구하고 아직까지 한국어 음소의 최소대립쌍에 대한 전면적인 연구가 이루어지지 않았다. 이를 위해 『우리말샘』의 표제어 325,715개의 발음을 대상으로 초성 위치에서의 자음 최소대립쌍의 개수를 절대수치와 상대수치로 산출하고, 최소대립쌍을 이루는 두 단어의 품사 관계에 대해서 분석했다. 『우리말샘』을 연구의 대상으로 삼은 이유는 최소대립쌍 분석은 기본적으로 사전을 통해서 이루어져야 한다고 판단했고, 한국어 사전 중 규모가 가장 크기 때문이다. 연구 결과는 다음과 같다. 첫째, 최소대립쌍은 총 153가지, 337,135개였다. 개수가 많은 음소 쌍(/ㅅ-ㅈ/, /ㄱ-ㅅ/, /ㄱ-ㅈ/, /ㄱ-ㅂ/, /ㄱ-ㅎ/)은 평음의 비중이 높고, 개수가 적은 음소 쌍(/ㅃ-ㅋ/, /ㄹ-ㅃ/, /ㅉ-ㅋ/, /ㄸ-ㅋ/, /ㅆ-ㅋ/)은 경음의 비중이 높았다. 최소대립쌍 형성에 많은 역할을 담당하는 음소를 개별 음소 단위에서 살펴보면 /ㄱ, ㅅ, ㅈ, ㅂ, ㅊ/ 순으로 높게 나타났는데, 경구개음의 비율이 높게 나타난 것이 특징적이었다. 삼지적 상관속을 이루는 장애음의 최소대립쌍 관계에도 조음 위치와 조음 방법에 따라 차이가 나타났다. 최소대립쌍의 절대수치와 상대수치의 상관계수는 0.937로 높은 상관관계를 보였다. 둘째, 최소대립쌍을 이루는 두 단어의 품사는 ‘명사-명사’의 최소대립쌍이 70.25%로 가장 많았고, 그다음으로 ‘동사-동사’ 쌍이 14.77%로 나타나 이 두 유형이 전체 85% 이상을 차지했다. 초성 최소대립쌍의 품사 일치율은 87.91%로 나타나 최소대립쌍은 의미 형태적으로도 비슷한 범주로 묶일 수 있음을 확인할 수 있었다. 이 연구의 결과는 한국어 음소와 관련된 기초 자료로서 국어학, 언어 병리학, 언어 교육, 언어 습득, 음성 공학 등의 다양한 응용 분야에서 유용하게 활용될 수 있을 것이다.

Abstract

The paper investigates the minimal pair of Korean phonemes quantitatively. To achieve this goal, I calculated the number of consonant minimal pairs in the syllable-initial position as both raw counts and relative counts, and analyzed the part of speech relations of the two words in the minimal pair. 『Urimalsaem』 was chosen as the object of this study because it was judged that the minimal pair analysis should be done through a dictionary and it is the largest among Korean dictionaries. The results of the study are summarized as follows. First, there were 153 types of minimal pairs out of 337,135 examples. The ranking of phoneme pairs from highest to lowest was ‘ㅅ-ㅈ, ㄱ-ㅅ, ㄱ-ㅈ, ㄱ-ㅂ, ㄱ-ㅎ, ..., ㅆ-ㅋ, ㄸ-ㅋ, ㅉ-ㅋ, ㄹ-ㅃ, ㅃ-ㅋ’. The phonemes that played a major role in the formation of the minimal pair were /ㄱ, ㅅ, ㅈ, ㅂ, ㅊ/, in that order, which showed a high proportion of palatals. The correlation between the raw count of minimal pairs and the relative count of minimal pairs was found to be quite high r=0.937. Second, 87.91% of the minimal pairs shared the part of speech (same syntactic category). The most frequently observed type has been ‘noun-noun’ pair (70.25%), and ‘vowel-vowel’ pair (14.77%) was the next ranking. It can be indicated that the minimal pair could be grouped into similar categories in terms of semantics. The results of this study can be useful for various research in Korean linguistics, speech-language pathology, language education, language acquisition, speech synthesis, and artificial intelligence-machine learning as basic data related to Korean phonemes.

Keywords: 최소대립쌍; 사전; 발음; 초성; 자음; 품사; 기능부담량

Keywords: minimal pair; dictionary; syllable-initial; consonant; part of speech; functional load

1. 서론

이 연구의 목적은 한국어 음소의 최소대립쌍 출현 양상에 대해 계량언어학적으로 알아보는 것이다. 최소대립쌍(minimal pair)¹은 현대 음운론 연구에서 가장 기본적인 개념 중 하나로, 동일한 위치에 놓인 하나의 소리만 다르고 나머지 소리는 모두 같은데도 불구하고 서로 구별되는 두 개의 단어를 묶어 최소대립쌍이라고 부른다(Lee, 2010:119). 최소대립쌍은 한 언어에서 음소의 체계를 세우는 데 중요한 역할을 하고, 기능부담량(functional load)²의 측정에도 중요한 척도가 됨에도 불구하고 아직까지 한국어 음소의 최소대립쌍에 대해 전면적이고 다각적으로 살핀 연구는 찾아보기 어렵다. 최소대립쌍의 분석은 기본적으로 사전을 통해서 이루어져야 한다(Jin, 1996:169; Kim & Kang, 1997:6; Kim et al., 2014:118; Lee et al., 1987:120). 하지만 사전의 분석은 방대한 작업이기 때문에 현실적인 어려움으로 인해 연구가 이루어지기 쉽지 않았다.

한국어 음소의 최소대립쌍을 분석한 종합적인 연구는 없지만 부분적으로 살펴본 논의로는 Jin(1996), Kim et al.(2014), Lee et al.(1987) 이 있다³. Lee et al.(1987)은 한국정신문화연구원에서 간행한 『한국어표준발음사전』에 등재된 92,691개 표제어의 발음을 대상으로 음소 및 음소열의 출현 빈도, 최소대립쌍을 분석했다. 이 연구는 최초로 한국어 음소의 최소대립쌍에 대한 분석을 시도한 점에서는 의의가 있으나 ‘아람’과 ‘사람’의 관계도 최소대립쌍으로 인정한 것에서 볼 수 있듯이 공백소와 음소도 하나의 쌍으로 보고 분석한 것, 최소대립쌍의 개수 결과에 대한 해석 없이 결과만 평면적으로 나열한 것이 한계라고 할 수 있다. Jin(1996)은 한국방송공사가 펴낸 『한국어발음대사전』의 65,291개 표제어의 발음을 대상으로 모음 최소대립쌍의 수를 세어 모음과 모음 간에 나타나는 대립의 정도를 통해 기능부담량을 밝히고, /ㅔ/와 /ㅐ/ 모음이 합류되는 것을 기능부담량의 관점에서 살폈다. 이 연구는 음운 변화의 양상을 최소대립쌍과 기능부담량의 관점에서 해석하고자 한 점에서는 의의가 있으나 이러한 연구 목적과 관련된 특정 음소의 대립쌍만을 분석하여 전반적인 모음 대립의 양상을 확인할 수 없다는 것이 한계라고 할 수 있다. Kim et al.(2014)은 음성학 관련 연구자를 위하여 최소대립쌍 검색 도구를 개발하여 제안한 연구이다. 이 연구에서 제안한 도구를 사용하면 Shin(2010)의 발음사전(『연세한국어사전』)에 수록된 표제어 47,401개에 대한 최소대립쌍 검색이 가능하다고 했다. 이 검색 도구는 단어와 음소 검색뿐만 아니라 어종, 품사에 대한 세부적인 검색도 가능하다고 했지만 실제로 찾아서 사용할 수가 없어서 그 효율성은 확인이 불가능했다.

이상의 선행 연구에서 확인할 수 있듯이 방대한 사전 자료를 중심으로 한국어 음소의 최소대립쌍을 계량적으로 분석한 사례가 거의 없다고 볼 수 있다. 따라서 이 연구에서는 『우리말샘』의 표제어를 대상으로 초성 위치 자음의 최소대립쌍과 관련된 정보를 계량적으로 추출해 보고자 한다.

최소대립쌍의 개수는 절대수치와 상대수치로 측정할 수 있고, 상대수치는 두 가지 방법으로 계산이 가능하다. 첫 번째 방법은 최소대립쌍의 절대수치를 전체 단어의 수로 나누는 것이고, 두 번째 방법은 최소대립쌍의 절대수치를 최소대립쌍을 이루는 두 음소를 포함하는 단어의 개수로 나누는 것이다. 코퍼스 내에서 빈도가 낮은 음소는 최소대립쌍의 개수도 적을 가능성이 높다. 그러나 두 번째 방법으로 산출한 상대수치는 음소의 빈도까지 고려하여 상대적인 비교가 가능하다는 이점이 있다⁴. 따라서 본 연구에서는 최소대립쌍의 개수를 절대수치와 두 번째 방법의 상대수치로 산출하고 그 두 수치 간의 상관관계도 살펴보겠다.

Kim et al.(2014:120)은 최소대립쌍은 동일 위치에 놓인 하나의 음소만 다르고 나머지 음소는 모두 같기 때문에 두 단어는 인지적으로 비슷한 범주로 묶일 가능성이 높고, 따라서 동일한 품사 내에 최소대립쌍이 존재할 가능성이 품사 범주를 넘어서 존재할 가능성보다 더 높다고 했다. Brown(1988, 1991), Catford (1987), Derwing & Munro(2015), Levies & Cortes(2008)Munro & Derwing(2006) 등은 영어 발음 교육의 우선순위를 매길 때 최소대립쌍의 개수가 중요한 기준이 된다고 했다. 예를 들어 /e/-/æ/나 /p/-/b/의 경우 만들 수 있는 최소대립쌍의 개수가 많고 사용 빈도가 높기 때문에 우선적으로 교육해야 하고, 반대로 /u:/-/ʊ/나 /ʃ/-/ʒ/와 같은 음소 쌍은 사용 빈도도 낮을 뿐만 아니라 원어민도 혼용해서 쓰는 경우가 있기 때문에 발음 교육에서 크게 중요하지 않다고 주장했다. 그리고 최소대립쌍을 이루는 두 단어의 품사가 같으면 기능부담량이 높고 다르면 기능부담량이 낮기 때문에 최소대립쌍을 기준으로 기능부담량을 설정하고 발음 교육에 적용할 때는 품사와의 관련성도 고려해야 한다고 했다⁵. 따라서 본 연구에서는 최소대립쌍과 품사와의 관계도 살펴보겠다.

최소대립쌍 관련 정보를 다양한 측면에서 분석하는 것은 한국어 음소 체계의 특성을 밝히는 데 중요한 단서가 될 수 있을 것이고, 한국어학뿐만 아니라 한국어 교육학, 언어 병리학, 음성 공학 분야에서 활용할 수 있는 기초 자료로 제공될 수 있을 것이다. 이에 이 연구에서는 다음과 같은 연구 문제를 중심으로 살펴보고자 한다.

① 음소 쌍별로 최소대립쌍의 절대/상대수치는 어떠한가?
② 최소대립쌍을 이루는 두 단어의 품사 정보는 어떠한가?

2. 연구 방법

이 연구의 분석 대상이 된 사전은 『우리말샘』 이었다. 이 사전을 분석의 바탕 자료로 삼은 이유는 이 사전이 첫째, 어휘의 규모가 역대 최대인 사전이고, 둘째, 표제어의 표준 발음의 표기가 확대된 사전이며, 셋째, 저작권이 개방된 사전이기 때문이다⁶.

『우리말샘』의 표제어 수는 약 1,000,000여 개였는데 표제어 중 잘못된 형태, 지역어(방언), 북한어, 옛말, 자모형을 걸러낸 후, 품사 정보와 원어 정보가 없는 표제어도 제외했다. 품사가 두 개 이상인 표제어는 두 개의 표제어로 분리하고, 발음이 두 개 이상인 표제어는 표제어별로 한 개씩의 대표 발음을 정했다. 이러한 자료 구성 원칙에 따라 선정된 표제어의 수는 총 458,365개였다⁷. 각 표제어별로 발음, 품사, 원어 정보를 부여한 후 이 네 정보가 모두 같은 동음이의어는 하나만 남겼다⁸. 이런 작업을 거쳐 발음사전을 완성했고 총 325,717개였다. 완성된 자료는 Python(파이썬)으로 분석 프로그램을 설계하여 최소대립쌍의 개수를 분석했다.

표 1은 최소대립쌍 분석을 위해 구축한 발음 사전의 예이다.

표 1. | Table 1. 발음 사전의 예시 | Example of pronunciation dictionary

ID	표제어	발음형	음절형	음소형	품사	원어
000001	가방	가방	가_두방_말	ㄱ_초ㅏ_중J_종 ㅂ_초ㅏ_중O_종	명사	고유어
000002	가방	가방	가_두방_말	ㄱ_초ㅏ_중J_종 ㅂ_초ㅏ_중O_종	명사	한자어
000003	가오리	가오리	가_두오_중리_말	ㄱ_초ㅏ_중J_종 C_초ㅗ_중J_종 ㄹ_초ㅣ_중J_종	명사	고유어
000004	가장	가장	가_두장_말	ㄱ_초ㅏ_중J_종 ㅈ_초ㅏ_중O_종	명사	한자어
000005	가장	가장	가_두장_말	ㄱ_초ㅏ_중J_종 ㅈ_초ㅏ_중O_종	부사	고유어
000006	간략하다	갈랴카다	갈_두랴_중카_중다_말	ㄱ_초ㅏ_중ㄹ_종 ㄹ_초ㅑ_중J_종 ㅋ_초ㅏ_중J_종 ㄷ_초ㅏ_중J_종	형용사	혼종어
000007	강가	강까	강_두까_말	ㄱ_초ㅏ_중O_종 ㄲ_초ㅏ_중J_종	명사	한자어
000008	꽁지	꽁지	꽁_두지_말	ㄲ_초ㅗ_중O_종 ㅈ_초ㅣ_중J_종	명사	고유어
…	…	…	…	…	…	…
325717	힁하다	힝하다	힝_두하_중다_말	ㅎ_초ㅣ_중O_종 ㅎ_초ㅏ_중J_종 ㄷ_초ㅏ_중J_종	형용사	고유어

Download Excel Table

먼저 표제어마다 아이디, 품사 정보, 원어 정보를 부여했다. 발음형은 음절 단위로 분리하여 개별 음절에서 어두, 어중, 어말 정보를 확인했고, 음절형을 음소 단위로 분리하여 초성, 중성, 종성 정보를 확인했다.

그림 1은 최소대립쌍을 분석하는 방법에 대한 절차를 단계별로 정리하여 보인 것이다.

그림 1. | Figure 1. 최소대립쌍 분석 절차 | Minimal pair analysis procedure

Download Original Figure

하나의 표제어에 대해서 위와 같은 방법으로 최소대립쌍을 찾았다. 예를 들어 기준 단어가 아이디 000001 ‘가방’인 경우이다. ‘가방’과 ‘가방’ 이외의 325,716개의 단어를 각각 비교했다. 음절 수가 같은지, 음절 수가 같다면 형태가 다른 음절이 몇 개인지, 형태가 다른 음절이 1개라면 음절을 구성하는 음소의 수가 같은지, 음소의 수가 같다면 형태가 다른 음소가 몇 개인지, 형태가 다른 음소가 1개라면 이 단어가 ‘가방’의 최소대립쌍이 되는 것이다. 이에 해당하는 단어의 예로는 ‘사방, 고방, 가상, 가봉, 가반’ 등이 있을 수 있는데 ‘가방’과 비교하여 형태가 다른 음소가 음절 내 초성, 중성, 종성 중 어느 위치에 있는지를 확인했고, 음소 쌍별 최소대립쌍의 개수(절대수치)를 산출했다.

표 2는 분석 대상 자료를 품사별로 나누어 빈도와 비율을 보인 것이다.

표 2. | Table 2. 품사별 구성 | Distribution in the classified the part of speech

	빈도	비율(%)
명사	249,109	76.48
대명사	334	0.10
수사	169	0.05
동사	49,210	15.11
형용사	12,084	3.71
관형사	3,237	0.99
부사	10,801	3.32
조사	151	0.05
감탄사	622	0.19
계	325,717	100.0

Download Excel Table

가장 높은 비율을 차지한 품사는 76.48%를 보인 명사였고, 가장 낮은 비율을 차지한 품사는 0.05%를 보인 조사였다. 동사가 형용사에 비해 4.07배 높은 빈도를 보인다는 것과 부사가 관형사에 비하여 3.34배 높은 빈도를 보인다는 것이 특징적이다. 9개의 품사 중 5개인 대명사, 수사, 관형사, 조사, 감탄사의 비율은 1% 미만이고, 명사와 동사 두 품사의 비율의 합은 91.59%를 차지하고 있었다.

3. 연구 결과

초성의 위치에서 대립 가능한 음소의 쌍은 산술적으로 153(=18×17×½)개이다. 분석 결과 모든 음소 쌍에서 최소대립쌍이 존재했고 그 개수는 총 337,135개였다.

3.1. 최소대립쌍의 개수 분석

표 3은 초성 위치의 최소대립쌍의 절대수치를 나타낸 분포표이고, 표 4는 상대수치를 나타낸 분포표이다. 본 절에서의 상대수치는 1장에서 살펴본 상대수치 계산의 두 방법 중 두 번째 방법으로 산출한 수치로, 최소대립쌍의 절대수치를 최소대립쌍을 구성하는 개별 음소가 하나라도 포함된 단어들의 수로 나누어 산출한 값이다.

표 3. | Table 3. 최소대립쌍의 절대수치 | Raw count of minimal pairs

	ㄱ	ㄲ	ㄴ	ㄷ	ㄸ	ㄹ	ㅁ	ㅂ	ㅃ	ㅅ	ㅆ	ㅈ	ㅉ	ㅊ	ㅋ	ㅌ	ㅍ	ㅎ
ㄱ
ㄲ	1,524
ㄴ	6,052	364
ㄷ	5,777	403	3,552
ㄸ	673	576	305	919
ㄹ	3,082	318	1,652	930	411
ㅁ	8,140	499	4,401	3,804	498	1,861
ㅂ	9,064	547	3,961	4,518	583	1,851	6,917
ㅃ	383	626	218	250	422	114	350	1,381
ㅅ	10,023	671	4,588	5,415	561	1,504	6,685	7,466	434
ㅆ	928	871	253	360	849	525	595	796	736	993
ㅈ	9,978	659	4,209	5,328	724	1,557	5,792	7,068	384	12,931	613
ㅉ	760	889	243	505	951	508	589	649	654	611	1,714	1,171
ㅊ	7,084	744	3,054	3,581	935	1,291	4,283	5,289	600	8,294	1,281	8,632	1,476
ㅋ	1,225	343	475	362	121	586	539	603	89	505	176	497	121	423
ㅌ	3,558	367	2,173	2,863	747	640	2,149	2,563	277	2,987	450	3,025	527	2,641	311
ㅍ	4,228	558	2,027	1,990	482	1,036	3,175	2,934	459	2,911	524	2,820	528	2,275	640	1,307
ㅎ	8,826	562	4,034	3,760	419	1,543	4,632	4,810	290	5,530	403	5,374	397	3,774	2,043	2,471	2,820
	81,305	10,521	41,561	44,317	10,176	19,409	54,909	61,000	7,667	72,109	12,067	70,762	12,293	55,657	9,059	29,056	30,714	51,688

Download Excel Table

표 4. | Table 4. 최소대립쌍의 상대수치 | Relative count of minimal pairs

	ㄱ	ㄲ	ㄴ	ㄷ	ㄸ	ㄹ	ㅁ	ㅂ	ㅃ	ㅅ	ㅆ	ㅈ	ㅉ	ㅊ	ㅋ	ㅌ	ㅍ
ㄱ
ㄲ	0.012
ㄴ	0.042	0.005
ㄷ	0.032	0.004	0.027
ㄸ	0.006	0.014	0.005	0.009
ㄹ	0.022	0.005	0.019	0.007	0.007
ㅁ	0.054	0.006	0.046	0.027	0.007	0.020
ㅂ	0.058	0.007	0.039	0.032	0.008	0.018	0.062
ㅃ	0.003	0.016	0.004	0.002	0.014	0.002	0.005	0.019
ㅅ	0.058	0.006	0.036	0.033	0.005	0.012	0.050	0.054	0.004
ㅆ	0.007	0.018	0.004	0.003	0.021	0.008	0.008	0.010	0.020	0.009
ㅈ	0.057	0.006	0.033	0.032	0.007	0.012	0.042	0.050	0.004	0.080	0.005
ㅉ	0.006	0.018	0.004	0.004	0.024	0.008	0.008	0.008	0.018	0.006	0.036	0.010
ㅊ	0.049	0.011	0.034	0.027	0.015	0.014	0.044	0.051	0.010	0.065	0.019	0.066	0.021
ㅋ	0.010	0.009	0.008	0.004	0.004	0.010	0.008	0.008	0.003	0.005	0.005	0.005	0.003	0.007
ㅌ	0.029	0.008	0.034	0.026	0.021	0.010	0.029	0.033	0.009	0.028	0.011	0.028	0.012	0.040	0.010
ㅍ	0.033	0.011	0.029	0.017	0.011	0.015	0.040	0.034	0.012	0.026	0.011	0.025	0.011	0.032	0.016	0.029
ㅎ	0.052	0.005	0.034	0.027	0.004	0.013	0.036	0.037	0.003	0.036	0.004	0.034	0.004	0.031	0.022	0.026	0.027

Download Excel Table

그림 2는 초성 최소대립쌍의 절대수치와 상대수치의 상관관계를 나타낸 것이다.

그림 2. | Figure 2. 초성 최소대립쌍의 절대수치와 상대수치의 상관관계 | Correlation between raw counts and relative counts

Download Original Figure

초성 최소대립쌍의 절대수치와 상대수치의 상관관계는 0.937로 높은 편이었다. 절대수치와 상대수치에 대한 잔차를 구한 결과 잔차의 값이 큰 음소 쌍은 /ㅆ-ㅉ/, /ㅊ-ㅌ/, /ㅌ-ㅍ/, /ㄴ-ㅌ/, /ㅁ-ㅍ/고, 반대로 잔차의 값이 작은 음소 쌍은 /ㄷ-ㅈ/, /ㄱ-ㅎ/, /ㄱ-ㄷ/, /ㄱ-ㅅ/, /ㄱ-ㅈ/였다.

표 5는 절대수치가 높은 쌍과 낮은 쌍을 15개씩(상하위 10%) 정리한 것이다. 전체 음소 쌍별 초성 최소대립쌍의 개수는 부록 1에 제시하였다.

표 5. | Table 5. 고빈도/저빈도 최소대립쌍(상·하위 10%) | Most and least frequently minimal pairs(top 10% and bottom 10%)

순위	초성 쌍	개수	비율(%)	누적비율(%)
1	ㅅ-ㅈ	12,930	3.84	3.84
2	ㄱ-ㅅ	10,023	2.97	6.81
3	ㄱ-ㅈ	9,978	2.96	9.77
4	ㄱ-ㅂ	9,063	2.69	12.46
5	ㄱ-ㅎ	8,825	2.62	15.08
6	ㅈ-ㅊ	8,631	2.56	17.64
7	ㅅ-ㅊ	8,293	2.46	20.10
8	ㄱ-ㅁ	8,138	2.41	22.51
9	ㅂ-ㅅ	7,464	2.21	24.72
10	ㄱ-ㅊ	7,084	2.10	26.83
11	ㅂ-ㅈ	7,066	2.10	28.92
12	ㅁ-ㅂ	6,915	2.05	30.97
13	ㅁ-ㅅ	6,683	1.98	32.95
14	ㄱ-ㄴ	6,053	1.80	34.75
15	ㅁ-ㅈ	5,791	1.72	36.47
：	：	：	：	：
139	ㄲ-ㅋ	343	0.10	99.08
140	ㄲ-ㄹ	318	0.09	99.18
141	ㅋ-ㅌ	311	0.09	99.27
142	ㄴ-ㄸ	305	0.09	99.36
143	ㅃ-ㅎ	290	0.09	99.45
144	ㅃ-ㅌ	277	0.08	99.53
145	ㄴ-ㅆ	254	0.08	99.60
146	ㄷ-ㅃ	250	0.07	99.68
147	ㄴ-ㅉ	243	0.07	99.75
148	ㄴ-ㅃ	218	0.06	99.82
149	ㅆ-ㅋ	176	0.05	99.87
150	ㄸ-ㅋ	121	0.04	99.90
151	ㅉ-ㅋ	121	0.04	99.94
152	ㄹ-ㅃ	114	0.03	99.97
153	ㅃ-ㅋ	89	0.03	100.0
계		337,135	100.0	100.0

Download Excel Table

초성에서 최소대립쌍을 가장 많이 이룬 음소 쌍은 /ㅅ-ㅈ/로 그 개수와 비율은 12,930개와 3.84%였고, 이어서 /ㄱ-ㅅ/ 쌍이 10,023개(2.97%)로 그 뒤를 따라 많았다. 반면에 가장 적은 음소 쌍은 /ㅃ-ㅋ/였는데, 그 개수와 비율은 89개와 0.03%로 /ㅃ/와 /ㅋ/가 초성 위치에서 대립하여 최소대립쌍을 이루는 경우는 매우 적었다.

상위 15개의 쌍은 전체 출현 최소대립쌍의 36.47%를 차지한 반면 하위 15개의 쌍은 1%도 되지 않아 출현 비율의 차이가 매우 컸다. 상위 15개 최소대립쌍은 ‘장애음과 장애음’의 쌍이 10개, ‘비음과 장애음’의 쌍이 5개였다. /ㄱ/는 15개 중 7개, /ㅅ/와 /ㅈ/는 15개 중 5개의 최소대립쌍에 나타났는데 상위 음소 쌍은 평음의 비중이 높았다. /ㅊ/도 3개의 최소대립쌍에 나타났는데 상위 최소대립쌍에 나타난 격음은 /ㅊ/가 유일했다. 한편 하위 최소대립쌍은 ‘장애음과 장애음’의 쌍이 9개, ‘비음/유음과 경음’의 쌍이 6개였다. /ㅃ/와 /ㅋ/는 15개 중 6개의 최소대립쌍에 나타났는데 하위 음소 쌍은 경음의 비중이 높았다. 그 뒤를 이어 /ㄴ/도 4개의 최소대립쌍에 나타났다.

상하위 음소 쌍을 통해 최소대립쌍을 이루는 데 가장 많이 사용되는 음소는 /ㄱ/고, 반대로 가장 덜 사용되는 음소는 /ㅃ/와 /ㅋ/일 것이라고 예상할 수 있다. 정확한 확인을 위하여 음소별 최소대립쌍 빈도를 분석한 결과는 표 6과 같다.

표 6. | Table 6. 음소별 최소대립쌍 빈도 분포 | Frequency distribution of minimal pairs by phoneme

순위	음소	빈도	비율(%)	누적비율(%)
1	ㄱ	81,301	12.06	12.06
2	ㅅ	72,103	10.69	22.75
3	ㅈ	70,755	10.49	33.25
4	ㅂ	60,988	9.05	42.29
5	ㅊ	55,650	8.25	50.55
6	ㅁ	54,906	8.14	58.69
7	ㅎ	51,683	7.67	66.36
8	ㄷ	44,315	6.57	72.93
9	ㄴ	41,561	6.16	79.09
10	ㅍ	30,713	4.56	83.65
11	ㅌ	29,046	4.31	87.96
12	ㄹ	19,411	2.88	90.84
13	ㅉ	12,294	1.82	92.66
14	ㅆ	12,066	1.79	94.45
15	ㄲ	10,524	1.56	96.01
16	ㄸ	10,171	1.51	97.52
17	ㅋ	9,059	1.34	98.86
18	ㅃ	7,668	1.14	100.0
계		674,270	100.0	100.0

Download Excel Table

가장 높은 빈도를 보인 음소는 /ㄱ/로 12.06%를 나타냈고, 이어서 /ㅅ, ㅈ, ㅂ, ㅊ/의 순서로 높게 나타났다. 반면에 가장 낮은 빈도를 보인 음소는 /ㅃ/로 1.14%에 불과했다. 표 5의 상위 15개에 포함된 음소 쌍의 음소가 표 6에서도 높은 빈도를 보였고, 표 5의 하위 15개에 포함된 음소 쌍의 음소는 표 6에서도 낮은 빈도를 보였다. 1위부터 9위까지는 /ㅊ/와 /ㅎ/를 제외하면 모두 평음과 비음이며, 10위부터 18위까지는 /ㄹ/를 제외하면 모두 경음과 격음이었다. 장애음 중에는 경음과 격음보다 평음이, 공명음 중에는 유음보다 비음이 최소대립쌍을 많이 만든다는 것을 알 수 있는데, /ㅊ/는 격음임에도 불구하고 8.25%로 높은 것이 특징적이다. /ㅉ/도 경음 중에서는 가장 높은 빈도를 나타냈다⁹.

초성마다 최소대립쌍을 가장 많이 만드는 음소도 다르게 나타났는데 결과는 표 7에 제시하였다.

표 7. | Table 7. 음소별 최고빈도 최소대립쌍 | Most frequently minimal pairs by phoneme

구분		음소 쌍	개수	비율(%)
장애음	평음	ㄱ-ㅅ	10,023	12.33
		ㄷ-ㄱ	5,777	13.04
		ㅂ-ㄱ	9,063	14.86
		ㅅ-ㅈ	12,930	17.93
		ㅈ-ㅅ	12,930	18.27
	경음	ㄲ-ㄱ	1,524	14.48
		ㄸ-ㅉ	951	9.35
		ㅃ-ㅂ	1,381	18.01
		ㅆ-ㅉ	1,714	14.21
		ㅉ-ㅆ	1,714	13.94
	격음	ㅊ-ㅈ	8,631	15.51
		ㅋ-ㅎ	2,043	22.55
		ㅌ-ㄱ	3,558	12.25
		ㅍ-ㄱ	4,228	13.77
	후음	ㅎ-ㄱ	8,825	17.08
공명음		ㄴ-ㄱ	6,053	14.56
		ㄹ-ㄱ	3,081	15.87
		ㅁ-ㄱ	8,138	14.82

Download Excel Table

평음은 최소대립쌍이 가장 많은 음소는 모두 조음 위치 또는 조음 방법에는 차이가 있으나 발성 유형이 같은 평음이었다. 경음의 경우 /ㄲ/와 /ㅃ/는 조음 위치와 방법은 동일하나 발성 유형이 다른 평음과 가장 많은 대립 쌍을 만들었고, /ㄸ/, /ㅉ/, /ㅆ/는 조음 위치와 방법은 다르나 발성 유형이 같은 경음과 가장 많은 대립 쌍을 만들었다. 격음은 일정하지가 않았는데 /ㅊ/는 조음 위치와 조음 방법을 공유하는 /ㅈ/와, /ㅋ/는 유기성 자질을 공유하는 /ㅎ/와, /ㅌ/, /ㅍ/는 /ㄱ/와 가장 많은 대립 쌍을 만들었다. 그렇지만 대체로 조음 위치나 발성 방법을 공유하는 음소와 최소대립쌍을 만드는 빈도가 높은 것으로 보인다. 반면에 공명음은 모두 /ㄱ/와 가장 많은 최소대립쌍을 만들었다.

장애음의 최소대립쌍만 따로 조금 더 구체적으로 살펴보겠다. 표 8은 삼지적 상관속을 이루는 장애음 내의 최소대립쌍을 정리하여 나타낸 것이다.

표 8. | Table 8. 양순음, 치경음, 경구개음, 연구개음의 최소대립쌍 | Minimal pairs of bilabials, alveolars, palatals, and velars

구분	음소 쌍	개수	비율(%)	계
양순음	ㅂ-ㅃ	1,381	28.93	4,774
	ㅂ-ㅍ	2,934	61.46
	ㅃ-ㅍ	459	9.61
치경음	ㄷ-ㄸ	919	20.29	4,529
	ㄷ-ㅌ	2,863	63.21
	ㄸ-ㅌ	747	16.49
	ㅅ-ㅆ	993	100.0	993
경구개음	ㅈ-ㅉ	1,171	10.38	11,279
	ㅈ-ㅊ	8,632	76.53
	ㅉ-ㅊ	1,476	13.09
연구개음	ㄱ-ㄲ	1,524	49.29	3,092
	ㄱ-ㅋ	1,225	39.62
	ㄲ-ㅋ	343	11.09

Download Excel Table

그림 3부터 그림 6까지는 삼지적 상관속을 이루는 장애음의 최소대립쌍 관계를 그림으로 나타낸 것이다¹⁰.

그림 3. | Figure 3. /ㅂ-ㅃ-ㅍ/ 최소대립쌍의 비교 | Comparison of the minimal pairs of /ㅂ-ㅃ-ㅍ/

Download Original Figure

그림 4. | Figure 4. /ㄷ-ㄸ-ㅌ/ 최소대립쌍의 비교 | Comparison of the minimal pairs of /ㄷ-ㄸ-ㅌ/

Download Original Figure

그림 5. | Figure 5. /ㅈ-ㅉ-ㅊ/ 최소대립쌍의 비교 | Comparison of the minimal pairs of /ㅈ-ㅉ-ㅊ/

Download Original Figure

그림 6. | Figure 6. /ㄱ-ㄲ-ㅋ/ 최소대립쌍의 비교 | Comparison of the minimal pairs of /ㄱ-ㄲ-ㅋ/

Download Original Figure

삼지적 상관속을 이루는 장애음의 최소대립쌍은 조음 위치와 조음 방법에 따라 차이를 보이고 있다. 연구개음 /ㄱ-ㄲ-ㅋ/는 ‘평음-경음’ 쌍의 비율이 가장 높고, ‘경음-격음’ 쌍의 비율이 가장 낮았다. 경구개음 /ㅈ-ㅉ-ㅊ/는 ‘평음-격음’ 쌍의 비율이 가장 높고, ‘평음-경음’ 쌍의 비율이 가장 낮았는데 연구개음의 양상과 매우 다르게 나타났다. 치경음 /ㄷ-ㄸ-ㅌ/과 양순음 /ㅂ-ㅃ-ㅍ/은 모두 ‘평음-격음’ 쌍의 비율이 가장 높고, ‘경음-격음’ 쌍의 비율이 가장 낮았다.

많은 연구에서 한국어를 배우는 외국인 학습자들은 ‘평음-경음-격음’의 구분이 있는 파열음, 파찰음의 발음 습득에 어려움이 있다고 한다. 모국어의 영향에 따라 차이가 있을 수 있겠지만 /ㄱ, ㄷ, ㅂ, ㅈ/의 ‘평음-경음-격음’ 쌍에 대한 습득 난이도는 같지 않을 것이다. 음소 쌍별로 만들 수 있는 최소대립쌍의 수는 차이를 보이므로 음소 쌍마다 기능부담량이 다를 것이라고 할 수 있다. 최소대립쌍의 개수를 기반으로 기능부담량을 설정하여 발음 교육의 우선순위를 매긴다면 표 9와 같을 것이다.

표 9. | Table 9. 최소대립쌍 개수 기반 기능부담량 | Functional load based on the raw count of minimal pairs

	음소 쌍	최소대립쌍 개수
High	/ㅈ-ㅊ/	8,631
↓	/ㅂ-ㅍ/	2,934
	/ㄷ-ㅌ/	2,863
	/ㄱ-ㄲ/	1,524
	/ㅉ-ㅊ/	1,475
	/ㅂ-ㅃ/	1,381
	/ㄱ-ㅋ/	1,225
	/ㅈ-ㅉ/	1,171
	/ㅅ-ㅆ/	993
	/ㄷ-ㄸ/	919
	/ㄸ-ㅌ/	747
	/ㅃ-ㅍ/	459
Low	/ㄲ-ㅋ/	343

Download Excel Table

한국어 장애음의 경우 /ㅈ-ㅊ/ 쌍은 최소대립쌍의 수가 가장 많으므로 우선적으로 교육해야 하고, 반대로 /ㄲ-ㅋ/ 쌍은 최소대립쌍의 수가 적으므로 발음을 교육할 때 크게 중요하지 않다고 주장할 수도 있을 것이다.

3.2. 최소대립쌍의 품사 분석

이 절에서는 초성 위치에서 자음이 대립하는 최소대립쌍의 품사에 대해 살펴본다. 표 10은 두 단어의 품사 관계를 나타낸 분포표이다.

표 10. | Table 10. 최소대립쌍 단어의 품사 관계 | Syntactic category of words in the pairs

	명사	대명사	수사	동사	형용사	관형사	부사	조사	감탄사
명사	236,851 (70.25%)
대명사	2,446 (0.73%)	46 (0.01%)
수사	751 (0.22%)	26 (0.01%)	12 (0.00%)
동사	1,221 (0.36%)	8 (0.00%)	1 (0.00%)	49,778 (14.77%)
형용사	358 (0.11%)	-	1 (0.00%)	17,399 (5.16%)	4,621 (1.37%)
관형사	2,760 (0.82%)	62 (0.02%)	62 (0.02%)	2 (0.00%)	-	532 (0.16%)
부사	11,999 (3.56%)	162 (0.05%)	96 (0.03%)	90 (0.03%)	30 (0.01%)	271 (0.08%)	4,429 (1.31%)
조사	808 (0.24%)	40 (0.01%)	25 (0.01%)	36 (0.01%)	6 (0.00%)	58 (0.02%)	77 (0.02%)	23 (0.01%)
감탄사	1,545 (0.46%)	63 (0.02%)	31 (0.01%)	14 (0.00%)	3 (0.00%)	88 (0.03%)	170 (0.05%)	43 (0.01%)	91 (0.03%)

Download Excel Table

초성 최소대립쌍 단어의 품사 관계를 보면 ‘명사-명사’ 쌍이 70.25%로 가장 많고, 그다음으로 ‘동사-동사’ 쌍이 14.77%로 나타나 이 두 품사 쌍이 전체의 85% 이상을 차지했다. 전체 45개의 품사 쌍 중 39개는 1%도 되지 않았는데 그 중 ‘대명사-형용사’와 ‘형용사-관형사’의 품사 관계를 보이는 최소대립쌍은 한 쌍도 없었다. 용언인 동사와 형용사는 용언 내에서 최소대립쌍을 이루는 비율이 높고, 용언을 제외한 다른 모든 품사는 명사 또는 부사와의 쌍이 많은 것이 특징적이다. 즉, 용언은 특정 품사와 최소대립쌍을 이루는 비율이 높은 반면에 부사는 모든 품사와 자유롭게 최소대립쌍을 이룬다고 할 수 있다.

표 11은 음소 쌍별 최소대립쌍 중 품사가 같은 단어 쌍의 개수를 조사하여 두 단어의 품사 일치 정도를 계산한 후, 일치율이 높은 상위 10%와 일치율이 낮은 하위 10%에 해당하는 음소 쌍을 제시한 것이다. 전체 초성 최소대립쌍의 품사 일치율은 부록 2에 제시하였다. 초성 최소대립쌍 337,135개 중 296,356개가 두 단어의 품사가 같았고 그 결과 품사 일치율은 87.91%로 상당히 높은 편이었다. 품사 일치율이 가장 높은 음소 쌍은 /ㄲ-ㅋ/(93.88%)고, 가장 낮은 음소 쌍은 /ㅉ-ㅋ/(68.60%)였다. 품사 일치율이 높은 음소 쌍은 대체로 경음과 격음으로 구성되어 있었는데 최소대립쌍의 품사 일치율은 음소 쌍의 음성적 유사성과 연관이 있다고 볼 수 있겠다.

표 11. | Table 11. 음소 쌍별 최소대립쌍 품사 일치 비율(상하위 10%) | Percentage of same part of speech(top 10% and bottom 10%)

순위	초성 쌍	품사 일치율	순위	초성 쌍	품사 일치율
1	ㄲ-ㅋ	93.88	139	ㄷ-ㅋ	77.35
2	ㄲ-ㅃ	93.77	140	ㅆ-ㅋ	76.70
3	ㄲ-ㅉ	93.48	141	ㅁ-ㅃ	76.57
4	ㅃ-ㅉ	93.43	142	ㅃ-ㅋ	76.40
5	ㅃ-ㅆ	92.93	143	ㄸ-ㅎ	76.13
6	ㄲ-ㅆ	92.65	144	ㅈ-ㅋ	76.06
7	ㄲ-ㅍ	92.11	145	ㅋ-ㅎ	75.92
8	ㅊ-ㅍ	92.00	146	ㅃ-ㅅ	75.81
9	ㄸ-ㅌ	91.97	147	ㄱ-ㅃ	75.46
10	ㅆ-ㅊ	91.49	148	ㄷ-ㅉ	75.25
11	ㅆ-ㅉ	91.48	149	ㄷ-ㅃ	74.80
12	ㅆ-ㅌ	91.33	150	ㄴ-ㅃ	74.77
13	ㅌ-ㅍ	91.28	151	ㄹ-ㅃ	73.68
14	ㄴ-ㅊ	91.03	152	ㅃ-ㅈ	72.14
15	ㄲ-ㅌ	90.74	153	ㅉ-ㅋ	68.60

Download Excel Table

4. 결론

이 연구에서는 『우리말샘』의 표제어 발음을 대상으로 초성 위치에서 한국어 자음의 최소대립쌍 출현 빈도를 조사하고, 최소대립쌍을 이루는 두 단어의 품사 관계에 대해서 분석했다. 연구 결과를 요약하면 다음과 같다.

첫째, 분석 대상이 된 325,717개의 표제어에서 관찰된 초성 자음 대립의 최소대립쌍은 총 337,135개였다. 음소 쌍별 최소대립쌍의 개수는 ‘ㅅ-ㅈ, ㄱ-ㅅ, ㄱ-ㅈ, ㄱ-ㅂ, ㄱ-ㅎ, ..., ㅃ-ㅋ, ㄹ-ㅃ, ㅉ-ㅋ, ㄸ-ㅋ, ㅆ-ㅋ’ 순으로 나타났다. 고빈도 음소 쌍은 평음의 비중이 높고, 저빈도 음소 쌍은 경음의 비중이 높았다. 음소별로 최소대립쌍을 많이 이루는 빈도를 분석한 결과 ‘ㄱ, ㅅ, ㅈ, ㅂ, ㅊ, ㅁ, ㅎ, ㄷ, ㄴ, ㅍ, ㅌ, ㄹ, ㅉ, ㅆ, ㄲ, ㄸ, ㅋ, ㅃ’ 순으로 나타났다. 장애음 중에는 경음과 격음보다 평음이, 공명음 중에는 유음보다 비음이 최소대립쌍을 많이 만든다는 것을 확인할 수 있는데, 경구개음의 비율이 높게 나타난 것도 특징적이었다.

최소대립쌍의 절대수치와 상대수치의 상관관계를 살펴본 결과 r=0.937의 높은 상관계수를 나타냈다. 절대수치와 상대수치에 대한 잔차를 구한 결과 잔차의 값이 큰 음소 쌍은 /ㅆ-ㅉ/, /ㅊ-ㅌ/, /ㅌ-ㅍ/, /ㄴ-ㅌ/, /ㅁ-ㅍ/였는데 이 쌍들은 음소 빈도에 비해 최소대립쌍의 개수가 상대적으로 많다고 할 수 있다. 반대로 잔차의 값이 작은 음소 쌍은 /ㄷ-ㅈ/, /ㄱ-ㅎ/, /ㄱ-ㄷ/, /ㄱ-ㅅ/, /ㄱ-ㅈ/였다.

한편, 삼지적 상관속을 이루는 장애음의 최소대립쌍 관계에도 차이가 나타났다. 경구개 파열음은 ‘평음(ㄱ)-경음(ㄲ)’ 쌍의 비율이 가장 높고, ‘경음(ㄲ)-격음(ㅋ)’ 쌍의 비율이 가장 낮았다. 반면에 파찰음은 ‘평음(ㅈ)-격음(ㅊ)’ 쌍의 비율이 가장 높고, ‘평음(ㅈ)-경음(ㅉ)’ 쌍의 비율이 가장 낮았다. 한편, 치경 파열음과 양순 파열음은 모두 ‘평음(ㄷ/ㅂ)-격음(ㅌ/ㅍ)’ 쌍의 비율이 가장 높고, ‘경음(ㄸ/ㅃ)-격음(ㅌ/ㅍ)’ 쌍의 비율이 가장 낮았다.

둘째, 최소대립쌍을 이루는 두 단어 쌍의 품사 정보 분포를 살펴본 결과 두 단어의 품사가 같은 비율은 87.91%로 나타나 최소대립쌍은 인지적으로 비슷한 범주로 묶일 가능성이 높다는 것을 확인할 수 있었다. 품사 일치율이 가장 높은 음소 쌍은 /ㄲ-ㅋ/, 가장 낮은 음소 쌍은 /ㅉ-ㅋ/ 쌍이었다. 이 결과는 이후 발음 교육을 위한 한국어 음소의 기능부담량 설정에도 활용할 수 있을 것이다.

이 연구는 사전 표제어의 발음형을 대상으로 기존 연구에서 다루지 못한 최소대립쌍의 양상을 밝혔다는 의의가 있다. 다만 모음과 종성 위치의 자음의 최소대립쌍을 다루지 못했고, 단어 구조를 반영한 어두, 어중, 어말 위치에서의 대립 관계도 다루지 못했다. 추후 이에 대해서도 연구를 진행하여 한국어 음소의 전체적인 대립 체계를 종합적으로 정리해 나가고자 한다. 이 연구의 결과는 한국어 음소와 관련된 기초 자료로서 발음 교육, 언어 병리학, 음성 공학 등의 다양한 응용 분야에서 유용하게 활용될 수 있을 것이다.

Footnote

^1. 이 연구에서는 두 단어의 묶음으로 이루어진 쌍만을 최소대립쌍으로 인정한다. 논의에 따라서는 가령 국어 장애음의 삼지적 상관속을 언급하면서 ‘달, 탈, 딸’과 같은 세 단어의 묶음을 최소대립쌍으로 설정하기도 하지만 엄밀하게 말하면 최소대립쌍은 두 개로 이루어진 단어 묶음만을 가리킬 뿐이다. 최소대립쌍과 비슷한 개념으로 최소대립군(minimal set)도 있다. 이것은 동일한 위치에 놓이는 소리의 차이에 따라 구분되는 단어들을 모두 묶는 개념으로 사용된다. 가령 ‘둘(二), 물(水), 불(火), 술(酒), …’과 같이 ‘ᅟᅮᆯ’ 앞에 오는 초성의 차이에 따라 구별되는 단어들을 총괄하여 최소대립군이라고 부를 수 있다(Lee, 2010:19).

^2. 음운의 대립이 단어의 의미 구별에 관여하는 정도를 가리킨다. 어떤 음운의 기능부담량이 많다는 것은 그만큼 그 음운이 많은 단어의 구별에 쓰인다는 것이다. 기능부담량이 많은 음운은 음운 체계 내에서의 지위가 확고하다. 반면 기능부담량이 적은 음운은 그렇지 못하므로 다른 음운으로 바뀌거나 음운으로서의 지위를 잃어버릴 가능성이 있다. 가령 현대 국어의 장단은 기능부담량이 많지 않은 것으로 알려져 있는데 이것이 음운으로서의 지위가 흔들리는 데 중요하게 작용했다고 보기도 한다. 기능부담량은 대체로 최소대립쌍의 수를 세는 방식으로 이루어지는 것이 일반적이다. 물론 현실적으로 이런 과정을 거쳐 국어의 음운들이 각각 어느 정도의 기능부담량을 가지는지 재어 본 논의는 별로 없다. 그러나 기능부담량의 개념을 볼 때 최소대립쌍의 수가 기능부담량 측정에 중요한 척도가 된다는 것은 부인하기 어렵다(Lee, 2017:87).

^3. Lee et al.(1987)은 ‘최소대립쌍’ 대신 ‘최소음소쌍’이라는 용어를 사용하고, Jin(1996)은 ‘최소대립쌍’ 대신 ‘최소대립어’라는 용어를 사용했다.

^4. 최소대립쌍의 상대수치 측정 방법은 Hall et al.(2017)을 참고하였다.

^5. Derwing & Munro(2015:75-76)은 청자는 단어를 들을 때 명사를 다른 명사와 혼동할 확률이 높지 명사를 다른 품사인 형용사나 동사와 혼동할 확률이 높은 것이 아니기에 두 단어의 품사가 같을 때 기능부담량이 높다고 할 수 있다고 했다.

^6. opendict.korean.go.kr

^7. 구체적인 자료 구성 원칙과 자료 처리 방법, 발음형 설정 기준은 Jung(2019)에 상세히 기술했다. 발음형 설정 기준 중 자음의 발음과 관련 있는 것은 아래와 같다.

·/ㄴ/을 첨가하여 발음하기도 하지만, 표기대로 /ㄴ/ 첨가 없이 발음하기도 하는 단어는 /ㄴ/을 첨가한 발음을 발음형으로 한다. 예) 검열[검녈], 야금야금[야금냐금]
·표준국어대사전에서 정보가 수정된 단어는 수정된 내용을 발음형으로 한다. 예) 김밥[김ː빱]

^8. 본 연구에서는 다루지 않았지만 추후 최소대립쌍과 원어 정보의 관계에 대한 분석을 하기 위하여 각 단어에 고유어, 한자어, 혼종어와 같은 원어 정보를 부여했다.

^9. Jung(2019)에서 분석한 초성의 출현 빈도는 /ㄱ, ㄷ, ㅈ, ㅅ, ㅎ, ㅂ, ㅁ, ㄹ, ㅊ, ㄴ, ㅍ, ㄲ, ㅉ, ㅆ, ㅌ, ㄸ, ㅋ, ㅃ/ 순으로 높게 나타났는데 이와는 다소 차이가 있다.

^10. 굵은 실선(━), 가는 실선(─), 점선(－－)의 순으로 최소대립쌍의 개수가 많음을 의미한다.

References

Brown, A. (1988). Functional load and the teaching of pronunciation. TESOL Quarterly, 22(4), 593-606.

Brown, A. (1991). Pronunciation models. Singapore: Singapore University Press.

Catford, J. C. (1987). Phonetics and the teaching of pronunciation: A systemic description of English phonology. In J. Morley (Ed.), Current perspectives on pronunciation: Practices anchored in theory (pp. 87-100). Washington, DC: Teachers of English to Speakers of Other Languages.

Derwing, T. M., & Munro, M. J. (2015). Pronunciation fundamentals: Evidence-based perspectives for L2 teaching and research. Amsterdam: John Benjamins.

Hall, K. C., Allen, B., Fry, M., Johnson, K., Lo, R., Mackie, S., & McAuliffe, M. (2017). Phonological corpus tools (Version 1.3) [Computer program]. Retrieved from https://corpustools.readthedocs.io/

Jin, N. (1996, October). The function load of the vowel opposition and phonological change in Korean. Proceedings of the 1st Conference of the Seoul International Conference of Phonetic Sciences (SICOPS 1996) (pp. 169-175). Seoul, Korea.

Jung, J. (2019). A study of phoneme frequencies based on the pronunciation in the entries of Korean dictionary. Language and Linguistics, 83, 179-217.

Kim, K., & Kang, B. (1997). Frequency analysis of Hangul usage. Seoul: Research Institute of Korean Studies, Korea University.

Kim, T. H., Lee, J. H, & Chang, M. S. (2014). A minimal pair searching tool based on dictionary. Journal of Korean Institute of Intelligent Systems, 24(2), 117-122.

10.

Lee, J. H. (2010). On the selection of minimal pair in Korean. The Korean Language and Literature, 107, 119-137.

11.

Lee, J. (2017). Dictionary of Korean phonology terms. Seoul: Youkrack.

12.

Lee, Y. J., Kim, K. T, Jo, C. W., & Lee, S. G. (1987). Statistical properties of phonemes in Korean phonetic dictionary. Proceedings of the 1987 Institute of Electronics Engineer of Korea, Conference (pp. 117-121). Seoul, Korea.

13.

Levis, J., & Cortes, V. (2008). Minimal pairs in spoken corpora: Implications for pronunciation assessment and teaching. Towards adaptive CALL: Natural Language Processing for Diagnostic Language Assessment (pp. 197-208).

14.

Munro, M. J., & Derwing, T. M. (2006). The functional load principle in ESL pronunciation instruction: An exploratory study. System, 34(4), 520-531.

15.

Shin, J. (2010). Phoneme and syllable drequencies based on the analysis of entries in the Korean dictionary. Communication Sciences and Disorders, 15(1), 94-106.

Appendices

부록 1. 초성 최소대립쌍 개수(개수 내림차순 정렬)

순위	초성 쌍	개수	비율 (%)	누적비율(%)
1	ㅅ-ㅈ	12,931	3.84	3.84
2	ㄱ-ㅅ	10,023	2.97	6.81
3	ㄱ-ㅈ	9,978	2.96	9.77
4	ㄱ-ㅂ	9,064	2.69	12.46
5	ㄱ-ㅎ	8,826	2.62	15.07
6	ㅈ-ㅊ	8,632	2.56	17.64
7	ㅅ-ㅊ	8,294	2.46	20.10
8	ㄱ-ㅁ	8,140	2.41	22.51
9	ㅂ-ㅅ	7,466	2.21	24.72
10	ㄱ-ㅊ	7,084	2.10	26.83
11	ㅂ-ㅈ	7,068	2.10	28.92
12	ㅁ-ㅂ	6,917	2.05	30.97
13	ㅁ-ㅅ	6,685	1.98	32.96
14	ㄱ-ㄴ	6,052	1.80	34.75
15	ㅁ-ㅈ	5,792	1.72	36.47
16	ㄱ-ㄷ	5,777	1.71	38.18
17	ㅅ-ㅎ	5,530	1.64	39.82
18	ㄷ-ㅅ	5,415	1.61	41.43
19	ㅈ-ㅎ	5,374	1.59	43.02
20	ㄷ-ㅈ	5,328	1.58	44.60
21	ㅂ-ㅊ	5,289	1.57	46.17
22	ㅂ-ㅎ	4,810	1.43	47.60
23	ㅁ-ㅎ	4,632	1.37	48.97
24	ㄴ-ㅅ	4,588	1.36	50.33
25	ㄷ-ㅂ	4,518	1.34	51.67
26	ㄴ-ㅁ	4,401	1.31	52.98
27	ㅁ-ㅊ	4,283	1.27	54.25
28	ㄱ-ㅍ	4,228	1.25	55.50
29	ㄴ-ㅈ	4,209	1.25	56.75
30	ㄴ-ㅎ	4,034	1.20	57.95
31	ㄴ-ㅂ	3,961	1.17	59.12
32	ㄷ-ㅁ	3,804	1.13	60.25
33	ㅊ-ㅎ	3,774	1.12	61.37
34	ㄷ-ㅎ	3,760	1.12	62.49
35	ㄷ-ㅊ	3,581	1.06	63.55
36	ㄱ-ㅌ	3,558	1.06	64.60
37	ㄴ-ㄷ	3,552	1.05	65.66
38	ㅁ-ㅍ	3,175	0.94	66.60
39	ㄱ-ㄹ	3,082	0.91	67.51
40	ㄴ-ㅊ	3,054	0.91	68.42
41	ㅈ-ㅌ	3,025	0.90	69.32
42	ㅅ-ㅌ	2,987	0.89	70.20
43	ㅂ-ㅍ	2,934	0.87	71.07
44	ㅅ-ㅍ	2,911	0.86	71.94
45	ㄷ-ㅌ	2,863	0.85	72.79
46	ㅈ-ㅍ	2,820	0.84	73.62
46	ㅍ-ㅎ	2,820	0.84	74.46
48	ㅊ-ㅌ	2,641	0.78	75.24
49	ㅂ-ㅌ	2,563	0.76	76.00
50	ㅌ-ㅎ	2,471	0.73	76.74
51	ㅊ-ㅍ	2,275	0.67	77.41
52	ㄴ-ㅌ	2,173	0.64	78.06
53	ㅁ-ㅌ	2,149	0.64	78.69
54	ㅋ-ㅎ	2,043	0.61	79.30
55	ㄴ-ㅍ	2,027	0.60	79.90
56	ㄷ-ㅍ	1,990	0.59	80.49
57	ㄹ-ㅁ	1,861	0.55	81.04
58	ㄹ-ㅂ	1,851	0.55	81.59
59	ㅆ-ㅉ	1,714	0.51	82.10
60	ㄴ-ㄹ	1,652	0.49	82.59
61	ㄹ-ㅈ	1,557	0.46	83.05
62	ㄹ-ㅎ	1,543	0.46	83.51
63	ㄱ-ㄲ	1,524	0.45	83.96
64	ㄹ-ㅅ	1,504	0.45	84.41
65	ㅉ-ㅊ	1,476	0.44	84.85
66	ㅂ-ㅃ	1,381	0.41	85.25
67	ㅌ-ㅍ	1,307	0.39	85.64
68	ㄹ-ㅊ	1,291	0.38	86.03
69	ㅆ-ㅊ	1,281	0.38	86.41
70	ㄱ-ㅋ	1,225	0.36	86.77
71	ㅈ-ㅉ	1,171	0.35	87.12
72	ㄹ-ㅍ	1,036	0.31	87.42
73	ㅅ-ㅆ	993	0.29	87.72
74	ㄸ-ㅉ	951	0.28	88.00
75	ㄸ-ㅊ	935	0.28	88.28
76	ㄷ-ㄹ	930	0.28	88.55
77	ㄱ-ㅆ	928	0.28	88.83
78	ㄷ-ㄸ	919	0.27	89.10
79	ㄲ-ㅉ	889	0.26	89.36
80	ㄲ-ㅆ	871	0.26	89.62
81	ㄸ-ㅆ	849	0.25	89.87
82	ㅂ-ㅆ	796	0.24	90.11
83	ㄱ-ㅉ	760	0.23	90.34
84	ㄸ-ㅌ	747	0.22	90.56
85	ㄲ-ㅊ	744	0.22	90.78
86	ㅃ-ㅆ	736	0.22	91.00
87	ㄸ-ㅈ	724	0.21	91.21
88	ㄱ-ㄸ	673	0.20	91.41
89	ㄲ-ㅅ	671	0.20	91.61
90	ㄲ-ㅈ	659	0.20	91.81
91	ㅃ-ㅉ	654	0.19	92.00
92	ㅂ-ㅉ	649	0.19	92.19
93	ㄹ-ㅌ	640	0.19	92.38
93	ㅋ-ㅍ	640	0.19	92.57
95	ㄲ-ㅃ	626	0.19	92.76
96	ㅆ-ㅈ	613	0.18	92.94
97	ㅅ-ㅉ	611	0.18	93.12
98	ㅂ-ㅋ	603	0.18	93.30
99	ㅃ-ㅊ	600	0.18	93.48
100	ㅁ-ㅆ	595	0.18	93.65
101	ㅁ-ㅉ	589	0.17	93.83
102	ㄹ-ㅋ	586	0.17	94.00
103	ㄸ-ㅂ	583	0.17	94.18
104	ㄲ-ㄸ	576	0.17	94.35
105	ㄲ-ㅎ	562	0.17	94.51
106	ㄸ-ㅅ	561	0.17	94.68
107	ㄲ-ㅍ	558	0.17	94.85
108	ㄲ-ㅂ	547	0.16	95.01
109	ㅁ-ㅋ	539	0.16	95.17
110	ㅉ-ㅍ	528	0.16	95.32
111	ㅉ-ㅌ	527	0.16	95.48
112	ㄹ-ㅆ	525	0.16	95.64
113	ㅆ-ㅍ	524	0.16	95.79
114	ㄹ-ㅉ	508	0.15	95.94
115	ㄷ-ㅉ	505	0.15	96.09
115	ㅅ-ㅋ	505	0.15	96.24
117	ㄲ-ㅁ	499	0.15	96.39
118	ㄸ-ㅁ	498	0.15	96.54
119	ㅈ-ㅋ	497	0.15	96.68
120	ㄸ-ㅍ	482	0.14	96.83
121	ㄴ-ㅋ	475	0.14	96.97
122	ㅃ-ㅍ	459	0.14	97.10
123	ㅆ-ㅌ	450	0.13	97.24
124	ㅃ-ㅅ	434	0.13	97.37
125	ㅊ-ㅋ	423	0.13	97.49
126	ㄸ-ㅃ	422	0.13	97.62
127	ㄸ-ㅎ	419	0.12	97.74
128	ㄸ-ㄹ	411	0.12	97.86
129	ㄲ-ㄷ	403	0.12	97.98
129	ㅆ-ㅎ	403	0.12	98.10
131	ㅉ-ㅎ	397	0.12	98.22
132	ㅃ-ㅈ	384	0.11	98.33
133	ㄱ-ㅃ	383	0.11	98.45
134	ㄲ-ㅌ	367	0.11	98.56
135	ㄲ-ㄴ	364	0.11	98.66
136	ㄷ-ㅋ	362	0.11	98.77
137	ㄷ-ㅆ	360	0.11	98.88
138	ㅁ-ㅃ	350	0.10	98.98
139	ㄲ-ㅋ	343	0.10	99.08
140	ㄲ-ㄹ	318	0.09	99.18
141	ㅋ-ㅌ	311	0.09	99.27
142	ㄴ-ㄸ	305	0.09	99.36
143	ㅃ-ㅎ	290	0.09	99.45
144	ㅃ-ㅌ	277	0.08	99.53
145	ㄴ-ㅆ	253	0.08	99.60
146	ㄷ-ㅃ	250	0.07	99.68
147	ㄴ-ㅉ	243	0.07	99.75
148	ㄴ-ㅃ	218	0.06	99.82
149	ㅆ-ㅋ	176	0.05	99.87
150	ㄸ-ㅋ	121	0.04	99.90
150	ㅉ-ㅋ	121	0.04	99.94
152	ㄹ-ㅃ	114	0.03	99.97
153	ㅃ-ㅋ	89	0.03	100.0

Download Excel Table

부록 2. 초성 최소대립쌍 품사 일치율(품사 일치율 내림차순 정렬)

순위	초성 쌍	최소대립쌍 개수	품사 일치쌍 개수	품사 일치율
1	ㄲ-ㅋ	343	322	93.88
2	ㄲ-ㅃ	626	587	93.77
3	ㄲ-ㅉ	889	831	93.48
4	ㅃ-ㅉ	654	611	93.43
5	ㅃ-ㅆ	736	684	92.93
6	ㄲ-ㅆ	871	807	92.65
7	ㄲ-ㅍ	558	514	92.11
8	ㅊ-ㅍ	2,275	2,093	92.00
9	ㄸ-ㅌ	747	687	91.97
10	ㅆ-ㅊ	1,281	1,172	91.49
11	ㅆ-ㅉ	1,714	1,568	91.48
12	ㅆ-ㅌ	450	411	91.33
13	ㅌ-ㅍ	1,307	1,193	91.28
14	ㄴ-ㅊ	3,054	2,780	91.03
15	ㄲ-ㅌ	367	333	90.74
16	ㄴ-ㅌ	2,173	1,971	90.70
17	ㅊ-ㅌ	2,641	2,395	90.69
18	ㅅ-ㅌ	2,987	2,708	90.66
19	ㅆ-ㅍ	524	475	90.65
20	ㅂ-ㅍ	2,934	2,659	90.63
21	ㄴ-ㅍ	2,027	1,837	90.63
22	ㅅ-ㅊ	8,294	7,515	90.61
23	ㄷ-ㅂ	4,518	4,086	90.44
24	ㄱ-ㅊ	7,084	6,401	90.36
25	ㅂ-ㅌ	2,563	2,314	90.28
26	ㄴ-ㅂ	3,961	3,574	90.23
27	ㄱ-ㅍ	4,228	3,811	90.14
28	ㄱ-ㅂ	9,064	8,162	90.05
29	ㅂ-ㅅ	7,466	6,718	89.98
30	ㄴ-ㄷ	3,552	3,195	89.95
31	ㅂ-ㅊ	5,289	4,756	89.92
32	ㅈ-ㅊ	8,632	7,754	89.83
33	ㄸ-ㅃ	422	379	89.81
34	ㅅ-ㅍ	2,911	2,610	89.66
35	ㅉ-ㅊ	1,476	1,322	89.57
36	ㅉ-ㅌ	527	471	89.37
37	ㅌ-ㅎ	2,471	2,208	89.36
38	ㄴ-ㅅ	4,588	4,095	89.25
39	ㄱ-ㅅ	10,023	8,944	89.23
40	ㅈ-ㅍ	2,820	2,516	89.22
41	ㅁ-ㅂ	6,917	6,170	89.20
42	ㄱ-ㄴ	6,052	5,398	89.19
43	ㅈ-ㅌ	3,025	2,698	89.19
44	ㄴ-ㅈ	4,209	3,750	89.09
45	ㄱ-ㅌ	3,558	3,168	89.04
46	ㅅ-ㅈ	12,931	11,509	89.00
47	ㅂ-ㅈ	7,068	6,280	88.85
48	ㅁ-ㅊ	4,283	3,804	88.82
49	ㄷ-ㅌ	2,863	2,540	88.72
50	ㅁ-ㅍ	3,175	2,810	88.50
51	ㅃ-ㅍ	459	406	88.45
52	ㄱ-ㅈ	9,978	8,824	88.43
53	ㄷ-ㅊ	3,581	3,162	88.30
54	ㄱ-ㄲ	1,524	1,345	88.25
55	ㄴ-ㅁ	4,401	3,882	88.21
56	ㅂ-ㅆ	796	702	88.19
57	ㅂ-ㅎ	4,810	4,241	88.17
58	ㄷ-ㄸ	919	810	88.14
59	ㅊ-ㅎ	3,774	3,323	88.05
60	ㄱ-ㅎ	8,826	7,771	88.05
61	ㅅ-ㅆ	993	874	88.02
62	ㄴ-ㅎ	4,034	3,540	87.75
63	ㅁ-ㅅ	6,685	5,862	87.69
64	ㄱ-ㅁ	8,140	7,135	87.65
65	ㄲ-ㅊ	744	652	87.63
66	ㅍ-ㅎ	2,820	2,471	87.62
67	ㅂ-ㅃ	1,381	1,210	87.62
68	ㅅ-ㅎ	5,530	4,822	87.20
69	ㄲ-ㄸ	576	502	87.15
70	ㅈ-ㅎ	5,374	4,683	87.14
71	ㄷ-ㅈ	5,328	4,636	87.01
72	ㄷ-ㅅ	5,415	4,710	86.98
73	ㅉ-ㅍ	528	459	86.93
74	ㄱ-ㄷ	5,777	5,014	86.79
75	ㅁ-ㅈ	5,792	5,027	86.79
76	ㅁ-ㅌ	2,149	1,860	86.55
77	ㄱ-ㅋ	1,225	1,059	86.45
78	ㄸ-ㅆ	849	732	86.22
79	ㄱ-ㅆ	928	800	86.21
80	ㄹ-ㅍ	1,036	893	86.20
81	ㄹ-ㅌ	640	551	86.09
82	ㅃ-ㅌ	277	238	85.92
83	ㄴ-ㄹ	1,652	1,418	85.84
84	ㄹ-ㅂ	1,851	1,588	85.79
85	ㄴ-ㅋ	475	407	85.68
86	ㄷ-ㅎ	3,760	3,218	85.59
87	ㄱ-ㄹ	3,082	2,632	85.40
88	ㄲ-ㅁ	499	426	85.37
89	ㅆ-ㅈ	613	523	85.32
90	ㅂ-ㅋ	603	514	85.24
91	ㄲ-ㄴ	364	310	85.16
92	ㄸ-ㅋ	121	103	85.12
93	ㄲ-ㅅ	671	571	85.10
94	ㄲ-ㄹ	318	270	84.91
95	ㄷ-ㅁ	3,804	3,224	84.75
96	ㄷ-ㅍ	1,990	1,685	84.67
97	ㅁ-ㅎ	4,632	3,914	84.50
98	ㅈ-ㅉ	1,171	988	84.37
99	ㅁ-ㅆ	595	502	84.37
100	ㄹ-ㅊ	1,291	1,089	84.35
101	ㅃ-ㅊ	600	506	84.33
102	ㄹ-ㅎ	1,543	1,300	84.25
103	ㄲ-ㅈ	659	555	84.22
104	ㄹ-ㅈ	1,557	1,310	84.14
105	ㄹ-ㅆ	525	441	84.00
106	ㄹ-ㅁ	1,861	1,559	83.77
107	ㄲ-ㅂ	547	458	83.73
108	ㄸ-ㄹ	411	344	83.70
109	ㄸ-ㅊ	935	780	83.42
110	ㄲ-ㅎ	562	468	83.27
111	ㄹ-ㅉ	508	423	83.27
112	ㄸ-ㅂ	583	485	83.19
113	ㄸ-ㅉ	951	791	83.18
114	ㅉ-ㅎ	397	330	83.12
115	ㄴ-ㅆ	253	210	83.00
116	ㅂ-ㅉ	649	538	82.90
117	ㄱ-ㅉ	760	630	82.89
118	ㅋ-ㅍ	640	528	82.50
119	ㄹ-ㅅ	1,504	1,240	82.45
120	ㄹ-ㅋ	586	480	81.91
121	ㄸ-ㅈ	724	592	81.77
122	ㅅ-ㅋ	505	410	81.19
123	ㅋ-ㅌ	311	252	81.03
124	ㄴ-ㄸ	305	247	80.98
125	ㅆ-ㅎ	403	326	80.89
126	ㅁ-ㅋ	539	435	80.71
127	ㄴ-ㅉ	243	196	80.66
128	ㄸ-ㅍ	482	386	80.08
129	ㅊ-ㅋ	423	337	79.67
130	ㅃ-ㅎ	290	231	79.66
131	ㅁ-ㅉ	589	468	79.46
132	ㄷ-ㄹ	930	736	79.14
133	ㄸ-ㅁ	498	392	78.71
134	ㄷ-ㅆ	360	283	78.61
135	ㄱ-ㄸ	673	529	78.60
136	ㄲ-ㄷ	403	315	78.16
137	ㅅ-ㅉ	611	473	77.41
138	ㄸ-ㅅ	561	434	77.36
139	ㄷ-ㅋ	362	280	77.35
140	ㅆ-ㅋ	176	135	76.70
141	ㅁ-ㅃ	350	268	76.57
142	ㅃ-ㅋ	89	68	76.40
143	ㄸ-ㅎ	419	319	76.13
144	ㅈ-ㅋ	497	378	76.06
145	ㅋ-ㅎ	2,043	1,551	75.92
146	ㅃ-ㅅ	434	329	75.81
147	ㄱ-ㅃ	383	289	75.46
148	ㄷ-ㅉ	505	380	75.25
149	ㄷ-ㅃ	250	187	74.80
150	ㄴ-ㅃ	218	163	74.77
151	ㄹ-ㅃ	114	84	73.68
152	ㅃ-ㅈ	384	277	72.14
153	ㅉ-ㅋ	121	83	68.60

Download Excel Table