표 6 / Table 6 코퍼스 반영 오류율 추정 / Corpus-based error estimation

범주 테스트셋오류율(%) 테스트셋 NSW 분포율(%) 전체 도메인 NSW 분포율(%) 추정오류율(%)
약어/두문문자 3.00 14.45 16.20 3.36
기수 1.60 43.24 38.40 1.42
소수 1.60 1.81 1.30 1.15
분수 1.80 0.10 0.20 3.60
서수 1.40 3.05 2.40 1.10
로마숫자 1.00 0.97 2.00 2.06
시간 2.80 1.66 1.20 2.02
날짜 1.10 20.81 22.70 1.20
단위/도량형 2.70 11.76 8.80 2.02
기타 숫자 1.20 0.19 0.30 1.89
기호 1.40 1.75 6.20 4.96
MISC 0.10 0.21 0.30 0.14
Average/total 1.64 100.00 100.00 2.08