표 4 /Table 4 테스트셋 구성 / Statistics of the test set

범주 문장 수 토큰 수 NSW 토큰 수
약어/두문문자 80 1,494 252
기수 80 1,532 326
소수 76 1,578 161
분수 44 901 49
서수 70 1,343 75
로마숫자 70 1,322 100
시간 70 1,248 128
날짜 70 1,437 190
단위/도량형 93 1,648 174
기타 숫자 207 3,887 242
기호 70 1,366 372
기타 70 1,172 72
Total 1,000 18,928 2,141