표 1. | Table 1. 각 임베딩 차원에서의 화자 검증 결과(EER, %) | Speaker verification results across each embedding dimension (EER, %)

Model rs VoxCeleb1-O VoxCeleb1-E VoxCeleb1-H Avg.
16-D 32-D 64-D 128-D 256-D 16-D 32-D 64-D 128-D 256-D 16-D 32-D 64-D 128-D 256-D
SDM 3.18 1.53 0.94 0.85 0.80 3.21 1.54 1.09 0.97 0.95 5.80 2.72 1.92 1.75 1.73 1.93
MRL 1.00 2.52 1.47 1.18 0.96 0.96 2.62 1.52 1.20 1.07 1.07 4.61 2.69 2.12 1.91 1.91 1.85
MRL-E 1.00 2.40 1.39 0.99 0.94 0.94 2.58 1.53 1.15 1.09 1.09 4.63 2.68 2.05 1.96 1.96 1.83
PES 0.75 2.20 1.38 1.04 0.89 0.89 2.58 1.50 1.17 1.08 1.08 4.68 2.65 2.08 1.93 1.93 1.81
0.50 2.17 1.29 1.03 0.99 0.98 2.56 1.50 1.17 1.05 1.05 4.62 2.64 2.03 1.88 1.88 1.79
0.25 2.37 1.24 0.97 0.89 0.87 2.54 1.47 1.11 1.03 1.02 4.55 2.59 2.03 1.88 1.87 1.76
PES-E 0.75 2.48 1.52 1.05 0.97 0.97 2.53 1.51 1.15 1.08 1.08 4.58 2.66 2.03 1.92 1.92 1.83
0.50 2.13 1.44 1.01 0.95 0.95 2.51 1.52 1.14 1.10 1.10 4.51 2.61 2.04 1.97 1.97 1.80
0.25 2.12 1.32 1.06 0.92 0.92 2.51 1.49 1.14 1.05 1.05 4.56 2.64 2.04 1.91 1.91 1.78
NES 0.00 2.17 1.31 1.00 0.89 0.90 2.54 1.46 1.12 1.03 1.02 4.59 2.56 2.00 1.87 1.86 1.75
EER, equal error rate; SDM, single-dimensional model; MRL, Matryoshka representation learning; PES, partial element sharing; NES, no element sharing.