Standard Error
이제, AUC값의 신뢰성을 측정하기 위해서는 SE(standard Error)를 계산하는 것이 필요하다. 이는 DeLong(1988)이 제시한 방법을 참고하자.
ξ를 각각의 집단 간 공분산이라 하자.
ξ₁₀은 \(C_1\)의 \(X_i\)와 \(C_2\)의 \(Y_j, Y_k\)간 공분산,
ξ₀₁은 \(C_2\)의 \(Y_j\)와 \(C_1\)의 \(X_i, Y_k\)간 공분산,
ξ₁₁은 \(C_1\)의 \(X_i\)와 \(C_2\)의 \(Y_j\)간 자기공분산이다.
ξ₁₀, ξ₀₁, ξ₁₁의 기대값은 아래와 같다.
\[
ξ_{10} = E[\psi(X_i, Y_j) \psi(X_i,Y_k)]-\theta^2,
\]
\[
ξ_{01} = E[\psi(X_i, Y_j) \psi(X_k,Y_j)]-\theta^2,
\]
\[
ξ_{11} = E[\psi(X_i, Y_j) \psi(X_i,Y_j)]-\theta^2,
\]
기댓값들을 이용하여 AUC 추정치의 분산을 계산할 수 있다.
\[
var(\hat{\theta}) = \frac{(n-1)ξ_{10}+(m-1)ξ_{01}}{mn} + \frac{ξ_{11}}{mn}
\]
이와 같은 방법으로 단일 표본 집합에서의 AUC의 표준 오차를 구할 수 있다.
- 이제, 단일 표본 집합이 아닌 다른 표본집합 r과 s에 대해 다뤄보자. 여러 표본 집합이 있을 경우, 각 표본 간의 상호 공분산 또한 고려되어야한다. 두 표본 집합 r과 s에 대해 AUC의 공분산 계산은 아래와 같다.
\[
ξ_{10}^{rs} = E[\psi(X_i^r, Y_j^r) \psi(X_i^s,Y_k^s)]-\theta^r \theta^s,
\]
\[
ξ_{01}^{rs} = E[\psi(X_i^r, Y_j^r) \psi(X_i^s,Y_k^s)]-\theta^r \theta^s,
\]
\[
ξ_{11}^{rs} = E[\psi(X_i^r, Y_j^r) \psi(X_i^s,Y_k^s)]-\theta^r \theta^s,
\]
이제, 아래 식을 통해 표본 집합의 AUC 값 간의 공분산을 계산할 수 있다.
\[
cov(\hat{\theta^r},\hat{\theta^s}) = \frac{(n-1)ξ_{10}^{rs}+(m-1)ξ_{01}^{rs}}{mn} + \frac{ξ_{11}^{rs}}{mn}
\] 이 수식을 통해 여러 표본 집합 간의 공분산을 반영하여 AUC의 표준 오차를 더 정확하게 추정할 수 있다.
- 이를 바탕으로 우리가 궁금한 값 “표준 오차”에 접근해 보자. (Hoeffding_1948, Bamber_1975, Sen_1960)과 같은 분들 덕분에, 우리는 AUC 표준 오차를 보다 정확히 추정할 수 있다.
\[
V^r_{10}(X_i) = \frac{1}{n} \sum_{j=1}^n\psi(X_i^r,Y_j^r)\ \ \ \ \ (i= 1,2,...,m)
\]
\[
V^r_{01}(Y_j) = \frac{1}{m} \sum_{i=1}^m\psi(X_i^r,Y_j^r)\ \ \ \ \ (j= 1,2,...,m)
\]
-
\(V^r_{10}(X_i)\)은 집합r에서 값을 기반으로 한 분산이다.
\(\psi(X_i^r,Y_j^r)\)는 \(X_i^r,Y_j^r\)의 관계를 나타내며, 이를 통해 분산을 구한다. \(V^r_{01}(Y_j)\)은 집합 \(Y^r_j\)에서의 분산이다.
두 값을 통해 각 표본 집합에 대한 분산을 따로 계산한 후, 이를 결합하여 최종적으로 표준 오차를 추정할 수 있다. 각 분산 값이 표본 크기에 따라 가중평균되며, AUC 표준 오차 S는 아래와 같다.
\[
\\
S = \frac{1}{m}S_{10} + \frac{1}{n}S_{01}
\\
\]
표준 오차를 통해 우리는 AUC 값이 얼마나 신뢰할 수 있는지 평가할 수 있으며, 이는 모델의 성능을 명확히 이해하는데 중요한 역할을 한다.