Classification Evaluation Metrics

Classification Evaluation Metrics

deep learning/computer vision 2024. 2. 9. 14:34
Confusion Matrix(혼동 행렬, 오차 행렬)

분류 모델(classifier)의 성능을 측정하는 데 자주 사용되는 표로 모델이 두 개의 클래스를 얼마나 헷갈려하는지 알 수 있다.

T(True): 예측한 것이 정답

F(False): 예측한 것이 오답

P(Positive): 모델이 positive라고 예측

N(Negative): 모델이 negative라고 예측

TP(True Positive): 모델이 positive라고 예측했는데 실제로 정답이 positive (정답)

TN(True Negative): 모델이 negative라고 예측했는데 실제로 정답이 negative (정답)

FP(False Positive): 모델이 positive라고 예측했는데 실제로 정답이 negative (오답)

FN(False Negative): 모델이 negative라고 예측했는데 실제로 정답이 positive (오답)

Accuracy(정확도)

모델이 전체 문제 중에서 정답을 맞춘 비율

하지만 데이터가 불균형할 때(ex) positive:negative=9:1)는 Accuracy만으로 제대로 분류했는지는 알 수 없기 때문에 Recall과 Precision을 사용한다.

0 ~ 1 사이의 값을 가지며, 1에 가까울수록 좋다.

$A c c u r a c y = \frac{T P + T N}{T P + T N + F P + F N}$

Precision(정밀도) = PPV(Positive Predictive Value)

모델이 positive라고 예측한 것들 중에서 실제로 정답이 positive인 비율로, 참으로 예측한 것의 정답 비율

실제 정답이 negative인 데이터를 positive라고 잘못 예측하면 안 되는 경우에 중요한 지표가 될 수 있다.

Precision을 높이기 위해선 FP(모델이 positive라고 예측했는데 정답은 negative인 경우)를 낮추는 것이 중요하다.

0 ~ 1 사이의 값을 가지며, 1에 가까울수록 좋다.

$Precision=TPTP+FP<math xmlns="http://www.w3.org/1998/Math/MathML"><mi>P</mi><mi>r</mi><mi>e</mi><mi>c</mi><mi>i</mi><mi>s</mi><mi>i</mi><mi>o</mi><mi>n</mi><mo>=</mo><mrow data-mjx-texclass="ORD"><mfrac><mrow><mi>T</mi><mi>P</mi></mrow><mrow><mi>T</mi><mi>P</mi><mo>+</mo><mi>F</mi><mi>P</mi></mrow></mfrac></mrow></math>$

Recall(재현율) = Sensitivity(민감도) = TPR(True Positive Rate)

실제로 정답이 positive인 것들 중에서 모델이 positive라고 예측한 비율이다.

실제 정답이 positive인 데이터를 negative라고 잘못 예측하면 안 되는 경우에 중요한 지표가 될 수 있다.

Recall를 높이기 위해선 FN(모델이 negative라고 예측했는데 정답이 positive인 경우)을 낮추는 것이 중요하다.

0 ~ 1 사이의 값을 가지며, 1에 가까울수록 좋다.

$Recall=TPTP+FN<math xmlns="http://www.w3.org/1998/Math/MathML"><mi>R</mi><mi>e</mi><mi>c</mi><mi>a</mi><mi>l</mi><mi>l</mi><mo>=</mo><mrow data-mjx-texclass="ORD"><mfrac><mrow><mi>T</mi><mi>P</mi></mrow><mrow><mi>T</mi><mi>P</mi><mo>+</mo><mi>F</mi><mi>N</mi></mrow></mfrac></mrow></math>$

F1 score

Recall과 Precision의 조화평균이다.

Recall과 Precision은 상호 보완적인 평가 지표이기 때문에 F1 score를 사용한다.

Precision과 Recall이 한쪽으로 치우쳐지지 않고 모두 클 때 큰 값을 가진다.

0 ~ 1 사이의 값을 가지며, 1에 가까울수록 좋다.

$F1Score=2∗Precision∗RecallPrecision+Recall<math xmlns="http://www.w3.org/1998/Math/MathML"><mi>F</mi><mn>1</mn><mi>S</mi><mi>c</mi><mi>o</mi><mi>r</mi><mi>e</mi><mo>=</mo><mrow data-mjx-texclass="ORD"><mfrac><mrow><mn>2</mn><mo>∗</mo><mi>P</mi><mi>r</mi><mi>e</mi><mi>c</mi><mi>i</mi><mi>s</mi><mi>i</mi><mi>o</mi><mi>n</mi><mo>∗</mo><mi>R</mi><mi>e</mi><mi>c</mi><mi>a</mi><mi>l</mi><mi>l</mi></mrow><mrow><mi>P</mi><mi>r</mi><mi>e</mi><mi>c</mi><mi>i</mi><mi>s</mi><mi>i</mi><mi>o</mi><mi>n</mi><mo>+</mo><mi>R</mi><mi>e</mi><mi>c</mi><mi>a</mi><mi>l</mi><mi>l</mi></mrow></mfrac></mrow></math>$

기타

그 외에도 Error Rate, Specificity, Fall Out 등이 있다.

Error Rate(오분류율)

모델이 전체 데이터에서 잘못 맞춘 비율이다.

$ErrorRate=FP+FNTP+TN+FP+FN<math xmlns="http://www.w3.org/1998/Math/MathML"><mi>E</mi><mi>r</mi><mi>r</mi><mi>o</mi><mi>r</mi><mi>R</mi><mi>a</mi><mi>t</mi><mi>e</mi><mo>=</mo><mrow data-mjx-texclass="ORD"><mfrac><mrow><mi>F</mi><mi>P</mi><mo>+</mo><mi>F</mi><mi>N</mi></mrow><mrow><mi>T</mi><mi>P</mi><mo>+</mo><mi>T</mi><mi>N</mi><mo>+</mo><mi>F</mi><mi>P</mi><mo>+</mo><mi>F</mi><mi>N</mi></mrow></mfrac></mrow></math>$

Specificity(특이도) = TNR(True Negative Rate)

실제 정답이 negative인 것들 중에서 모델이 negative라고 예측한 비율이다.

$Specificity=TNTN+FP<math xmlns="http://www.w3.org/1998/Math/MathML"><mi>S</mi><mi>p</mi><mi>e</mi><mi>c</mi><mi>i</mi><mi>f</mi><mi>i</mi><mi>c</mi><mi>i</mi><mi>t</mi><mi>y</mi><mo>=</mo><mrow data-mjx-texclass="ORD"><mfrac><mrow><mi>T</mi><mi>N</mi></mrow><mrow><mi>T</mi><mi>N</mi><mo>+</mo><mi>F</mi><mi>P</mi></mrow></mfrac></mrow></math>$

Fall Out(위양성률) = FPR(False Positive Rate)

실제 정답이 negative인 것들 중에서 모델이 positive라고 예측한 비율이다.

$FallOut=1−Specificity=1−TnTN+FP=FPFP+TN<math xmlns="http://www.w3.org/1998/Math/MathML"><mi>F</mi><mi>a</mi><mi>l</mi><mi>l</mi><mi>O</mi><mi>u</mi><mi>t</mi><mo>=</mo><mrow data-mjx-texclass="ORD"><mn>1</mn><mo>−</mo><mi>S</mi><mi>p</mi><mi>e</mi><mi>c</mi><mi>i</mi><mi>f</mi><mi>i</mi><mi>c</mi><mi>i</mi><mi>t</mi><mi>y</mi></mrow><mo>=</mo><mrow data-mjx-texclass="ORD"><mfrac><mrow><mn>1</mn><mo>−</mo><mi>T</mi><mi>n</mi></mrow><mrow><mi>T</mi><mi>N</mi><mo>+</mo><mi>F</mi><mi>P</mi></mrow></mfrac></mrow><mo>=</mo><mrow data-mjx-texclass="ORD"><mfrac><mrow><mi>F</mi><mi>P</mi></mrow><mrow><mi>F</mi><mi>P</mi><mo>+</mo><mi>T</mi><mi>N</mi></mrow></mfrac></mrow></math>$

Multi classification의 Evaluation Method

Macro와 Micro의 개념을 사용할 수 있는데,

Macro : 모든 클래스의 평가 지표를 계산한 다음 평균을 활용하여 전체 결과값 도출

Micro : 개별 클래스의 평가 지표를 계산한 다음 이를 활용하여 전체 결과값 도출

Macro Precision

$MacroPrecision=1C∗∑Ci=1Precisioni<math xmlns="http://www.w3.org/1998/Math/MathML"><mi>M</mi><mi>a</mi><mi>c</mi><mi>r</mi><mi>o</mi><mi>P</mi><mi>r</mi><mi>e</mi><mi>c</mi><mi>i</mi><mi>s</mi><mi>i</mi><mi>o</mi><mi>n</mi><mo>=</mo><mrow data-mjx-texclass="ORD"><mfrac><mn>1</mn><mi>C</mi></mfrac></mrow><mo>∗</mo><mrow data-mjx-texclass="ORD"><munderover><mo data-mjx-texclass="OP">∑</mo><mrow data-mjx-texclass="ORD"><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>C</mi></munderover><mi>P</mi><mi>r</mi><mi>e</mi><mi>c</mi><mi>i</mi><mi>s</mi><mi>i</mi><mi>o</mi><msub><mi>n</mi><mi>i</mi></msub></mrow></math>$

Macro Recall

$MacroRecall=1C∗∑Ci=1Recalli<math xmlns="http://www.w3.org/1998/Math/MathML"><mi>M</mi><mi>a</mi><mi>c</mi><mi>r</mi><mi>o</mi><mi>R</mi><mi>e</mi><mi>c</mi><mi>a</mi><mi>l</mi><mi>l</mi><mo>=</mo><mrow data-mjx-texclass="ORD"><mfrac><mn>1</mn><mi>C</mi></mfrac></mrow><mo>∗</mo><mrow data-mjx-texclass="ORD"><munderover><mo data-mjx-texclass="OP">∑</mo><mrow data-mjx-texclass="ORD"><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>C</mi></munderover><mi>R</mi><mi>e</mi><mi>c</mi><mi>a</mi><mi>l</mi><msub><mi>l</mi><mi>i</mi></msub></mrow></math>$

Macro F1 Score

$MacroF1Score=1C∗∑Ci=1F1Scorei<math xmlns="http://www.w3.org/1998/Math/MathML"><mi>M</mi><mi>a</mi><mi>c</mi><mi>r</mi><mi>o</mi><mi>F</mi><mn>1</mn><mi>S</mi><mi>c</mi><mi>o</mi><mi>r</mi><mi>e</mi><mo>=</mo><mrow data-mjx-texclass="ORD"><mfrac><mn>1</mn><mi>C</mi></mfrac></mrow><mo>∗</mo><mrow data-mjx-texclass="ORD"><munderover><mo data-mjx-texclass="OP">∑</mo><mrow data-mjx-texclass="ORD"><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>C</mi></munderover><mi>F</mi><mn>1</mn><mi>S</mi><mi>c</mi><mi>o</mi><mi>r</mi><msub><mi>e</mi><mi>i</mi></msub></mrow></math>$

Micro Precision

$MicroPrecision=∑Ci=1TPi∑Ci=1(TPi+FPi)<math xmlns="http://www.w3.org/1998/Math/MathML"><mi>M</mi><mi>i</mi><mi>c</mi><mi>r</mi><mi>o</mi><mi>P</mi><mi>r</mi><mi>e</mi><mi>c</mi><mi>i</mi><mi>s</mi><mi>i</mi><mi>o</mi><mi>n</mi><mo>=</mo><mrow data-mjx-texclass="ORD"><mfrac><mrow><munderover><mo data-mjx-texclass="OP">∑</mo><mrow data-mjx-texclass="ORD"><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>C</mi></munderover><mi>T</mi><msub><mi>P</mi><mi>i</mi></msub></mrow><mrow><munderover><mo data-mjx-texclass="OP">∑</mo><mrow data-mjx-texclass="ORD"><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>C</mi></munderover><mo stretchy="false">(</mo><mi>T</mi><msub><mi>P</mi><mi>i</mi></msub><mo>+</mo><mi>F</mi><msub><mi>P</mi><mi>i</mi></msub><mo stretchy="false">)</mo></mrow></mfrac></mrow></math>$

Micro Recall

$MicroRecall=∑Ci=1TPi∑Ci=1(TPi+FNi)<math xmlns="http://www.w3.org/1998/Math/MathML"><mi>M</mi><mi>i</mi><mi>c</mi><mi>r</mi><mi>o</mi><mi>R</mi><mi>e</mi><mi>c</mi><mi>a</mi><mi>l</mi><mi>l</mi><mo>=</mo><mrow data-mjx-texclass="ORD"><mfrac><mrow><munderover><mo data-mjx-texclass="OP">∑</mo><mrow data-mjx-texclass="ORD"><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>C</mi></munderover><mi>T</mi><msub><mi>P</mi><mi>i</mi></msub></mrow><mrow><munderover><mo data-mjx-texclass="OP">∑</mo><mrow data-mjx-texclass="ORD"><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>C</mi></munderover><mo stretchy="false">(</mo><mi>T</mi><msub><mi>P</mi><mi>i</mi></msub><mo>+</mo><mi>F</mi><msub><mi>N</mi><mi>i</mi></msub><mo stretchy="false">)</mo></mrow></mfrac></mrow></math>$

Micro F1 Score

$MicromF1Score=2∗MicroPrecision∗MicroRecallMicroPrecision∗MicroRecall<math xmlns="http://www.w3.org/1998/Math/MathML"><mi>M</mi><mi>i</mi><mi>c</mi><mi>r</mi><mi>o</mi><mi>m</mi><mi>F</mi><mn>1</mn><mi>S</mi><mi>c</mi><mi>o</mi><mi>r</mi><mi>e</mi><mo>=</mo><mrow data-mjx-texclass="ORD"><mfrac><mrow><mn>2</mn><mo>∗</mo><mi>M</mi><mi>i</mi><mi>c</mi><mi>r</mi><mi>o</mi><mi>P</mi><mi>r</mi><mi>e</mi><mi>c</mi><mi>i</mi><mi>s</mi><mi>i</mi><mi>o</mi><mi>n</mi><mo>∗</mo><mi>M</mi><mi>i</mi><mi>c</mi><mi>r</mi><mi>o</mi><mi>R</mi><mi>e</mi><mi>c</mi><mi>a</mi><mi>l</mi><mi>l</mi></mrow><mrow><mi>M</mi><mi>i</mi><mi>c</mi><mi>r</mi><mi>o</mi><mi>P</mi><mi>r</mi><mi>e</mi><mi>c</mi><mi>i</mi><mi>s</mi><mi>i</mi><mi>o</mi><mi>n</mi><mo>∗</mo><mi>M</mi><mi>i</mi><mi>c</mi><mi>r</mi><mi>o</mi><mi>R</mi><mi>e</mi><mi>c</mi><mi>a</mi><mi>l</mi><mi>l</mi></mrow></mfrac></mrow></math>$
저작자표시 비영리 변경금지

'deep learning > computer vision' 카테고리의 다른 글

ResNet-101 Classification 실습 연습 (0) 2024.02.11

Classficiation Model Outline (0) 2024.02.10
관련글 관련글 더보기
- ResNet-101 Classification 실습 연습
- Classficiation Model Outline
......

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

인기포스트

ABOUT ME

... ...

Confusion Matrix(혼동 행렬, 오차 행렬)

Accuracy(정확도)

Precision(정밀도) = PPV(Positive Predictive Value)

Recall(재현율) = Sensitivity(민감도) = TPR(True Positive Rate)

F1 score

기타

Error Rate(오분류율)

Specificity(특이도) = TNR(True Negative Rate)

Fall Out(위양성률) = FPR(False Positive Rate)

Multi classification의 Evaluation Method

Macro Precision

Macro Recall

Macro F1 Score

Micro Precision

Micro Recall

Micro F1 Score

'deep learning > computer vision' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

ResNet-101 Classification 실습 연습 (0)	2024.02.11
Classficiation Model Outline (0)	2024.02.10

인기포스트

ABOUT ME

Confusion Matrix(혼동 행렬, 오차 행렬)

Accuracy(정확도)

Precision(정밀도) = PPV(Positive Predictive Value)

Recall(재현율) = Sensitivity(민감도) = TPR(True Positive Rate)

F1 score

기타

Error Rate(오분류율)

Specificity(특이도) = TNR(True Negative Rate)

Fall Out(위양성률) = FPR(False Positive Rate)

Multi classification의 Evaluation Method

Macro Precision

Macro Recall

Macro F1 Score

Micro Precision

Micro Recall

Micro F1 Score

'deep learning > computer vision' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역