Classification
-
[review] YOLOV1 (2015)deep learning/paper review 2024. 2. 19. 12:09
You Only Look Once : Unified, Real-Time Object Detection 논문 링크 : [1506.02640] You Only Look Once: Unified, Real-Time Object Detection (arxiv.org) Abstract YOLOv1은 object detection을 regression의 관점에서 접근한다. (bounding box의 존재, class probability) (이전의 object detection 연구는 classifier가 detection을 수행하는 방식으로 작업) 단일 신경망 구조를 갖고 있으며, 전체 데이터에 대한 한번의 연산을 통해 bounding box와 class probabilities를 predict하는 모델로, en..
-
[review] GoogLeNet (2014)deep learning/paper review 2024. 2. 13. 21:06
Going deeper with convolutions 논문을 Review 해보려고 한다. Abstract Inception이라는 codename의 deep convolution neural network는 classficiation과 detection 모델로서 제안되었다. 주 특징은 네트워크 내부의 computing reosource들을 향상된 방식으로 활용하는 것으로, computational budget을 변화시키지 않으면서 깊이와 너비를 확장시키는 방법으로 달성되었다. Architecture는 Hebbian Principle과 multi-scale processing의 아이디어가 적용되었다. Hebbian Principle? - 뉴런 간의 연결 강도가 동시에 활성화되는 경우 강화된다는 학습 원칙으..
-
ResNet-101 Classification 실습 연습deep learning/computer vision 2024. 2. 11. 23:53
Computer Vision에서의 classification model들에 대한 outline을 검토하면서, 대표적인 모델인 ResNet-101을 활용하여 CIFAR10 데이터셋에 대한 기본적인 classification 모델을 실습해보고자 한다. PyTorch를 활용하여 Classfication 학습 및 테스트 모델을 만들어보면서, 모델 구축에 사용되는 PyTorch 문법을 연습해보고, Classification Model의 전체적인 Architecture를 학습하고, 주요 Hyper-Parameter들에 대한 조정을 통한 성능 변화 여부 검토, Loss Function 및 Optimizer에 대한 분석을 진행해보려고 한다. Classification Model Architecture는 크게 6단계로 ..
-
Classficiation Model Outlinedeep learning/computer vision 2024. 2. 10. 21:38
Conputer Vision에 있어 주요 Classification Model들의 탄생 배경과 특징, architecture 구성과 의의 및 한계에 대해서 간단하게 요약해보고자 한다. 주요 model에 대해서는 paper review를 통해 자세하게 분석하고, 코드 리뷰까지 해보려고 한다. Annotiation 데이터 집합의 데이터 정보 또는 레이블을 추가하는 프로레스 (데이터에 대한 추가 정보를 제공하는 것) 종류 : bounding box, keypoint, segmentaiton bounding box : 이미지 내 개체의 위치 및 크기를 정의 keypoint : joint 혹은 landmark와 같은 개채 내의 특정 관심 지점을 표시 segmentation : 이미지 내 객체의 경계를 포함하는 것..
-
Classification Evaluation Metricsdeep learning/computer vision 2024. 2. 9. 14:34
Confusion Matrix(혼동 행렬, 오차 행렬) 분류 모델(classifier)의 성능을 측정하는 데 자주 사용되는 표로 모델이 두 개의 클래스를 얼마나 헷갈려하는지 알 수 있다. T(True): 예측한 것이 정답 F(False): 예측한 것이 오답 P(Positive): 모델이 positive라고 예측 N(Negative): 모델이 negative라고 예측 TP(True Positive): 모델이 positive라고 예측했는데 실제로 정답이 positive (정답) TN(True Negative): 모델이 negative라고 예측했는데 실제로 정답이 negative (정답) FP(False Positive): 모델이 positive라고 예측했는데 실제로 정답이 negative (오답) FN(Fa..