deep learning
-
[review] YOLOV1 (2015)deep learning/paper review 2024. 2. 19. 12:09
You Only Look Once : Unified, Real-Time Object Detection 논문 링크 : [1506.02640] You Only Look Once: Unified, Real-Time Object Detection (arxiv.org) Abstract YOLOv1은 object detection을 regression의 관점에서 접근한다. (bounding box의 존재, class probability) (이전의 object detection 연구는 classifier가 detection을 수행하는 방식으로 작업) 단일 신경망 구조를 갖고 있으며, 전체 데이터에 대한 한번의 연산을 통해 bounding box와 class probabilities를 predict하는 모델로, en..
-
[review] GoogLeNet (2014)deep learning/paper review 2024. 2. 13. 21:06
Going deeper with convolutions 논문을 Review 해보려고 한다. Abstract Inception이라는 codename의 deep convolution neural network는 classficiation과 detection 모델로서 제안되었다. 주 특징은 네트워크 내부의 computing reosource들을 향상된 방식으로 활용하는 것으로, computational budget을 변화시키지 않으면서 깊이와 너비를 확장시키는 방법으로 달성되었다. Architecture는 Hebbian Principle과 multi-scale processing의 아이디어가 적용되었다. Hebbian Principle? - 뉴런 간의 연결 강도가 동시에 활성화되는 경우 강화된다는 학습 원칙으..
-
ResNet-101 Classification 실습 연습deep learning/computer vision 2024. 2. 11. 23:53
Computer Vision에서의 classification model들에 대한 outline을 검토하면서, 대표적인 모델인 ResNet-101을 활용하여 CIFAR10 데이터셋에 대한 기본적인 classification 모델을 실습해보고자 한다. PyTorch를 활용하여 Classfication 학습 및 테스트 모델을 만들어보면서, 모델 구축에 사용되는 PyTorch 문법을 연습해보고, Classification Model의 전체적인 Architecture를 학습하고, 주요 Hyper-Parameter들에 대한 조정을 통한 성능 변화 여부 검토, Loss Function 및 Optimizer에 대한 분석을 진행해보려고 한다. Classification Model Architecture는 크게 6단계로 ..
-
Classficiation Model Outlinedeep learning/computer vision 2024. 2. 10. 21:38
Conputer Vision에 있어 주요 Classification Model들의 탄생 배경과 특징, architecture 구성과 의의 및 한계에 대해서 간단하게 요약해보고자 한다. 주요 model에 대해서는 paper review를 통해 자세하게 분석하고, 코드 리뷰까지 해보려고 한다. Annotiation 데이터 집합의 데이터 정보 또는 레이블을 추가하는 프로레스 (데이터에 대한 추가 정보를 제공하는 것) 종류 : bounding box, keypoint, segmentaiton bounding box : 이미지 내 개체의 위치 및 크기를 정의 keypoint : joint 혹은 landmark와 같은 개채 내의 특정 관심 지점을 표시 segmentation : 이미지 내 객체의 경계를 포함하는 것..
-
Classification Evaluation Metricsdeep learning/computer vision 2024. 2. 9. 14:34
Confusion Matrix(혼동 행렬, 오차 행렬) 분류 모델(classifier)의 성능을 측정하는 데 자주 사용되는 표로 모델이 두 개의 클래스를 얼마나 헷갈려하는지 알 수 있다. T(True): 예측한 것이 정답 F(False): 예측한 것이 오답 P(Positive): 모델이 positive라고 예측 N(Negative): 모델이 negative라고 예측 TP(True Positive): 모델이 positive라고 예측했는데 실제로 정답이 positive (정답) TN(True Negative): 모델이 negative라고 예측했는데 실제로 정답이 negative (정답) FP(False Positive): 모델이 positive라고 예측했는데 실제로 정답이 negative (오답) FN(Fa..
-
Auto Encoderdeep learning/generative model 2024. 2. 7. 23:23
1. 개념 입력을 출력으로 복사하는 신경망으로, Encoder를 통해 데이터를 암호화하고, Decoder를 통해 암호화된 데이터를 재출력하는 역할을 수행하는 비지도 학습 모델 2. Auto Encoder 설계 아이디어 PCA(Principal Component Analysis)의 아이디어를 차용한 것으로, 더보기 * PCA 상관관계가 있는 고차원의 자료를 자료의 변동을 최대한 보존하는 고유값과 고유 벡터를 이용하여 저차원의 자료로 변환시키는 분석 기법으로, 차원의 수는 줄이면서 자료의 핵심 attribute만 계승함으로써 데이터의 복잡도를 줄여 computing cost를 절약하고, 데이터의 가장 중요한 변동성을 나타냄으로서 데이터의 탐색과 해석에 도움을 주는 데이터 분석 기법 input data를 x,..
-
-