본문 바로가기

인공지능 AI

(30)
Semantic segmentation과 Instance segmentation의 차이 컴퓨터 비전에는 크게 4가지의 과제가 있다. 1. Classification 2. Object Detection 3. Image Segmentation 4. Visual relationship 이 글에서는 이 중 3. Image Segmentation에 관해 다룰 예정이다. 먼저 Image Segmentation 이전의 과제들인 Classification과 Object Detection에 대해 간단히 설명하자면 Classification은 Image가 주어졌을때 이 이미지가 어떤 사진인지, 어떤 Object를 대표하는지 분류하는 문제이다. 따라서 위 그림에서 고양이의 위치가 아래 예시와 같이 변하여도 Classification에서는 똑같이 고양이라고 분류해야한다. 이를 "translation invari..
translation invariance 설명 및 정리 translation invariance를 설명하기 위해 먼저 Classification에 대해 살펴보자. Classification은 Image가 주어졌을때 이 이미지가 어떤 사진인지, 어떤 Object를 대표하는지 분류하는 문제이다. 따라서 아래 그림에서과 같이 고양이의 위치가 변하여도 Classification에서는 똑같이 고양이라고 분류해야한다. 이를 "translation invariance" 라고 한다. "CNN에서 translation invariance란 input의 위치가 달라져도 output이 동일한 값을 갖는것을 말한다" 사실 CNN 네트워크 자체는 translation equivariance(variance)하다. convolution filter로 연산을 할때 특정 feature의..
(논문리뷰&재구현) YOLACT 설명 및 정리 - (1) Image segmentation은 각 object에 대해 localization을 수행해야하므로 translation variance를 만족해야한다. (Image segmentation과 translation variance에 대한 설명은 아래 게시글에서 설명한다.) Semantic segmentation과 Instance segmentation의 차이 Semantic segmentation과 Instance segmentation의 차이 컴퓨터 비전에는 크게 4가지의 과제가 있다. 1. Classification 2. Object Detection 3. Image Segmentation 4. Visual relationship 이 글에서는 이 중 3. Image Segmentation에 관해 다룰 예..
(논문리뷰) ResNet 설명 및 정리 이전의 연구들로 모델의 layer가 너무 깊어질수록 오히려 성능이 떨어지는 현상이 생김을 밝혀냈다. 이는 gradient vanishing/exploding 문제 때문에 학습이 잘 이루어지지 않기 때문이다. gradient vanishing이란 layer가 깊어질수록 미분을 점점 많이 하기 때문에 backpropagation을 해도 앞의 layer일수록 미분값이 작아져 그만큼 output에 영향을 끼치는 weight 정도가 작아지는 것을 말한다. 이는 overfitting과는 다른 문제인데 overfitting은 학습 데이터에 완벽하게 fitting시킨 탓에 테스트 성능에서는 안 좋은 결과를 보임을 뜻하고 위와 같은 문제는 Degradation 문제로 training data에도 학습이 되지 않음을 뜻한..
(논문리뷰&재구현) Mask R-CNN 설명 및 정리 이전글 : (논문리뷰) Faster R-CNN 설명 및 정리 Faster R-CNN 설명 및 정리 이전글 : Fast R-CNN 설명 및 정리 Fast R-CNN 설명 및 정리 이전글 : Object Detection, R-CNN 설명 및 정리 Object Detection, R-CNN 설명 및 정리 컴퓨터비전에서의 문제들은 크게 다음 4가지로 분류할 수 있다.. ganghee-lee.tistory.com 컴퓨터 비전의 주요 과제 3가지 1) Classification 2) Object detection 3) Image segmentation 중 Faster R-CNN까지는 2-stage에 기초한 특히 2) Object detection 를 위해 고안된 모델들이였다. 이번에 설명할 Mask R-CNN은 ..
GAP(Global Average Pooling) vs FCN(Fully Convolutional Network) Fully convolutional network란 1x1 convolution layer을 말한다. 일반적으로 Classification에서 Conv-Pool layer를 통과한 후 마지막에 Fully Connected Layer를 거쳐 softmax함수로 classification이 진행된다. 위와같이 일반적으로 한 이미지에 대해 classification의 경우에는 이와 같은 진행방식이 문제가 되지 않는다. 그러나 object detection과 같이 classification과 localization 둘을 수행해야 할 경우 문제가 된다. FC layer에서 위치 정보를 담고있던 conv feature map이 dense하게 쫙 펴지기 때문에 위치정보를 모두 손실하고 만다. 따라서 이 문제점을 해결..
Train / Test / Validation set의 차이 딥러닝에서 신경망 모델을 학습하고 평가하기 위해 dataset이 필요하다. 이때 dataset을 성질에 맞게 보통 다음 3가지로 분류한다. 1. Train set 2. Validation set 3. Test set 이렇게 각각 모델을 학습하고 검증하고 평가하는데에 목적을 서로 다르게 두고있다. 이 세가지 dataset이 정확히 무엇이고 어떤 성질을 띄는지 살펴보자. 모델을 학습하기 위한 dataset이다. 한 가지 계속 명심해야할 중요한 사실은 "모델을 학습하는데에는 오직 유일하게 Train dataset만 이용한다" 보통 train set을 이용해 각기 다른 모델을 서로 다른 epoch로 학습을 시킨다. 여기서 각기 다른 모델이란 hidden layer 혹은 hyper parameter에 약간씩 변화..
(논문리뷰&재구현) Faster R-CNN 설명 및 정리 이전글 : (논문리뷰) Fast R-CNN 설명 및 정리 Fast R-CNN 설명 및 정리 이전글 : Object Detection, R-CNN 설명 및 정리 Object Detection, R-CNN 설명 및 정리 컴퓨터비전에서의 문제들은 크게 다음 4가지로 분류할 수 있다. 1. Classification 2. Object Detection 3. Image Segmenta.. ganghee-lee.tistory.com R-CNN에서는 3가지 모듈 (region proposal, classification, bounding box regression)을 각각 따로따로 수행한다. (1)region proposal 추출 → 각 region proposal별로 CNN 연산 → (2)classification..