리스트 예시: 게시물이 존재할 경우 3건을 노출합니다.
-
논문리뷰 and 재구현
(논문리뷰) Particular object retrieval with integral max-pooling of CNN activations 설명 및 정리
Image retrieval task에 대한 최근 SOTA는 Bag-of-Words model (locally invariant한 feature와 large visual codebook)에 의한 접근이였다. 또한 local, global representation들을 이용하여 접근한 연구도 이뤄졌는데 이는 CNN의 중간 layer activation을 feature vector로 사용한 접근이다. 여기서 global max-pooling에 의한 convolution layer activation을 이용하여 image representation을 만들어서 이미지를 서로 비교하는데 global representation만 이용하는 것은 local 위치 정보도 필요로 하는 geometric-aware mode..
-
논문리뷰 and 재구현
(논문리뷰) iCAN : Instance-Centric Attention Network for Human-Object Interaction Detection 설명 및 정리
Object detection은 이미지에서 object에 대해 classification과 localization을 수행한다. 이때 object들간의 interaction에 대해서도 추론해볼 수 있는데 HOI는 object들 중에서도 특히 human과 object간의 interaction을 추론하는 task이다. 이런 HoI task에서는 기본적으로 이 triplet을 찾는 것을 목표로 하고 있다. 최근 연구에서는 human 혹은 object의 appearance가 각각 이미지에서 어떤 부분(region)과 관련있는지에 대한 단서를 담고 있기 때문에 이를 기반으로 attention map을 만들어서 해결하려고 했었다. 정확히는 attention map을 만들기 위해서 human, object의 bound..
-
논문리뷰 and 재구현
(논문리뷰) PointNet : Deep Learning on Point Sets for 3D Classification and Segmentation 설명 및 정리
Object에서 3D data를 받아올때는 이미지에서와 달리 geometric 정보도 담겨있다. 따라서 위 사진과 같이 x, y, z 축의 정보로 이루어진 point 들을 data로 받게된다. 이미지는 행렬로 data가 얻어지는데 각 pixel에 할당된 값은 RGB, 3차원 값이고 여기서 pixel의 geometric 정보는 행렬에서의 위치(ex. (98, 102) = (행, 열) ) 에 대응된다. 하지만 이미지에서와 달리 object에서 depth정보도 받아오는 3d data는 point 들로 data가 얻어진다. 이 point data는 행렬로 이루어져있지 않기 때문에 각 point가 (x, y, z) 축에 대한 data를 가지고 있어야하므로 기본적으로 3차원이다. 여기에 RGB 값이 더해지면 (x,..
-
논문리뷰 and 재구현
(논문리뷰&재구현) YOLACT 설명 및 정리 - (1)
Image segmentation은 각 object에 대해 localization을 수행해야하므로 translation variance를 만족해야한다. (Image segmentation과 translation variance에 대한 설명은 아래 게시글에서 설명한다.) Semantic segmentation과 Instance segmentation의 차이 Semantic segmentation과 Instance segmentation의 차이 컴퓨터 비전에는 크게 4가지의 과제가 있다. 1. Classification 2. Object Detection 3. Image Segmentation 4. Visual relationship 이 글에서는 이 중 3. Image Segmentation에 관해 다룰 예..
-
논문리뷰 and 재구현
(논문리뷰&재구현) Faster R-CNN 설명 및 정리
이전글 : (논문리뷰) Fast R-CNN 설명 및 정리 Fast R-CNN 설명 및 정리 이전글 : Object Detection, R-CNN 설명 및 정리 Object Detection, R-CNN 설명 및 정리 컴퓨터비전에서의 문제들은 크게 다음 4가지로 분류할 수 있다. 1. Classification 2. Object Detection 3. Image Segmenta.. ganghee-lee.tistory.com R-CNN에서는 3가지 모듈 (region proposal, classification, bounding box regression)을 각각 따로따로 수행한다. (1)region proposal 추출 → 각 region proposal별로 CNN 연산 → (2)classification..
-
논문리뷰 and 재구현
(논문리뷰&재구현) Mask R-CNN 설명 및 정리
이전글 : (논문리뷰) Faster R-CNN 설명 및 정리 Faster R-CNN 설명 및 정리 이전글 : Fast R-CNN 설명 및 정리 Fast R-CNN 설명 및 정리 이전글 : Object Detection, R-CNN 설명 및 정리 Object Detection, R-CNN 설명 및 정리 컴퓨터비전에서의 문제들은 크게 다음 4가지로 분류할 수 있다.. ganghee-lee.tistory.com 컴퓨터 비전의 주요 과제 3가지 1) Classification 2) Object detection 3) Image segmentation 중 Faster R-CNN까지는 2-stage에 기초한 특히 2) Object detection 를 위해 고안된 모델들이였다. 이번에 설명할 Mask R-CNN은 ..
갤러리 예시: 게시물이 존재할 경우 4건을 노출합니다.