본문 바로가기

논문 리뷰

(24)
Emerging Properties in Self-Supervised Vision Transformers 리뷰 Caron, Mathilde, Hugo Touvron, Ishan Misra, Hervé Jégou, Julien Mairal, Piotr Bojanowski, and Armand Joulin. "Emerging properties in self-supervised vision transformers." In Proceedings of the IEEE/CVF international conference on computer vision, pp. 9650-9660. 2021. Dino라고도 알려진 모델의 논문이다. 코드는 https://github.com/facebookresearch/dino 에서 확인 가능하다고 한다. Abstract Convnet에 비해 ViT에서의 self-supervised lea..
Point Transformer V3 : Simpler, Faster, Stronger Wu, Xiaoyang, Li Jiang, Peng-Shuai Wang, Zhijian Liu, Xihui Liu, Yu Qiao, Wanli Ouyang, Tong He, and Hengshuang Zhao. "Point transformer v3: Simpler, faster, stronger." arXiv preprint arXiv:2312.10035 (2023). Point Transformer v1,v2 에 이은 v3가 발표되었다. 24.04.03 날짜의 paperswithcode 사이트 기준 대부분의 Task에서 상위권에 분포하고 있다. Abstract v3에서는 새로운 어텐션을 소개하기 보단 v2에 대한 효율성을 증가시켰다. n=16의 kNN을 대체하여 n=1024의 neighbor mapp..
Point Transformer V2: Grouped Vector Attention and Partition-based Pooling Wu, Xiaoyang, et al. "Point transformer v2: Grouped vector attention and partition-based pooling." Advances in Neural Information Processing Systems 35 (2022): 33330-33342. Point Transformer V2: Grouped Vector Attention and Partition-based Pooling Requests for name changes in the electronic proceedings will be accepted with no questions asked. However name changes may cause bibliographic trackin..
Point Transformer v1 리뷰 Zhao, Hengshuang, et al. "Point transformer." Proceedings of the IEEE/CVF international conference on computer vision. 2021. Abstract우리는 자연어 처리에서 깊은 인상을 남긴 Self-attention network에서 감명을 받아 이를 3D point cloud processing에 적용하고자 한다. Point Transformer은 다양한 domain, task에 접목 가능하도록 디자인되었고, semantic scene segmentation, object part segmentation, object classification에 사용이 가능하도록 설계되었다. Point Transformer에 대한..
YOLOP 논문 요약 - 2021 Panoptic : 모든 것이 한 눈에 보이는, 파노라마적인 - 아하사전 yolop모델은 자율주행에서의 객체탐지를 위한 모델이다. 자동차, 오토바이, 보행자 뿐만 아니라 도로, 차선까지도 탐지해낸다. YOLOP: You Only Look Once for Panoptic Driving Perception Dong Wu Manwen Liao Weitian Zhang Xinggang Wang Xiang Bai Wenqing Cheng Wenyu Liu School of EIC, Huazhong University of Science & Technology Abstract panoptic driving perception 시스템은 자율주행에서 필수적이다. 높은 정확도를 가진 실시간 인지 시스템은 운전자에게 필요..
Faster R-CNN 논문 번역/리뷰 - 2016 APA Ren, Shaoqing, et al. "Faster r-cnn: Towards real-time object detection with region proposal networks." Advances in neural information processing systems 28 (2015). 논문 원문 : https://arxiv.org/pdf/1506.01497.pdf region proposals : 객체가 있을만한 곳을 선별하는 것 super pixels : 여러개의 작은 픽셀들 중 비슷한 feature(밝기, 색)등을 그룹화 하여 하나의 큰 픽셀로 만든것 end-to-end : 입력~출력 까지 신경망으로 한번에 처리한다. translation-invariant(번역 불변) : image ..
GAN (Generative Adversarial Nets) 생성적 적대 신경망 논문 리뷰/번역 - 2014 Goodfellow, Ian, et al. "Generative adversarial networks." Communications of the ACM 63.11 (2020): 139-144. 논문 원문 : https://arxiv.org/abs/1406.2661v1 GAN 은 데이터를 생성해내는 모델과, 생성된 모델 vs 원본을 구별해내는 모델 총 2가지 모델을 훈련시키는 새로운발상에서 탄생하였다. 전체적인 모델의 훈련과정은 K번만큼 D라고 불리는 구별모델을 훈련시키고 K번의 훈련이 끝났을때 G라는 데이터생성모델을 한번 훈련시키는 방법이다. 초반의 학습이 덜 된 G는 제대로된 데이터를 생성해내지 못하기때문에 D에 의해 모두 구별되지만 점점 기울기가 조정되며 결국에 D는 아무것도 구별을 못하게되는 1/2..
AlexNet 논문 리뷰/번역 AlexNet Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E. Hinton. "Imagenet classification with deep convolutional neural networks." Communications of the ACM 60.6 (2017): 84-90. AlexNet은 2012년 발표된 ImageNet Classification with Deep Convolutinal Neural Network 이라는 논문에서 처음 소개된다. CNN모델의 기초인 LeNet 탄생 후 14년만에 나온 후속 모델로 ImageNet Top-5 정확도를 73.8%에서 83.7%로 대폭 증가시킨 모델이다. 논문 본문 링크(ImageNet Classification ..