전체 글 167

[Day 37] 모델의 시공간 & 알뜰히

Week7은 Further question 중심으로 학습정리하기 📌 모델의 시공간 Further Question 1) 이번 강의는 lightweight modeling과 어떤 관계가 있을까? (이 강의를 만든 목적은 무엇일까? 모델의 시간 & 공간복잡도를 줄이는 것도 경량화의 목적 중 하나이다. 시간복잡도와 공간복잡도는 trade-off가 된다. compression model은 architecture를 바꿔야 하는 문제이므로 NAS 방법론 중 하나로 바라볼 수 있다. 2) regular convolution 대신 depthwise seperable convolution을 사용해서 계산상의 가장 큰 이득을 보는 경우는 언제일까? depthwise seperable convolution 이란 ? depth..

Naver Ai Boostcamp 2021.03.27

[DAY 35] Multi-modal & 3D Understanding

📌Multi-model Multi modal learning :다양한 형태의 데이터 (이미지, 텍스트,음성 등)을 input을 받아 한 번에 학습시키는 것 Multi modal learning의 문제점 데이터별 상이한 표현 : 음성 1d , 이미지 2d , 텍스트는 embedding을 통한 단어별 feature vector로 표현하는 등 데이터별 표현방법이 다르다. feature space 간 불균형 : 예를 들어 text와 image 데이터 사이의 관계가 m : n 다대다 구조 편향된 학습법 : 쉬운 특정 데이터 타입에 편향되어 학습이 이뤄질 수 있다. Multi modal learning의 종류 1. Matching ex ) Image tagging , ­ Image&food recipe retrie..

Naver Ai Boostcamp 2021.03.25

[DAY 34] Instance/Panoptic segmentation & Conditional generative model

Instance/Panoptic segmentation 📌 Instance segmentation semantic segmentation + distinguishing instances 같은 클래스더라도 객체가 다르면 다르게 segmentation 해준다. 주로 object detection을 기반으로 함 Mask RCNN RoI pooling으로 생기는 misalignmenta문제를 RoI Align을 사용하여 해결 , bilinear interpolation을 이용해 소숫점으로 맞춰줌 Faster RCNN에 Mask branch 추가 : class 별 binary mask classfication 생성 -> cls결과에 따른 채널 사용 backbone 모델에 FPN Network 추가 keypoint..

Naver Ai Boostcamp 2021.03.17

[DAY 33] Object Detection & CNN visualization

Object Detection 📌 Object Detection '어떤'물체가 '어디'있는지 파악하는 작업 classfication + box localization 자율주행 , OCR 등의 분야에 적용 📌 One stage detector VS Two stage detector One -stage Detector Two stage detector localization 과 classification을 한 번에 진행 localization 진행 후 , classfication 진행 빠르지만 성능 저하 성능은 좋지만 느림 Yolo , SSD , RetinaNet R-CNN , Fast R-CNN, Faster R-CNN 📌 Two-stage detector : R-CNN family R-CNN Direct..

Naver Ai Boostcamp 2021.03.17

[DAY 31] Image classfication1 & annotation data efficient learning

내 기준 도입부가 굉장히 좋았던 강의 Image classfication1 📌 Why is visual perception important & what is computer vision AI 란? : 사람의 지능(인지, 지각, 기억, 이해, 사고 능력)을 컴퓨터 시스템으로 구현해놓은 것 사람의 지각 능력 중 "시각" => Computer Vision visual perception & intelligence를 구현 = Computer vision Color , Motion , 3D, Semantic-level, social perception 등이 존재 📌 Convolutional Neural Network Fully connected는 왜 이미지에 안 좋을까? 픽셀의 개수만큼을 input으로 가지게 ..

Naver Ai Boostcamp 2021.03.13