전체 글 167

[Day 23] 군집 탐색

군집 구조 분석 📌 군집 구조와 군집 탐색 문제 군집 : 군집(Community)이란 다음 조건들을 만족하는 정점들의 집합 집합에 속하는 정점 사이에는 많은 간선이 존재 집합에 속하는 정점과 그렇지 않은 정점 사이에는 적은 수의 간선이 존재 실제 그래프에서도 군집들은 사회적 무리 / 조직 내 분란 등을 표현 군집탐색문제(community detection) : 그래프를 여러 군집으로 '잘' 나누는 문제, 클러스터링과 유사하지만 나뉘는 개체가 "정점" 그렇다면 "잘 나눴다"의 기준은 뭘까? 📌 군집 구조의 통계적 유의성과 군집성 배치모형 1 ) 각 정점의 연결성(Degree)를 보존한 상태 , 2 ) 간선들을 무작위로 재배치 하여 얻은 그래프를 의미한다. 각 정점에서 나가는 , 들어오는 간선의 수는 유지하..

Naver Ai Boostcamp 2021.02.24

google images download 100장 이상 사용하기

googlesimagedownload로 크롤링을 할 수 있는데 딱 100장까지만 된다.100장을 넘어가는 순간 에러가 뜨게 된다. 그래서 캠퍼 중 짱짱 쩌는 서일님이랑 희석님이 chrome driver를 이용해서 100장 이상 쓰는 법을 알려주셨다.슬랙에 올려두셨는데, 자꾸 슬랙에 들어가서 찾고 확인하기 너무 귀찮아서 블로그 메모장에 끼적어놔야겠다. # googleimagesdownload 하기 !pip install --upgrade git+https://github.com/Joeclinton1/google-images-download.git #chrome driver 다운 받기 !sudo apt-get install chromium-chromedriver #image download !googleim..

메모장 2021.02.24

[Day 22] 페이지랭크 & 전파 모델

📌 학습목표 페이지랭크 알고리즘이 어떻게 동작하는지 페이지 랭크의 문제점과 이를 해결할 수 있는 알고리즘 전파를 모델링 하는 간단한 수학적 모형들 주어진 그래프와 규칙에서 전파를 최대화 하는 천파 최대화 문제에서 어떻게 전파가 이루어지는지 📌검색엔진 Google 의 시작 이 블로그에서 랭크 알고리즘에 대해 되게 멋지게 설명한다. “Google”이라는 230조원짜리 회사가 처음 시작된 곳이 바로 이 세르게이 브린과 래리 페이지가 쓴 논문(The Anatomy of a Large-Scale Hypertextual Web Search Engine)이었다" 구글 이전의 검색엔진은 웹을 거대한 디렉토리로 정리했다. 블로그를 쓰는 사람이라면 알겠지만, 자신의 블로그를 하나의 디렉토리로 정하는 게 상당히 어렵다. 나..

Naver Ai Boostcamp 2021.02.23

[Day 21] 그래프 이론 기초 & 그래프 패턴

📌 학습목표 정점, 간선, 방향성, 가중치 등의 정의들을 명확하게 이해 실제 그래프의 다양한 패턴에 집중 📌 그래프 기초 그래프란? 그래프는 정점 집합과 간선집합으로 이루어진 수학적 구조를 얘기한다. 동그라미 혹은 점들을 정점이라 부르고, 그 점들을 잇는 선을 간선이라고 한다. 정점들의 집합을 V , 간선들의 집합을 E , 그래프를 G = (V,E)라고 적는다. 그래프는 네트워크 , 정점은 노드, 간선은 엣지 혹은 링크라고도 불린다. 두 정점을 간선으로 이어 두 정점이 연결됐다는 것을 나타낸다. 생각해보면 우리가 어렸을 때 그리던 "마인드맵"도 그래프다. 그래프는 크게 "방향의 유무", "가중치의 유무" ,"정점의 종류"등에 의해 구분된다. 여기서는 간단하게만 다루고, 알고리즘에서 사용되는 더 다양한 그..

Naver Ai Boostcamp 2021.02.22

MASK RCNN 논문 리뷰

Instance segmentation task를 다룬 논문인 MASK-RCNN 차례입니다. MASK RCNN은 기존 object detection task에서 사용되던 FASTER RCNN에 Mask branch를 추가해 classification , bbox regression , predicting object mask를 동시에 처리하는 모델입니다. 이 논문을 읽기 위해서는 기본적으로 Faster RCNN , FCN , FPN 모델들과 segmentation이 뭔지 알아야 합니다. 📌 Instance segmentation Mask RCNN의 task인 "Instace segmentation"에 대해 먼저 이해해야합니다. Image Segmentation은 영상/이미지에서 의미있는 부분들을 구별해내..

[DAY 20] self-supervised pretrained model - Bert , GPT

오늘 수업 내용은 이전 내용들과는 다른 의미로 너무 어렵다;; 최신동향이라 그런가,,, 완벽히 이해하겠다! 보다는 이런 컨셉으로 흘러가고있구나. 정도만 이해하는데 타협했다. DeepMind 소속의 Sebastian Ruder가 매년 블로그를 통해 발행하는 ML and NLP Research Highlights 의 2020년 버전 중 자연어 처리와 관련된 이야기만 번역한 포스트 KAKAO BRAIN에서 발행한 2018-2020 NLP 연구동향 NLP에는 많은 분야가 있지만, 자연어 이해 NLU(Natural Language Understanding) , 자연어 생성 NLG(Natural Language Generation)를 핵심과제로 꼽아볼 수 있다고 한다. 생각해보면 주변에 CV를 하는 사람 혹은 관심..

Naver Ai Boostcamp 2021.02.20