googlesimagedownload로 크롤링을 할 수 있는데 딱 100장까지만 된다.
100장을 넘어가는 순간 에러가 뜨게 된다.
그래서 캠퍼 중 짱짱 쩌는 서일님이랑 희석님이 chrome driver를 이용해서 100장 이상 쓰는 법을 알려주셨다.
슬랙에 올려두셨는데, 자꾸 슬랙에 들어가서 찾고 확인하기 너무 귀찮아서 블로그 메모장에 끼적어놔야겠다.
# googleimagesdownload 하기 !pip install --upgrade git+https://github.com/Joeclinton1/google-images-download.git #chrome driver 다운 받기 !sudo apt-get install chromium-chromedriver #image download !googleimagesdownload --keywords "캡틴,아이언맨" --limit 400 --format png --output_directory data -cd /usr/lib/chromium-browser/chromedriver #압축하기 !tar -cvf data.tar data #드라이브에 업로드하기 from google.colab import drive drive.mount('/content/drive')
'메모장' 카테고리의 다른 글
2021년 절반 지난 기념 회고 (10) | 2021.07.04 |
---|---|
GNN 관련 읽어볼 거 (0) | 2021.03.02 |
BOAZ 16기 도전 그리고 합격 (0) | 2021.01.06 |
2021 AI boostcamp tech 도전! (0) | 2020.12.17 |
기본 깃허브 사용법(리눅스환경 주피터 사용) (0) | 2020.11.05 |