정보 다이어리

떠오르는 좋은 생각를 메모하세요.

유튜브유튜브
영어공부영어 공부
- [유튜브] 세가영세가영
- [유튜브] 라쿤잉글리시라쿤잉글리시
- [유튜브] 구슬쌤구슬쌤
- [유튜브] 에스텔잉글리쉬estellenglish
- [유튜브] 달변가영쌤dalbyeonga Yeong ssaem.
- [유튜브] 라이브 아카데미liveacademy
- [유튜브] 니나[유튜브] 니나
- [유튜브] 앤젤라쌤angela
- [유튜브] 날라리데이브날라리데이브
- [유튜브] 홍글리쉬TV홍글리쉬TV
- 영화 자막 공부영화 자막 공부
프로그래밍프로그래밍
- C#시샵
- WPFWPF
- UWPUWP
- HTMLHTML
- CSSCSS
- JAVASCRIPT자바스크립트
- JAVAJAVA
- Android안드로이드
- PYTHON파이썬
- PHPPHP
- MYSQLMYSQL
- Node.jsNode.js
운영체제운영체제
- 윈도우윈도우
- 안드로이드안드로이드
- 리눅스리눅스
- 라즈베리파이라즈베리파이
프로그램프로그램
링크링크
로그인

파이썬 셀레니움 이미지 크롤링 - 조코딩

2020년 11월 11일2020년 11월 11일 jihun3

# 파이썬 셀레니움 이미지 크롤링으로 배우는 업무 자동화의 기초 (youtube.com)
https://www.youtube.com/watch?v=1b7pXC1-IbE

# 소스 코드 (github.com)
https://github.com/youtube-jocoding/python-selenium-google-image-crawling/blob/master/google.py

Selenium 설치 및 브라우저 세팅
구글 이미지 크롤링 코드 작성
셀레니움 네이버 실시간 검색어 크롤링 방법 소개

1. 파이썬 가상 환경 세팅

1. 구글에서 검색 : python venv 가상 환경

https://docs.python.org/ko/3/library/venv.html

2. 터미널을 열고 실행

python -m venv selenium // selenium 이라는 이름의 가상 환경을 만듦

cd selenium\Scripts

activate // 경로 앞에 (selenium) 이 붙었으면 가상환경에 들어왔다는 뜻이다.

pip install selenium // selenium 설치

3. 구글에서 검색 : chromedriver

https://chromedriver.chromium.org/downloads

// 크롬 버전에 맞는 chromedriver 다운로드 (윈도우용 : chromedriver_win32.zip)

// chromedriver.exe 파일을 selenium 폴더에 붙여넣기

4. selenium 폴더에 google.py 파일을 생성

5. 구글에서 검색 : python selenium example

https://selenium-python.readthedocs.io/getting-started.html

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time
import urllib.request

driver = webdriver.Chrome()
driver.get("https://www.google.co.kr/imghp?hl=ko&tab=wi&authuser=0&ogbl")
elem = driver.find_element_by_name("q")
elem.send_keys("조코딩")
elem.send_keys(Keys.RETURN)

SCROLL_PAUSE_TIME = 1
# Get scroll height
last_height = driver.execute_script("return document.body.scrollHeight")
while True:
    # Scroll down to bottom
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
    # Wait to load page
    time.sleep(SCROLL_PAUSE_TIME)
    # Calculate new scroll height and compare with last scroll height
    new_height = driver.execute_script("return document.body.scrollHeight")
    if new_height == last_height:
        try:
            driver.find_element_by_css_selector(".mye4qd").click()
        except:
            break
    last_height = new_height

images = driver.find_elements_by_css_selector(".rg_i.Q4LuWd")
count = 1
for image in images:
    try:
        image.click()
        time.sleep(2)
        imgUrl = driver.find_element_by_xpath('/html/body/div[2]/c-wiz/div[3]/div[2]/div[3]/div/div/div[3]/div[2]/c-wiz/div[1]/div[1]/div/div[2]/a/img').get_attribute("src")
        opener=urllib.request.build_opener()
        opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1941.0 Safari/537.36')]
        urllib.request.install_opener(opener)
        urllib.request.urlretrieve(imgUrl, str(count) + ".jpg")
        count = count + 1
    except:
        pass

driver.close()

파이썬 강의 노트 1 - 나도코딩

PYTHON

파이썬 강의 노트 1 - 나도코딩

파이썬 프로그램을 .exe 실행 파일로 만드는 방법 (PyInstaller) 1. 파이썬 프로그램을 .exe 실행 파일로 만드는 방법...

파이썬 강좌 - 김플 스튜디오

PYTHON

파이썬 강좌 - 김플 스튜디오

파이썬 크롤링 예제 네이버 이미지 검색결과 한번에 다운로드 프로그램 파이썬 selenium 셀레니움 새탭 열고 닫는 방법 파이썬 반복문에서 사용하고 있는...

파이썬 라이브러리

PYTHON

파이썬 라이브러리

tesseract pyautogui pyinstaller csv selenium 1. tesseract # tesseract (github) https://github.com/tesseract-ocr # 파이썬 Python 코딩...

Leave a Comment 응답 취소