반응형
Notice
Recent Posts
Recent Comments
Link
지구정복
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 (selenium - 유튜브 검색하기) 본문
데이터 엔지니어링 정복/Python
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 (selenium - 유튜브 검색하기)
eeaarrtthh 2021. 5. 16. 23:04728x90
반응형
1. 크롬 설치돼 있어야 한다.
2. chromedriver를 다운받아야 한다.
먼저 selenium을 설치한다. root계정으로 설치한다.
[root@localhost ~]# pip3 install selenium
그리고 크롬을 다운받는다. (Linux CentOS 7버전인 경우)
wget https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm
크롬 다운을 다 받았으면 크롬을 시스템에 입력한다.
yum localinstall google-chrome-stable_current_x86_64.rpm
크롬 설치 완료!
다음으로 리눅스에서 아래 웹사이트에 접속해서 chromedriver 다운받는다.
http://chromedriver.chromium.org/
그리고 크롬의 버전을 확인한다.
나는 90버전이니깐 chromedriver도 90버전으로 다운받는다.
그리고 linux64버전 클릭!
이제 압축풀러 가즈아. x-window에서 해도 되지만 리눅스도 익숙해질겸 터미널로 ㄱㄱ
[root@localhost ~]# cd /home/master/다운로드/
[root@localhost 다운로드]# ls -all
[root@localhost 다운로드]# unzip -xvf chromedriver_linux64.zip
아래와 같이 파일 하나가 풀렸고, 이 파일을 /usr/local/bin으로 옮겨줘야된다.
윈도우에서는 그냥 chromedriver가 있는 곳의 절대경로를 지정하면 된다고 한다.
[root@localhost 다운로드]# cd /home/master/다운로드/
[root@localhost 다운로드]# mv chromedriver /usr/local/bin/
이제 실제로 사용해보자~
-유튜브 키워드 검색하기
유튜브 검색창 우클릭 - 검사
파란색 코드부분 우클릭 - Copy - Copy XPath
해당 내용을 파이썬 코드 안에 아래와 같이 작성한다.
from selenium import webdriver
import time
from selenium.webdriver.common.keys import Keys
driver = webdriver.Chrome('chromedriver')
driver.get("https://www.youtube.com/")
time.sleep(3)
#검색어 창을 찾아 search 변수에 저장
search = driver.find_element_by_xpath('//*[@id="search"]')
#search 변수에 저장된 곳에 값을 전송
search.send_keys('iu coin')
time.sleep(1)
#search 변수에 저장된 곳에 엔터를 입력
search.send_keys(Keys.ENTER)
실행하면 선언한 시간 뒤에 유튜브 검색이 된다. 아래처럼~
728x90
반응형
'데이터 엔지니어링 정복 > Python' 카테고리의 다른 글
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 3 (selenium - 트위치 영상 다운로드하기) (0) | 2021.05.17 |
---|---|
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 2 (selenium- css태그) (0) | 2021.05.17 |
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기(requests, BeautifulSoup) (1) | 2021.05.16 |
[Python] Linux CentOS 7에 파이썬 pip3 설치하기 (0) | 2021.05.16 |
[Python] 3/17 | 파이썬에서 웹서버 사용(서버실행, get과 post방식 사용) (0) | 2021.03.17 |
Comments