지구정복

[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 3 (selenium - 트위치 영상 다운로드하기) 본문

데이터 엔지니어링 정복/Python

[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 3 (selenium - 트위치 영상 다운로드하기)

eeaarrtthh 2021. 5. 17. 12:14
728x90
반응형
SMALL

출처 : https://wikidocs.net/35958

 

 

 

 

-트위치 영상 다운받기

#https://www.twitch.tv/jung_ekko/video/725902601

from selenium import webdriver
import time

driver = webdriver.Chrome('chromedriver')
driver.get('https://www.twitch.tv/jung_ekko/video/725902601')

time.sleep(3)

#video태그 확인, 추출할 요소의 태그가 video하나뿐인 명확한 태그이므로 xpath를 사용하지 않는다.
url_element = driver.find_element_by_tag_name('video')
vid_url = url_element.get_attribute('src')
#print( vid_url )
vid_url = vid_url[5:]
#print( vid_url )

#제목과 언제 등록했는지 가져오기 tw-ellipsis
title_element1 = driver.find_element_by_class_name('tw-ellipsis')
vid = title_element1.text
print( vid )

#영상 다운받기
import re
vid = re.sub('[^0-9a-zA-Zㄱ-힗]', '', vid)
print( vid )

from urllib.request import urlretrieve
urlretrieve( vid_url, vid+'.mp4' )

driver.close()

 

 

 

 

 

 

728x90
반응형
LIST
Comments