데이터 엔지니어링 정복/Python
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 3 (selenium - 트위치 영상 다운로드하기)
noohhee
2021. 5. 17. 12:14
728x90
반응형
출처 : https://wikidocs.net/35958
-트위치 영상 다운받기
#https://www.twitch.tv/jung_ekko/video/725902601
from selenium import webdriver
import time
driver = webdriver.Chrome('chromedriver')
driver.get('https://www.twitch.tv/jung_ekko/video/725902601')
time.sleep(3)
#video태그 확인, 추출할 요소의 태그가 video하나뿐인 명확한 태그이므로 xpath를 사용하지 않는다.
url_element = driver.find_element_by_tag_name('video')
vid_url = url_element.get_attribute('src')
#print( vid_url )
vid_url = vid_url[5:]
#print( vid_url )
#제목과 언제 등록했는지 가져오기 tw-ellipsis
title_element1 = driver.find_element_by_class_name('tw-ellipsis')
vid = title_element1.text
print( vid )
#영상 다운받기
import re
vid = re.sub('[^0-9a-zA-Zㄱ-힗]', '', vid)
print( vid )
from urllib.request import urlretrieve
urlretrieve( vid_url, vid+'.mp4' )
driver.close()
728x90
반응형