반응형
Notice
Recent Posts
Recent Comments
Link
지구정복
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 3 (selenium - 트위치 영상 다운로드하기) 본문
데이터 엔지니어링 정복/Python
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 3 (selenium - 트위치 영상 다운로드하기)
eeaarrtthh 2021. 5. 17. 12:14728x90
반응형
출처 : https://wikidocs.net/35958
-트위치 영상 다운받기
#https://www.twitch.tv/jung_ekko/video/725902601
from selenium import webdriver
import time
driver = webdriver.Chrome('chromedriver')
driver.get('https://www.twitch.tv/jung_ekko/video/725902601')
time.sleep(3)
#video태그 확인, 추출할 요소의 태그가 video하나뿐인 명확한 태그이므로 xpath를 사용하지 않는다.
url_element = driver.find_element_by_tag_name('video')
vid_url = url_element.get_attribute('src')
#print( vid_url )
vid_url = vid_url[5:]
#print( vid_url )
#제목과 언제 등록했는지 가져오기 tw-ellipsis
title_element1 = driver.find_element_by_class_name('tw-ellipsis')
vid = title_element1.text
print( vid )
#영상 다운받기
import re
vid = re.sub('[^0-9a-zA-Zㄱ-힗]', '', vid)
print( vid )
from urllib.request import urlretrieve
urlretrieve( vid_url, vid+'.mp4' )
driver.close()
728x90
반응형
'데이터 엔지니어링 정복 > Python' 카테고리의 다른 글
[Python] Linux CentOS 7에 파이썬3.9버전 설치하기 (3) | 2021.05.31 |
---|---|
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 4 (selenium - 네이버 로그인하기) (0) | 2021.05.17 |
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 2 (selenium- css태그) (0) | 2021.05.17 |
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 (selenium - 유튜브 검색하기) (0) | 2021.05.16 |
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기(requests, BeautifulSoup) (1) | 2021.05.16 |
Comments