반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- apache iceberg
- 알고리즘
- BigData
- 파이썬
- 백준
- 여행
- 코엑스
- java
- 코엑스맛집
- 개발
- 용인맛집
- 코딩테스트
- 맛집
- 양평
- 프로그래머스
- bigdata engineering
- bigdata engineer
- Iceberg
- 코테
- Data Engineer
- hadoop
- Trino
- BFS
- Data Engineering
- 자바
- 코딩
- HIVE
- 삼성역맛집
- dfs
- 영어
Archives
- Today
- Total
지구정복
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 3 (selenium - 트위치 영상 다운로드하기) 본문
데이터 엔지니어링 정복/Python
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 3 (selenium - 트위치 영상 다운로드하기)
noohhee 2021. 5. 17. 12:14728x90
반응형
출처 : https://wikidocs.net/35958
-트위치 영상 다운받기
#https://www.twitch.tv/jung_ekko/video/725902601
from selenium import webdriver
import time
driver = webdriver.Chrome('chromedriver')
driver.get('https://www.twitch.tv/jung_ekko/video/725902601')
time.sleep(3)
#video태그 확인, 추출할 요소의 태그가 video하나뿐인 명확한 태그이므로 xpath를 사용하지 않는다.
url_element = driver.find_element_by_tag_name('video')
vid_url = url_element.get_attribute('src')
#print( vid_url )
vid_url = vid_url[5:]
#print( vid_url )
#제목과 언제 등록했는지 가져오기 tw-ellipsis
title_element1 = driver.find_element_by_class_name('tw-ellipsis')
vid = title_element1.text
print( vid )
#영상 다운받기
import re
vid = re.sub('[^0-9a-zA-Zㄱ-힗]', '', vid)
print( vid )
from urllib.request import urlretrieve
urlretrieve( vid_url, vid+'.mp4' )
driver.close()
728x90
반응형
'데이터 엔지니어링 정복 > Python' 카테고리의 다른 글
[Python] Linux CentOS 7에 파이썬3.9버전 설치하기 (3) | 2021.05.31 |
---|---|
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 4 (selenium - 네이버 로그인하기) (0) | 2021.05.17 |
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 2 (selenium- css태그) (0) | 2021.05.17 |
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기 (selenium - 유튜브 검색하기) (0) | 2021.05.16 |
[Python] 리눅스CentOS 7에서 파이썬으로 웹 크롤링하기(requests, BeautifulSoup) (1) | 2021.05.16 |
Comments