반응형
Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 영어
- 프로그래머스
- 여행
- 알고리즘
- 백준
- HIVE
- 코딩테스트
- 맛집
- Data Engineering
- apache iceberg
- Data Engineer
- HDFS
- hadoop
- java
- Iceberg
- 코딩
- 코엑스맛집
- pyspark
- 개발
- BigData
- Spark
- bigdata engineer
- 코테
- 삼성역맛집
- Linux
- Trino
- Apache Kafka
- bigdata engineering
- 자바
- Kafka
Archives
- Today
- Total
지구정복
[Hive] 자동으로 파티션 탐지 및 복구 | Automate partition discovery and repair 본문
데이터 엔지니어링 정복/Hive
[Hive] 자동으로 파티션 탐지 및 복구 | Automate partition discovery and repair
noohhee 2025. 9. 5. 15:18728x90
반응형
하이브 테이블의 파티션을 주기적으로 점검하고 동기화해주는 기능이다.
파티션 동기화 여부는 discover.partitions 테이블 속성으로 지정합니다.
외부 파티션 테이블을 생성할 때, 기본값은 true로 되어 있어 자동으로 동기화가 활성화됩니다.
하지만 예전 버전에서 만든 외부 테이블에는 이 기능이 기본 적용되어 있지 않으므로, 별도로 테이블 속성을 지정해 줘야 합니다.
설정 방법 예시:
| ALTER TABLE exttbl SET TBLPROPERTIES ('discover.partitions' = 'true'); |
위 명령어를 사용하면, 자동 파티션 탐지 기능이 해당 테이블에 활성화됩니다.
하이브는 기본적으로 5분마다 파티션 정보를 탐지하고 동기화합니다.
하지만 업그레이드 작업 중에는 이런 높은 빈도의 작업이 하이브 데이터베이스에 지나치게 많은 쿼리를 발생시켜 성능 저하를 일으킬 수 있습니다.
업그레이드 중에는 파티션 탐지/동기화 주기를 줄이는 것이 권장되며, 1시간 또는 1일에 한 번 정도로 설정할 수도 있습니다.
hive-site.xml에 아래 설정
Property: metastore.partition.management.task.frequency
Value: 600 (10분, 초 단위)
728x90
반응형
'데이터 엔지니어링 정복 > Hive' 카테고리의 다른 글
Comments