반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- BigData
- 코딩테스트
- 코엑스
- 알고리즘
- 삼성역맛집
- hadoop
- 자바
- 코딩
- 영어
- 양평
- 개발
- 여행
- Iceberg
- Data Engineer
- 프로그래머스
- BFS
- apache iceberg
- HIVE
- Data Engineering
- dfs
- 용인맛집
- bigdata engineering
- 파이썬
- java
- Trino
- 백준
- 맛집
- 코테
- bigdata engineer
- 코엑스맛집
Archives
- Today
- Total
728x90
반응형
목록HDFS (1)
지구정복

출처 https://hadoop.apache.org/docs/r3.3.5/index.html https://www.cnblogs.com/basenet855x/p/7889994.html 목적 기본 복제계수 값은 3이고 이럴 경우 데이터가 HDFS에 저장되면 200%의 공간과 리소스(네트워크 등)를 차지한다. 이때 잘 사용하지 않는 warm 또는 cold데이터의 경우 공간 낭비가 심하다. 따라서 이를 해결하기 위해 Eraser Coding을 HDFS 3버전부터 도입했다. EC를 사용하면 fault-tolerance는 유지하면서 HDFS공간은 더욱 효율적으로 사용할 수 있다. EC를 사용하면 디스크 오버헤드는 50%로 줄어든다. 이때 EC가 적용된 파일들의 경우 복제계수의 값은 사용하지 않는다. EC가 적용된..
데이터 엔지니어링 정복/HDFS
2023. 5. 12. 23:53
반응형