일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- HIVE
- 코엑스
- 여행
- apache iceberg
- 코딩
- java
- bigdata engineer
- 영어
- dfs
- Iceberg
- hadoop
- 코딩테스트
- 맛집
- Data Engineer
- 코테
- BigData
- 프로그래머스
- 개발
- 코엑스맛집
- 알고리즘
- 파이썬
- Data Engineering
- 양평
- 용인맛집
- 자바
- bigdata engineering
- BFS
- 백준
- 삼성역맛집
- Trino
- Today
- Total
목록hadoop (8)
지구정복

참고icberg guidebookhttps://trino.io/docs/current/connector/iceberg.html#metadata-tablesTrino 402버전 문서: https://trino.io/docs/402/overview/use-cases.html 0. PE/DE로서 Iceberg 사용시 어떤 점들을 중점적으로 알아야 할까? -Trino/Spark3 설치법-Iceberg 셋팅법(Trino와 Spark3에서 사용가능하도록 셋팅하기)-Ranger 권한관리방법(현재는 Trino만 유저에 한해서만 작동하지만 LDAP연동시에는 그룹 권한은 미작동 / Spark3도 되지만 권한적용이 원활히 되진 않음 / 그룹 및 유저권한관리)-Iceberg의 기본 개념 및 사용방법 1. Iceberg ..

apache iceberg guidebook에서 가져온 내용입니다. CHAPTER 3Lifecycle of Write and Read Queries Writing Queries in Apache Iceberg Create the TableSend the query to the engineWrite the metadata fileUpdate the catalog file to commit changes Insert the Query Send the query to the engineCheck the catalogWrite the datafiles and metadata filesUpdate the catalog file to commit changes Merge QuerySend the quer..

출처 https://hadoop.apache.org/docs/r3.3.5/index.html https://www.cnblogs.com/basenet855x/p/7889994.html 목적 기본 복제계수 값은 3이고 이럴 경우 데이터가 HDFS에 저장되면 200%의 공간과 리소스(네트워크 등)를 차지한다. 이때 잘 사용하지 않는 warm 또는 cold데이터의 경우 공간 낭비가 심하다. 따라서 이를 해결하기 위해 Eraser Coding을 HDFS 3버전부터 도입했다. EC를 사용하면 fault-tolerance는 유지하면서 HDFS공간은 더욱 효율적으로 사용할 수 있다. EC를 사용하면 디스크 오버헤드는 50%로 줄어든다. 이때 EC가 적용된 파일들의 경우 복제계수의 값은 사용하지 않는다. EC가 적용된..

* 참고: 빅데이터를 지탱하는 기술(책) * 환경 윈도우10 버추얼박스 5.2.44 리눅스 CentOS 7.9.2009 자바 버전: openjdk version "1.8.0_292" Embulk 버전: Hadoop 버전: Hive 버전:Presto 버전:MongoDB 버전: 4.4 자바는 아래 블로거님 글 참고 https://bamdule.tistory.com/57 [Linux] CentOS 7에 OpenJDK 1.8 설치 1. open-jdk 1.8 설치 # yum install java-1.8.0-openjdk # yum install java-1.8.0-openjdk-devel 설치가 완료되면 /usr/bin/경로에 java가 생성됩니다. 2. 환경변수 등록 /usr/bin/java 경로에 심볼릭링..