반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- hadoop
- 자바
- java
- 코엑스
- 알고리즘
- 여행
- HIVE
- 프로그래머스
- 파이썬
- 백준
- 코딩
- dfs
- 양평
- Data Engineer
- 코딩테스트
- 개발
- bigdata engineer
- apache iceberg
- Data Engineering
- bigdata engineering
- 맛집
- 영어
- 코테
- 코엑스맛집
- Iceberg
- 용인맛집
- BigData
- Trino
- BFS
- 삼성역맛집
Archives
- Today
- Total
728x90
반응형
목록데이터 엔지니어링 정복/Spark (1)
지구정복

1. 개념 더보기 하이브는 복잡한 맵리듀스를 하이브 QL(Query Language)로 래핑해 접근성을 높일 수 있었지만 맵리듀스 코어를 그대로 사용함으로써 성능면에서는 만족스럽지 못했다. 그로 인해 대화형 연산 작업에서는 하이브가 적합하지 않았다. 이러한 단점을 극복하기 위해 만들어진 것이 Spark이다. 2. 구성요소 더보기 -Spark RDD : 스파크 프로그래밍의 기초 데이터 모델. 가장 중요. 스파크가 데이터를 로드해서 RDD구조 만들고 이 RDD 구조로 만들어진 데이터를 변환하느냐 혹은 얼마나 잘 사용하느냐가 스파크에서 가장 중요한 기술이다. -Spark Driver / Executors : Driver는 RDD프로그램을 분산 노드에서 실행하기 위한 Task의 구성, 할당, 계획 등을 수립하고..
데이터 엔지니어링 정복/Spark
2021. 5. 10. 11:21
반응형