Notice

Recent Posts

Recent Comments

Link

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

지구정복

[Zeppelin] Zeppelin 개념, 구성요소, 아키텍처 본문

데이터 엔지니어링 정복/Hadoop Ecosystem

[Zeppelin] Zeppelin 개념, 구성요소, 아키텍처

noohhee 2021. 5. 11. 11:11

728x90

1. 개념

데이터 탐색 및 분석할 때 가장 잘 알려진 도구는 R 또는 Python이다. 하지만 하둡의 분산 파일을 직접 참조할 수 없고 분산 병렬 처리가 어려워서 이 도구들을 이용해서 대규모 데이터 분석하는데는 어려움이 있다. 이러한 문제를 해결할 수 있는 도구는 Spark이다. 하지만 데이터 노드의 Spark쉘을 이용해야 하므로 분석가나 관리자는 분석에 어려움을 겪는다. 따라서 Spark를 웹에서 사용할 수 있게 해주는 도구가 바로 제플린이다.

2. 구성요소

-Notebook : 웹 상에서 제플린의 인터프리터 언어를 작성하고 명령을 실행 및 관리할 수 있는 UI

-Visualization : 인터프리터의 실행결과를 곧바로 웹 상에서 다양한 시각화 도구로 분석해 볼 수 있는 기능

-Zeppelin Server : Notebook을 웹으로 제공하기 위한 웹 애플리케이션 서버로서 인터프리터 엔진 및 인터프리터 API 등을 지원

-Zeppelin Interpreter : 데이터 분석을 위한 다양한 인터프리터를 제공하며, 스파크, 하이브, JDBC, 셸 등이 있으며 필요 시 인터프리터를 추가 확장

3. 아키텍처

출처 : 실무로 배우는 빅데이터 기술 - 위키북스

728x90

저작자표시 동일조건 (새창열림)

'데이터 엔지니어링 정복 > Hadoop Ecosystem' 카테고리의 다른 글

[Hadoop] 서버 4대 완전분산모드 주키퍼, 하둡설치하기 (3)	2021.05.22
[Mahout] Mahout 개념, 구성요소, 아키텍처 (1)	2021.05.11
[Impala] Impala 개념, 구성요소, 아키텍처 (0)	2021.05.11
[Hue] Hue 개념, 구성요소, 아키텍처 (0)	2021.05.10
[Storm] Storm 설치하기 (0)	2021.05.08