지구정복

[Sqoop] Sqoop 개념, 구성요소, 아키텍처 본문

데이터 엔지니어링 정복/Sqoop

[Sqoop] Sqoop 개념, 구성요소, 아키텍처

eeaarrtthh 2021. 5. 11. 11:42
728x90
반응형
SMALL

1. 개념

하둡에서의 HDFS에 있는 빅데이터 분석 결과를 외부에 있는 RDBMS로 전달한다든지 반대로 외부에서 하둡으로 가져올 때 사용한다. 

 


2. 구성요소

 

-Sqoop Client : 하둡의 분산 환경에서 HDFS와 RDBMS 간의 데이터 임포트 및 익스포트 기능을 수행하기 위한 라이브러리 구성

 

-Sqoop Server : 스쿱2의 아키텍처에서 제공되며, 스쿱1의 분산된 클라이언트 기능을 통합해 REST API로 제공한다.

 

-Import / Export : 임포트 기능은 RDBMS의 데이터를 HDFS로 가져올 때 사용하며, 반대로 익스포트 기능은 HDFS의 데이터를 RDBMS로 내보낼 때 사용

 

-Connectors : 임포트 및 익스포트에서 사용될 다양한 DBMS의 접속 어댑터와 라이브러리 제공

 

-Metadata : 스쿱 서버에 서비스하는 데 필요한 각종 메타 정보를 저장

 


3. 아키텍처

 

 

 

 

 

 

출처 : 실무로 배우는 빅데이터 기술 - 위키북스

728x90
반응형
LIST
Comments