| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- 코딩테스트
- HDFS
- Spark
- Apache Kafka
- apache iceberg
- hadoop
- 코엑스맛집
- 맛집
- Kafka
- pyspark
- Data Engineer
- 프로그래머스
- java
- 자바
- 영어
- Data Engineering
- bigdata engineering
- HIVE
- Linux
- 코테
- Trino
- 여행
- 백준
- bigdata engineer
- Iceberg
- 삼성역맛집
- 알고리즘
- 개발
- 코딩
- BigData
- Today
- Total
목록bigdata engineer (10)
지구정복
참고문서: https://docs.cloudera.com/runtime/7.3.1/scaling-namespaces/topics/hdfs-config-heterogeneous-storage.html 데이터 노드에 사용될 실제 서버의 디렉터리(ex: /hadoop/disk1/, /hadoop/disk2)를 특정 디스크 타입으로 마운트하고이를 HDFS상에서 해당 디렉터리가 HDD인지 SSD인지 등을 설정할 수 있다. HDFS storage types먼저 HDFS에서 사용가능한 스토리지 타입은 다음과 같다. ARCHIVE - Archival storage is for very dense storage and is useful for rarely accessed data. This storage type is..
이빨빠진 번호들도 있습니다참고바랍니다. question 1https://www.examtopics.com/discussions/databricks/view/107311-exam-certified-associate-developer-for-apache-spark-topic-1/question 2https://www.examtopics.com/discussions/databricks/view/104977-exam-certified-associate-developer-for-apache-spark-topic-1/question 3https://www.examtopics.com/discussions/databricks/view/104978-exam-certified-associate-developer-for..
이빨빠진 번호들도 있습니다참고바랍니다. question 1https://www.examtopics.com/discussions/databricks/view/107311-exam-certified-associate-developer-for-apache-spark-topic-1/question 2https://www.examtopics.com/discussions/databricks/view/104977-exam-certified-associate-developer-for-apache-spark-topic-1/question 3https://www.examtopics.com/discussions/databricks/view/104978-exam-certified-associate-developer-for..
1. Kafka ClusterKafka 클러스터는 서로 연결된 Kafka 브로커들의 집합으로, Kafka 시스템으로 들어오고 나가는 데이터 스트림을 함께 관리합니다.각 브로커는 별도의 머신에서 독립적인 프로세스로 실행되며, 신뢰성 높고 고속인 네트워크를 통해 다른 브로커들과 통신합니다.그렇다면 왜 Apache Kafka 클러스터를 사용해야 할까요? 그리고 그것이 어떻게 도움이 될까요?사용자 활동이 증가함에 따라, 들어오는 데이터 스트림의 양과 속도를 감당하기 위해 추가적인 Kafka 브로커가 필요하게 됩니다.Kafka 클러스터는 데이터 파티션을 여러 브로커에 복제(replication)할 수 있게 하여, 노드 장애가 발생하더라도 고가용성(high availability)을 유지할 수 있도록 합니다.이를 ..