일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- bigdata engineering
- Data Engineer
- 백준
- 코딩테스트
- 코엑스
- 프로그래머스
- Apache Kafka
- hadoop
- 코딩
- java
- 여행
- HIVE
- BigData
- 삼성역맛집
- 맛집
- Kafka
- 용인맛집
- 영어
- pyspark
- 코엑스맛집
- bigdata engineer
- 개발
- Trino
- Iceberg
- apache iceberg
- Spark
- 코테
- 자바
- 알고리즘
- Data Engineering
- Today
- Total
목록BigData (29)
지구정복
카프카 도구는 Apache Kafka 클러스터의 관리, 모니터링 및 최적화를 간소화하기 위해 설계된 특수 유틸리티 및 애플리케이션입니다.시스템이 확장됨에 따라 카프카 클러스터 관리가 매우 복잡해질 수 있습니다. 카프카 도구는 클러스터의 주요 메트릭을 모니터링하고 확장성을 개선하는 등의 매우 반복적인 관리 작업을 간소화하고 자동화합니다. 클러스터 관리 외에도 카프카 도구는 모니터링 및 보안 구성도 간소화하며, 관리자가 세분화된 액세스 정책을 정의할 수 있도록 합니다. 카프카 도구는 전반적인 기능을 강화하여 조직이 운영 복잡성을 줄이면서 실시간 데이터 스트림을 활용할 수 있도록 합니다. 사용하기 쉬운 인터페이스 덕분에 초보자라도 카프카를 더 쉽게 다룰 수 있게 됩니다. 이 장에서는 다양한 카프카 도구를 탐구..

Apache ZooKeeper™는 분산 작업의 중앙 집중식 조정 서비스입니다. 주 서버 선출, 그룹 구성원 관리, 구성 정보 제공, 네이밍 및 대규모 동기화와 같은 일반적인 조정 작업을 수행합니다. ZooKeeper의 주요 목표는 분산 시스템의 운영을 보다 간단하게 하고, 시스템 내 복제본 간에 개선되고 더 신뢰할 수 있는 변경 전파를 공급하는 것입니다. Apache Kafka는 여러 서버(브로커)에서 실행되는 분산 퍼브-섭(pub-sub) 메시징 시스템입니다.브로커들은 서로 조정해야 하며, 카프카의 초기 몇 년 동안은 ZooKeeper가 이러한 조정을 제공했습니다.그러나 최근에는 KRaft라는 또 다른 소프트웨어 구성 요소로 대체되었습니다.이 장에서는 카프카 ZooKeeper, 그 한계 및 관련 대안에..

1. What is a Kafka offset?카프카의 운영 구조는 프로듀서, 소비자, 그리고 브로커로 구성됩니다. 프로듀서는 카프카 주제에 메시지를 생성하는 애플리케이션입니다. 카프카 브로커는 프로듀서로부터 메시지를 수신하고 이를 지속적으로 저장합니다. 소비자는 카프카 주제로부터 데이터를 읽는 애플리케이션입니다. 카프카 주제는 특정 비즈니스 목표와 관련된 데이터의 논리적인 그룹입니다. 주제는 병렬 처리를 지원하기 위해 파티션으로 나뉩니다. 카프카는 파티션 내에서 메시지를 추적하기 위해 오프셋이라는 식별자를 사용합니다. 모든 메시지는 고유한 오프셋 또는 식별값을 가집니다. 내부적으로 카프카는 메시지를 로그에 기록하며, 카프카 오프셋은 해당 파티션의 로그 내에서 메시지의 위치를 나타냅니다. 이는..

1. What are Kafka Topics?Kafka의 아키텍처는 세 가지 구성 요소로 구성됩니다: 프로듀서, 컨슈머, 그리고 브로커. 데이터는 메시지 형태로 프로듀서에서 컨슈머로 흐르며, 이 과정에서 브로커에 저장된 Kafka 토픽을 통해 이루어집니다. 토픽은 데이터 흐름을 조직하고 분배하는 논리적 채널 역할을 합니다. 토픽은 여러 개의 파티션으로 나누어집니다. 파티션은 불변의 순서로 시간에 따라 정렬된 메시지의 하위 집합을 포함합니다. Kafka는 여러 브로커—Kafka 클러스터의 노드—에 파티션을 복제하여 장애 허용성을 보장합니다. 파티션을 호스팅하는 브로커가 실패할 경우 Kafka는 자동으로 다른 브로커에 호스팅된 복제본으로 장애 조치를 수행하여 데이터 가용성과 서비스 연속성을 보장합니다. 토픽..