| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
- 맛집
- 알고리즘
- Data Engineering
- 영어
- Spark
- 코딩테스트
- 코테
- apache iceberg
- 자바
- 개발
- 여행
- Data Engineer
- java
- 프로그래머스
- Iceberg
- 코엑스맛집
- Kafka
- BigData
- bigdata engineering
- 백준
- Apache Kafka
- HIVE
- pyspark
- Linux
- 삼성역맛집
- bigdata engineer
- 코딩
- HDFS
- hadoop
- Trino
- Today
- Total
목록consumer (3)
지구정복
카프카 클라이언트는 애플리케이션이 카프카 브로커와 상호작용할 수 있도록 해주는 라이브러리입니다. 클라이언트는 주제로 메시지를 생산하고, 주제로부터 메시지를 소비하며, 관리 작업을 수행하는 등의 다양한 작업을 가능하게 합니다. 카프카 클라이언트는 애플리케이션과 카프카를 연결하여 카프카의 스트리밍 기능을 다른 소프트웨어 시스템에 통합할 수 있도록 합니다. 1. Best practices in Kafka client configurations카프카 클라이언트와 작업할 때 모범 사례를 구현하면 애플리케이션 내에서 효율적이고 신뢰할 수 있으며 안전한 메시지 처리를 보장할 수 있습니다. 고려해야 할 몇 가지 사항은 다음과 같습니다. 1.1. Throughput optimization지연 시간과 처리량 간의 균형을..
1. What is a Kafka offset?카프카의 운영 구조는 프로듀서, 소비자, 그리고 브로커로 구성됩니다. 프로듀서는 카프카 주제에 메시지를 생성하는 애플리케이션입니다. 카프카 브로커는 프로듀서로부터 메시지를 수신하고 이를 지속적으로 저장합니다. 소비자는 카프카 주제로부터 데이터를 읽는 애플리케이션입니다. 카프카 주제는 특정 비즈니스 목표와 관련된 데이터의 논리적인 그룹입니다. 주제는 병렬 처리를 지원하기 위해 파티션으로 나뉩니다. 카프카는 파티션 내에서 메시지를 추적하기 위해 오프셋이라는 식별자를 사용합니다. 모든 메시지는 고유한 오프셋 또는 식별값을 가집니다. 내부적으로 카프카는 메시지를 로그에 기록하며, 카프카 오프셋은 해당 파티션의 로그 내에서 메시지의 위치를 나타냅니다. 이는..
참고하면 좋은 블로그글 https://colevelup.tistory.com/18 1. Kafka partitionApache Kafka는 고성능 데이터 파이프라인과 스트리밍 분석을 위한 오픈 소스 분산 이벤트 스트리밍 플랫폼입니다.Kafka의 확장성(scalability)과 성능(performance)을 가능하게 하는 핵심 요소 중 하나는 토픽(topic)과 파티션(partition)이라는 개념입니다.Kafka에서 메시지는 “토픽”에 기록됩니다.토픽은 이벤트의 논리적인 그룹으로, 생산자(producer)와 소비자(consumer)가 메시지를 분류하는 데 도움을 줍니다.이러한 토픽은 Kafka 브로커에 저장됩니다.Kafka는 토픽을 더 작은 단위인 파티션(partition)으로 나눕니다.파티션은 추가 ..