일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 개발
- bigdata engineer
- 맛집
- bigdata engineering
- Trino
- Kafka
- 프로그래머스
- Apache Kafka
- apache iceberg
- pyspark
- 삼성역맛집
- 자바
- java
- Data Engineer
- 코엑스맛집
- 코엑스
- 여행
- Data Engineering
- 코딩테스트
- hadoop
- 백준
- HIVE
- Spark
- 코딩
- 영어
- BigData
- 알고리즘
- 코테
- Iceberg
- 용인맛집
- Today
- Total
지구정복
[Infra Solr] 자주 사용하는 쿼리 정리 본문
#모든 인덱스들 조회
curl "http://<infra solr_hostname>:8886/solr/admin/collections?action=LIST&wt=json"
{
"responseHeader":{
"status":0,
"QTime":0},
"collections":["ranger_audits"]}
#특정 인덱스의 field 정보 출력
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/schema/fields?wt=json&showDefaults=true"
#전체 데이터 개수 확인
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/select?q=*:*&rows=0"
#데이터 1개만 출력
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/select?q=*:*&rows=5&wt=json"
#가장 최근 _expire_at_ 값을 가진 데이터 1건 출력
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/select?q=*:*&sort=_expire_at_+desc&rows=1&wt=json"
#가장 오래된 혹은 최신의 evtTime 1건 조회
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/select?q=*:*&sort=evtTime+asc&rows=1&wt=json"
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/select?q=*:*&sort=evtTime+desc&rows=1&wt=json"
#특정 사용자, 최근 로그 1건
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/select?q=reqUser:poc_admin&sort=evtTime+desc&rows=1&wt=json"
#오늘로부터 30일 이전의 데이터들 모두 삭제
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/update" \
-H 'Content-Type: application/json' \
-d '{
"delete": { "query": "evtTime:[* TO NOW-30DAYS/DAY]" }
}'
#최적화하는 쿼리 (시간이 오래걸림, 이 작업동안 인덱스 실제 파일이 있는 서버의 디렉터리 용량이 거의 2배가 됐다가 최적화 이후에는 0.5~0.9배로 줄어들게됨)
#따라서 디스크 용량이 현재 차지하는 용량의 2배 이상은 있어야지 디스크 Full이슈 방지할 수 있음
#optimize=true 컬렉션의 모든 인덱스 세그먼트를 하나로 병합하는 작업 (Lucene의 force merge)
#waitFlush=true 최적화 작업이 끝난 후, 모든 변경사항을 디스크에 flush(쓰기) 될 때까지 기다림
#waitSearcher=true 새 인덱스 구조가 반영된 searcher가 활성화될 때까지 기다림 (즉시 검색 가능하도록)
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/update?optimize=true&maxSegments=1&waitFlush=true&waitSearcher=true"
'데이터 엔지니어링 정복 > Infra Solr' 카테고리의 다른 글
[Infra Solr] Ranger index 파일 용량 이슈 (0) | 2025.05.22 |
---|