반응형
Notice
Recent Posts
Recent Comments
Link
관리 메뉴

지구정복

[Infra Solr] 자주 사용하는 쿼리 정리 본문

데이터 엔지니어링 정복/Infra Solr

[Infra Solr] 자주 사용하는 쿼리 정리

noohhee 2025. 5. 23. 00:14
728x90
반응형

 

 

 

#모든 인덱스들 조회
curl "http://<infra solr_hostname>:8886/solr/admin/collections?action=LIST&wt=json"
{
  "responseHeader":{
    "status":0,
    "QTime":0},
  "collections":["ranger_audits"]}

 

 

#특정 인덱스의 field 정보 출력
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/schema/fields?wt=json&showDefaults=true"

 

 

#전체 데이터 개수 확인
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/select?q=*:*&rows=0"

 

 

#데이터 1개만 출력
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/select?q=*:*&rows=5&wt=json"

 

#가장 최근 _expire_at_ 값을 가진 데이터 1건 출력
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/select?q=*:*&sort=_expire_at_+desc&rows=1&wt=json"

 

 

#가장 오래된 혹은 최신의 evtTime 1건 조회 
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/select?q=*:*&sort=evtTime+asc&rows=1&wt=json"
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/select?q=*:*&sort=evtTime+desc&rows=1&wt=json"

 

 

#특정 사용자, 최근 로그 1건
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/select?q=reqUser:poc_admin&sort=evtTime+desc&rows=1&wt=json"

 

 

#오늘로부터 30일 이전의 데이터들 모두 삭제
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/update" \
  -H 'Content-Type: application/json' \
  -d '{
    "delete": { "query": "evtTime:[* TO NOW-30DAYS/DAY]" }
  }'

 

 

#최적화하는 쿼리 (시간이 오래걸림, 이 작업동안 인덱스 실제 파일이 있는 서버의 디렉터리 용량이 거의 2배가 됐다가 최적화 이후에는 0.5~0.9배로 줄어들게됨)
#따라서 디스크 용량이 현재 차지하는 용량의 2배 이상은 있어야지 디스크 Full이슈 방지할 수 있음
#optimize=true  컬렉션의 모든 인덱스 세그먼트를 하나로 병합하는 작업 (Lucene의 force merge)
#waitFlush=true  최적화 작업이 끝난 후, 모든 변경사항을 디스크에 flush(쓰기) 될 때까지 기다림
#waitSearcher=true  새 인덱스 구조가 반영된 searcher가 활성화될 때까지 기다림 (즉시 검색 가능하도록)
curl "http://<infra solr_hostname>:8886/solr/ranger_audits/update?optimize=true&maxSegments=1&waitFlush=true&waitSearcher=true"

 

728x90
반응형
Comments