'BigData' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/08 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Tags more

Archives

Today

Total

관리 메뉴

728x90

목록BigData (44)

지구정복

[Ambari] 설치된 모든 컴포넌트 설정값 백업하기

환경에 따라 다를 수 있습니다. Ambari metaDB가 설치된 서버로 접속하여 아래 쉘 실행 [root@master01 ambari]# cat backup_ambari_configs.sh#!/bin/bash# MariaDB 접속 정보DB_NAME="ambari"USER="root"PASSWORD="mypassword"# 쿼리 실행과 결과를 텍스트 파일에 저장mysql -u "$USER" -p"$PASSWORD" "$DB_NAME" -e "SELECT cc.*FROM clusterconfig ccJOIN ( SELECT type_name, MAX(version) AS max_version FROM clusterconfig GROUP BY type_name) AS groupedON c..

데이터 엔지니어링 정복/Ambari 2025. 8. 6. 09:09

[Superset] Query Timeout Issue

슈퍼셋에 트리노 연동해서 사용중인데아래와 같이 트리노 쿼리 실행하면 30초안에 timeout발생하는 이슈 발생 trino error: the query exceeded the 30 seconds timeout this may be triggered by Issued 1002 - the database returned an unexpected error 참고: https://community.cloudera.com/t5/Support-Questions/Superset-timeout-issue-of-30-sec-restarted-Superset-service/td-p/303388 Ambari Superset에서 아래 설정들을 해줘야한다.Ambari를 사용하지 않으면 superset_config.py에 추가..

데이터 엔지니어링 정복/SuperSet 2025. 7. 11. 15:09

[Airflow] SqoopOperator

먼저 airflow 가 사용하는 Python의 pip로 해당 패키지 설치# /airflow/.pyenv/versions/3.7.11/envs/venv/bin/pip3 install apache-airflow-providepypi repo로 설치가 안되면 수동설치해야한다. 그리고 아래와 같이 사용한다.from airflow import DAGfrom airflow.providers.apache.sqoop.operators.sqoop import SqoopOperatorfrom datetime import datetime default_args = { 'owner': 'airflow', 'start_date': datetime(2022, 1, 1),} with DAG( dag_id='sqoo..

데이터 엔지니어링 정복/Airflow 2025. 7. 2. 14:21

[Spark] org.apache.spark.SparkException: Cannot broadcast the table that is larger than 8.0 GiB: 11.3 GiB.

spark 3.4.1 내부적으로 브로드캐스트 조인시에 브로드캐스트될 테이블이 너무 클 경우 아래 에러가 발생한다.Traceback (most recent call last): File "", line 1, in File "/usr/my/current/spark3-client/python/pyspark/sql/session.py", line 1440, in sql return DataFrame(self._jsparkSession.sql(sqlQuery, litArgs), self) File "..

데이터 엔지니어링 정복/Spark 2025. 7. 1. 11:11

Prev 1 2 3 4 ··· 11 Next

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

지구정복

목록BigData (44)

지구정복

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역