반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- CentOS
- leetcode
- 리트코드
- 프로그래머스
- Optimization
- AWS
- 엘라스틱서치
- Easy
- dump
- 스파크
- kibana
- ELK
- 파이썬
- dfs
- RecommendationSystem
- solution
- Algorithm
- 키바나
- 장고
- Medium
- 알고리즘
- daspecialty
- 깊이우선탐색
- Spark
- Django
- 해시
- python
- twosum
- elasticsearch
- programmers
Archives
- Today
- Total
반응형
목록tuning (1)
Archive
[Spark] Spark Application 최적화 및 튜닝 (Dynamic Allocation/Executor Memory/Partitions)
0. Overview 대규모의 Spark Workload는 매일 야간에 혹은 몇 시간 간격으로 배치 잡으로 실행되는 경우가 많다. TB급 이상의 데이터를 처리하다 보면 resource 부족이나 점진적인 성능 저하에 따른 Job failure을 겪을 수가 있다. Resource 사용 최적화, Task의 병렬 실행, 다수의 Task에 의한 Bottleneck 문제를 어떻게 피하는지 등 문제 해결에 도움을 줄 Spark Configuration 들을 살펴보고자 한다. 1. Spark Configuration Setting Spark Configuration 설정을 하는 방법들 중에서 우선순위가 존재한다. spark-default.conf -> spark-submit을 통해 설정된 값 -> Spark Appli..
------- DE -------/Spark
2022. 9. 30. 01:15
반응형