반응형
AWS Batch Trouble Shooting - No space left on device
■ 에러 메시지
메시지
No space left on device
■ 환경
EventBridge → Lambda → Batch (EC2)
■ 원인
Batch 잡을 실행하는 Docker의 disk 부족 현상
- vCPU, Memory는 생성하면서 할당할 수 있지만 disk는 할당이 불가능
- 별도의 설정을 하지 않으면 기본 Template를 사용하여 기동
- 기본 Template의 Disk 용량은 30GB
■ 해결 방안
1. batch가 실행되면 수행되는 스크립트 (job) 의 확인 필요
- Disk를 많이 잡아 먹는 케이스를 확인하여 S3에 업로드 후 삭제 처리 등의 조치
2. template를 만들어서 해당 template으로 batch 사용
- https://aws.amazon.com/ko/premiumsupport/knowledge-center/batch-job-failure-disk-space/
■ 해결 시 고려사항
기본 template을 만들어서 사용하게 되면 그에 따른 비용증가도 고려해야 함
- 해당 이벤트가 얼마나 자주 발생하는지를 체크
- 자주 있지 않다면 batch job을 수정하는 방안으로 고려 (Disk 내용을 업로드하여 실시간 삭제)
by mkdir-chandler
728x90
반응형
'Ops > AWS' 카테고리의 다른 글
AWS CLI - 설치 방법 (Win, Linux) (0) | 2023.03.19 |
---|---|
AWS CLI - delete 명령어 (0) | 2023.03.18 |
AWS 보안 Tip - VPC Endpoint 활용 (0) | 2023.03.16 |
AWS 보안 Tip - VPC default 설정 삭제 (0) | 2023.03.15 |
AWS 보안 Tip - S3 액세스 제한 (0) | 2023.03.14 |