본문 바로가기

Ops/AWS

AWS Batch - No space left on device

반응형

AWS Batch Trouble Shooting - No space left on device

 

 

 

■ 에러 메시지

메시지

No space left on device

 

 

■ 환경

EventBridge → Lambda → Batch (EC2)

 

 

■ 원인

Batch 잡을 실행하는 Docker의 disk 부족 현상

    - vCPU, Memory는 생성하면서 할당할 수 있지만 disk는 할당이 불가능

    - 별도의 설정을 하지 않으면 기본 Template를 사용하여 기동

    - 기본 Template의 Disk 용량은 30GB

 

 

■ 해결 방안

1. batch가 실행되면 수행되는 스크립트 (job) 의 확인 필요

    - Disk를 많이 잡아 먹는 케이스를 확인하여 S3에 업로드 후 삭제 처리 등의 조치

2. template를 만들어서 해당 template으로 batch 사용

    - https://aws.amazon.com/ko/premiumsupport/knowledge-center/batch-job-failure-disk-space/

 

 

■ 해결 시 고려사항

기본 template을 만들어서 사용하게 되면 그에 따른 비용증가도 고려해야 함

    - 해당 이벤트가 얼마나 자주 발생하는지를 체크

    - 자주 있지 않다면 batch job을 수정하는 방안으로 고려 (Disk 내용을 업로드하여 실시간 삭제)

 

 

 


by mkdir-chandler


 

 

 

 

 

728x90
반응형

'Ops > AWS' 카테고리의 다른 글

AWS CLI - 설치 방법 (Win, Linux)  (0) 2023.03.19
AWS CLI - delete 명령어  (0) 2023.03.18
AWS 보안 Tip - VPC Endpoint 활용  (0) 2023.03.16
AWS 보안 Tip - VPC default 설정 삭제  (0) 2023.03.15
AWS 보안 Tip - S3 액세스 제한  (0) 2023.03.14