Ops/AWS

AWS Batch - No space left on device

mkdir.chandler 2023. 3. 17. 00:00
반응형

AWS Batch Trouble Shooting - No space left on device

 

 

 

■ 에러 메시지

메시지

No space left on device

 

 

■ 환경

EventBridge → Lambda → Batch (EC2)

 

 

■ 원인

Batch 잡을 실행하는 Docker의 disk 부족 현상

    - vCPU, Memory는 생성하면서 할당할 수 있지만 disk는 할당이 불가능

    - 별도의 설정을 하지 않으면 기본 Template를 사용하여 기동

    - 기본 Template의 Disk 용량은 30GB

 

 

■ 해결 방안

1. batch가 실행되면 수행되는 스크립트 (job) 의 확인 필요

    - Disk를 많이 잡아 먹는 케이스를 확인하여 S3에 업로드 후 삭제 처리 등의 조치

2. template를 만들어서 해당 template으로 batch 사용

    - https://aws.amazon.com/ko/premiumsupport/knowledge-center/batch-job-failure-disk-space/

 

 

■ 해결 시 고려사항

기본 template을 만들어서 사용하게 되면 그에 따른 비용증가도 고려해야 함

    - 해당 이벤트가 얼마나 자주 발생하는지를 체크

    - 자주 있지 않다면 batch job을 수정하는 방안으로 고려 (Disk 내용을 업로드하여 실시간 삭제)

 

 

 


by mkdir-chandler


 

 

 

 

 

728x90
반응형