-
나는 항상 모니터링할 수 없다
일전에 장애 대응을 위해 서버에 유지보수를 위해 모니터링을 도입했다. 운영 중인 서비스 특성상 기능 개발, 버그 대응, 배포 등 여러 작업을 동시에 처리해야 했다. 그 과정에서 지표를 일일이 지속적으로 확인하는 모니터링 방식에는 분명한 한계가 있었다....
/ 6 min readengineering devops -
배포했더니 서버가 죽을 뻔 했던 건에 대하여
서버가 응답이 없다 운영 서버(t3.small)에 Docker 기반 무중단 배포를 시도하는 과정에서, 신규 컨테이너와 기존 컨테이너가 공존하는 시점에 메모리와 CPU 사용량이 임계치를 초과하는 현상 발생하고 있었다. 이로인해 배포 진행 중 SSH 접속...
/ 5 min readengineering backend devops - Engineering
GitHub Actions에서 Private 인스턴스로 점프하기
진행하고 있는 프로젝트에서 보안 이슈가 빈번히 발생했고, 이를 해결하기 위한 방안 중 하나로 인스턴스들을 Private Subnet으로 숨길 필요성이 생겼다. 그래서 모든 인스턴스들을 Private Instance로 변경하고, SSH 접근을 위해 Ba...
/ 5 min readengineering devops