Cloud
SRE(Site Reliability Engineering)
개발자가 셀프 서비스로 운영을 하려면 그 플랫폼이 자동화되어 있어야 한다. 애플리케이션을 빌드하고 유연하게 배포하고, 이를 모니터링할 수 있는 플랫폼이 필요한데, SRE의 역할은 이러한 플랫폼을 개발하고, 이 플랫폼 위에서 개발자들이 스스로 배포,운영을 하는 것이 목표이다. 물론 완벽한 셀프 서비스는 불가능하다. 여전히 큰 장애 처리나 배포등은 SRE 엔지니어가 관여하지만 많은 부분을 개발팀이 스스로 할 수 있도록 점점 그 비중을 줄여 나간다. # SRE 엔지니어가 하는 일 1. Metric & Monitoring : 모니터링 지표 정의 및 모니터링 시스템 구축 2. Capacity Planning : 용량 계획 3. Change Management : 변경 관리 4. Emergency Response ..
2021. 7. 6. 23:22