Skip to main content

사이트신뢰성엔지니어링(SRE)의 요약

Jpub에서 발간한 사이트신뢰성 엔지니어링에 대해 읽고, 자체적으로 해석한 결론입니다. (정확하진 않을수 있습니다. 말 그대로 자체 해석...)

구매는 요기 - http://www.yes24.com/Product/Goods/57979286

SRE역활

  1. Site Reliability Engineer 의 약자로, 소프트웨어 엔지니어링과 IT인프라 운영 그 중간쯔음에서 일하는 역활로, 직접 만든, 혹은 오픈소스를 활용해 시스템의 안정성과 확장성을 유지하고 개선하는 업무
  2. Devops/SRE의 업무 목표는 신속한 서비스 제공을 위해 기업문화, 자동화툴을 이용한 플랫폼 설계/구축 하는 공통적인 업무영역이 있는데, 접근하는 방법이 살짝 다른듯. 어떠한 문제와 개선을 하기 위해서는 "무엇을 해야 하는지?-devops" "어떻게 할 수 있는지-SRE"의 차이점이 있는듯 하다.

업무지표

  1. 안정성과 확장성을 수행하기 위해서는 기준되는 지표가 필요한데, 여기서 나오는 용어가 SLA / SLI / SLO 3가지 용어
    1. SLA(Service Level Agreement) - 운영팀과 고객간의 서비스 수준에 대해 품질, 가용성 등 주체적인 기준을 설정하는 지표 (구글의 경우 법적인 효력이 있기 때문에 쉽게 변경해서는 안됨)
    2. ,SLI(Service Level Indicator) - 서비스 수준을 측정하는 지표.. 예를들어 대기시간, 가용성, 처리량 등의 자료가 포함
    3. SLO(Service Level Objective) - SLI에서 도출된 지표를 어느정도의 수준으로 품질을 정할것인지 정하는 기준.
  2. 대충이렇게 정리할 수 있을듯 하다.