SRE es lo que se obtiene cuando trata las operaciones como si fuera un problema de software. La misión de SRE es proteger, proporcionar y hacer progresar el software y los sistemas detrás de todos los servicios con un ojo siempre atento en su disponibilidad, latencia, rendimiento y capacidad.
Google tiene un sitio dedicado a SRE con libros, documentación y un montón de ayuda para las personas que dejan esta área.
Dejo link: https://sre.google/