Ha bárki azt gondolja, hogy a DevOps és a fejlesztői munka kizárólag a programozásról és a kód megírásáról szól, az hatalmasat téved. A modern informatika sokrétű és szerteágazó tudomány, amelynek számos részterület a szerves részét képezi. Ezek közé tartozik az ellenőrzés és naplózás (monitoring and logging) folyamata is.
Ha röviden szeretnénk leírni, mit jelent az ellenőrzés folyamata, azt is mondhatnánk: ez egy folyamatos megfigyelés. Az informatikában összefoglaló néven monitoring, amelynek a feladata az, hogy visszajelzést adjon az élesben futó rendszerek aktuális állapotáról. Képet fest az alkalmazások teljesítményéről, használati mintákat rögzít annak érdekében, hogy biztosak lehessünk abban: az eszköz, amiért felelősséggel tartozik, elérhető legyen, illetve megfelelő minőségben működjön. Üzleti szempontból a megfigyelés vonatkozhat az egész infrastruktúrára, egy szolgáltatásra vagy egy alkalmazásra.
A cél a megfigyeléssel az, hogy minimálisra csökkentsük az alábbi két mérőszámot.
Természetesen a megfigyelés minősége attól is függ, milyen rendszerrel dolgozunk. A felhő esetében a mögöttes infrastruktúrát a szolgáltató felügyeli, azzal nekünk nem kell foglalkoznunk, így a megfigyelés az alkalmazásokra korlátozódik.
Érdekesség: az automata kommunikáció, amely a folyamatos megfigyelésből származó adatokat továbbírja, telemetria néven ismert.
A fentieken kívül megkülönböztethetünk megfigyeléseket a proaktív, illetve reaktív felosztás mentén is. Előbbi – és ide tartozik a DevOps által alkalmazott megfigyelés – arra koncentrál, hogy a problémákat még azok megjelenése előtt leleplezze, ezáltal gyors megoldással tudjon reagálni a felmerülő helyzetre. Ebből kifolyólag a reaktív megfigyelés a már megtörtént eseményekre reagál.
A folyamatos ellenőrzés fogalma a DevOps esetén azt a technológiát jelöli, amelynél a fejlesztés minden szakaszát megfigyeljük. Ez abban segít, hogy az alkalmazások és az infrastruktúra megfelelő állapotban, teljesítménnyel és megbízhatósággal bírjon a fejlesztéstől az élő környezetbe való beillesztésig.
A folyamatos megfigyelés nem működhetne a naplózás, azaz az események, hibák és figyelmeztetések listázása, illetve lejegyzése nélkül. Ez az ellenőrzés reaktív eleme abból a szempontból, hogy ha valami, amit előre beállítottunk, megváltozik, a naplózó rendszer erre reagál. A legegyszerűbb felosztás alapján, ha egy riasztás elér egy küszöbértéket, a rendszer válaszol rá a beállításoknak megfelelően. Ez a reakció a legtöbb esetben egy figyelmeztetés küldése annak, aki döntést hozhat. A megfelelő minőségű naplózás elegendő információt jegyez le azért, hogy a döntéshozó tiszta képet kapjon a hibáról, majd annak megfelelően, időben tudjon cselekedni.
A legismertebb ellenőrző és megfigyelő eszközök közé tartoznak a Nagios, a Consul, az Azure, a Monitor, a Zabbix, a Prometheus és az Amazon Cloudwatch alkalmazásai.