Také by mne zajímalo, co je špatného na procesu, který byl odstřelen OOM killerem.
Spatne je na tom to, ze by k takove situaci melo dochazet naprosto vyjimecne. A dostupnost sluzby by se mela resit jinak nez neustalym restartem procesu. Od toho je tu load balancing, clusterware a v neposledni rade monitoring.
clusterware systemy se kterymi jsem pracoval stejne pouzivaly "failure startup count" a nepokousely se startovat sluzby porad dokola.