1) Omezení, že logovací systém nedokáže uložit newlines a řídící znaky mi přijde jako něco, s čím dokážu v pohodě žít. A pak už není potřeba escapovat při zobrazení. Do textového logu bych escapoval třeba tak, že bych "\" nahradil za "\\" a newline nahradil za "\n" (stejně tak \r a spol.).
Schválně jsem si zkusil do syslogu poslat newline pomocí logger "něco s newline" (doufám že to nedělá escape už na klientovi) a zalogovalo to místo ní "#012". To není úplně optimální, protože když tam pošlu doslova "#012", tak to pak nejde odlišit od newline (správně by to mělo třeba ještě escapovat křížek), ale na druhou stranu myslím že lidi by neměli do logů posílat newlines a tohle zařídí že se to nerozbije, holt za cenu nejednoznačnosti.
2) Jo, tak nějak jsem si to myslel, že to alokuje filesystém třeba po stránkách. Hard reset je můj častý případ v tom, že je to ze způsobů ukončení systému ten běžný (výpadek elektřiny, zátuh (to se mi děje na notebooku občas bohužel)). Ale jen výjimečně potřebuju logy co byly těsně před tím (to pokud by to bylo tím způsobeno - většinou je to ale nesouvisející externí příčinou).
Checksum jsem dával jenom jako příklad že to nevyžaduje binární logy a šlo by to implementovat i nad textovými.
3) Výchozí v Debianu. Tobě to funguje?
Nj, já jsem byl předtím SOHO admin kde to bylo heterogenní a bylo toho málo, a teď jsme v živelné fázi startupu, tak se to dělá takhle (a taky je těch strojů pár). Logy přeposíláme jenom s velkou severity za účelem alertování.
SOHO adminování byly takové ty běžné webservery, mailservery a tak; a teď mám radary :) což je průmyslové PCčko, ke kterému je připojené bladeRF a hromada sériáků přes které se to různě ovládá a měří. Aktuálně to provozujeme tak že se tam nasshčkujeme a čteme logy (případně si soubory odpovídající času kdy se něco rozbilo zkopírujeme). A taky to tak, no, vyvíjím, protože dost věcí se blbě dělá na stole. A pak to má lokální influx+grafanu, do které se sbírají metriky po sekundách, a do globální grafany se posílají minutové agregace - pro bližší zkoumání některých problémů jsou potřeba ta sekundová data. To dělám tak že si protuneluju po SSH port 3000 a připojím se na tu grafanu lokálním prohlížečem :).