Ono to ve skutečnosti může být docela trivka, pokud stačí mít jen jeden lookup. Protože jednotlivé nsqd (v podstatě vlastní brokery) můžu mít s naprosto stejnou konfigurací někde na OpenShiftu (například) s tím, že se budou připojovat k jednomu lookupu. A potom mě pád nsqd (resp. podů s ním) vlastně nevadí v případě, že je dané téma+kanál duplikováno. Samozřejmě pokud má běžet víc lookupů, je to už složitější, to asi admini nebudou úplně nejraději :-)
Moc nechapu proc by to mel byt problem. Predpokladam, ze by to fungovalo jako failover. Proste nsqd (a klienti) dostanou seznam lookupu a pripojej se na prvni dostupnej (nebo nahodne kvuli load balancingu). Je pak na lookupech, aby si data mezi sebou synchronizovali.
Moc sem to nezkoumal, takze nevim jestli je to takhle implementovany. Kazdopadne neni duvod aby ne. Podobne mame nastaveny tri licencni servery pro 500 databazovych serveru a podobne fungujou taky DNS servery...
No seznam se da pri instalaci/aktualizaci. Aktualizace v runtime proc? Snad se nemenej tak casto, aby to bylo potreba a v pripade potreby restart urcite nezabere tak dlouho jako DB serveru s nekolika TB dat a kterej je nutnej taky restartovat pro update licencnich serveru. Zkouseni jestli je v provozu a prepnuti na dalsi v seznamu je vetsinou reseny timeoutem. Fakt v tom nevidim nic slozityho...
Bylo by hodně pěkné mít nějakou tabulku s porovnáním message brokerů z různých pohledů. Protože někdo může preferovat jednoduchost nasazení a nemusí mu vadit třeba nějaké výpadky, další má zase k dispozici obrovský cluster a má jiné požadavky. Nikde jsem to nenašel a tady už zaznělo snad 10 message brokerů...