Mam takovy dojem te tvym routerem neteklo v okamziku vypadku 180Gbps
http://nix.cz/cz/summary_graph
Julian
Nevim jak tvoji zakaznici, ale ti moji by jiste skakali radosti, kdybych se den, dva ... nebo trebas tyden rejpal v serveru/switchi/... a zjistoval, proc to ci ono nejde. Specielne kdyz se bavime o provoznich nakladech ve stovkach tisic ... (na den, samo) .... pro takove veci maji opravdu velke pochopeni ...
1) nauc se cist
2) az to zvladnes, tak mozna zjistis, ze reaguju na sekvenci:
"nakonec jsem misto obtezovani sveho okoli banalnim problemem, zapojil novy router "
"Asi je trochu rozdíl vyměnit switch za tři stovky a za tři mega :-)."
"Ne všechno se řeší výměnou, "
--- "Kupodivu v alespon trochu profi prostredi se VZDY a VSE resi vymenou."
O tom co delali nebo nedelali v NIXu nepadlo ani slovo.
Je uplne jedno jaky mas nebo nemas vypadky. Libovolny vypadky znamenaji nejaky problem. Pak nastavaji dve moznosti. Bud sem se v tom relativne nedavno nejak rejpal a neco nekde zmenil => obnovim zalohu puvodni konfigurace. Nebo sem na to uz 100let nesah (coz je v pripade sitovych prvku velmi pravdepodobny) a pak jednoduse vymenim zelezo za zalozni (pripadne mi staci vypnout to problemovy a provoz prevezme zaloha automaticky). A teprve pak se v tom zeleze muzu nekde v labaku rejpat a zjistovat, co ten problem zpusobuje.
I kdyz... je fakt ze rejpat se v tom za chodu je docela slusnej adrenalin ...
Jinak ad vymena soho routeru za par kil vs vymena cisca za par mega ... z pohledu provozovatele je to prevazne naprosto irelevantni uvaha. Pokud provozuju HW za par mega, tak me tech par mega rozhodne nevytrhne. Dokonce to trebas v pripade cisca (a jiste i dalsich) vyjde levnejs, nez si na to platit support (cena dvou switchu + support == treti switch + uspora).
Nahodou ja bych rekl, ze pise celkem rozumne. Nerekl bych, ze je to sitar/spravce site, takze tva otazka mi prijde dost nevhodna. Rekl bych, ze se stara o nejaky vetsi produkcni servery/sluzby/systemy a ty veci, co zde pise, si z prstu sam nevycucal, jsou to imho bezne postupy v serioznich produkcnich prostredich.
Hmm ... co ti spadlo na hlavu? Asi to bylo celkem hmotne ... Tebe bych si opravdu najal ... a byl 14 dnu mimo provoz, protoze ty budes zkoumat, co tomu je ... pekne za chodu. Protoze pokud je nekdo takovej negramot, ze si neumi precist jedinou vetu, tak to opravdu musi bejt hlava pomazana ... nebo spis vymazana?
Narozdil od tebe spoluadminuju zakaznika kterej ma HW v 4ech stojanenech za slusnych par mega. A realita? jemu je opravdu zcela uprdele jestli vemu trebas switch za 200k a hodim ho do popelnice, pokud to zajisti spolehlivej provoz.
Ovsem kdyby tvoje schopnost cteni dostahovala alespon na uroven absolventa 5ty tridy zvlastni skoly, tak by ses trebas docet, ze si ten switch vemu do labaku a co se mu nelibi si budu zjistovat tam.
Problem kolikrat je, ze clovek by sakra chtel hned dil vymenit ale vendor to nepovoli ani nejlepsimu zakaznikovi.
Na druhou stranu u telco operatora zazijete vymenu jedne strany spoje jen diky castym nahodnym zmenam v parametrech "pro jistotu".
Dulezite je mit moznost izolovat problemovou cast od bezproblemove. Coz jde za predpokladu ze neni naborena failover logika reseni ktera by to mela zajistovat ze. Pruser u tehle velkych reseni je ze jsou tak nechutne draha, ze nemate vedle ve stojanu stejny prvek do ktereho muzete postupne prepojovat problemovou cast. Nekdy dokonce tak nechutne draha, ze nemace celou skatuli v cechach ale objednava se na zakazku extra letadlem ze zahranici.
Ultimativni duvera ve vendora ze izolace vadne casti bude fungovat vzdy v ramci dodaneho reseni se vyplaci jen v pripade ze je schopen kryt skody v ramci sveho SLA;)
Zrovna u tehle velkych reseni ma urcita analyza i sve vyhody. Storky kdy technik po vymene skolo vsech desek je stale na miste a zbyva uz jedine vymena celeho backplane boardu nejsou vyjimecne.
Nebo: Ten sitovej prvek pri selhani pusti provoz zkrz. A zkouseli jste to pred nasazenim do produkce? Ne v prirucce tenhle test neni. Ale pisou ze to tak pry funguje... Ke ktery verzi firmwaru jsi studoval prirucku? Ma ten board firmware dle compatibility matrixu k main boardu kdyz byl 2 roky na sklade a board je novy? Provedli jste testovani kdyz vytrhnete kabel a umre modul? Ne. Provedli jste testovani kdyz je port up ale data netecou na druhou stranu? Ne.
Takove prakticke blbosti ale je to ze zivota. Neco co akademik nepochopi, ale clovek praktik ktery to potom od zakaznika odnese a ma "cit pro stroje" hned chytne.
Drahy kolego. Ani nevis jak ti rozumim;) Taky zjistujes ze Oracle zamestnal na L1 hromady indu? Jedou presne podle prirucky. Masina nejde vubec zapnout. Udelejte mi servisni snapshot a zkuste tyto prikazy. Na palici.
Clovek musi tlacit na pilu. Jinak to nejde. No nejlepsi je kdyz radi zakaznik supportu jak to spravit. Uplne nejlepsi je kdyz je to treba byvaly interni zamestnanec.
Jojo jak ten trasceiver o kterym mluvil takovej hrozne neprijemnej, arogantni pan na Matfyzu, co ho vsichni nenavideli a jehoz jmeno sem uz zapomnel, ze meli nejak spatne navrzeny PHY a urcity JPEGy to neprenaselo, protoze tam vznikla nejak velka LF slozka kterou to PHY nedokazalo kvyuli chybnemu navrhu handlovat
Sem taky videl stelitni prijimac, ktery mel problem s prenosama zavodu v lyzovani - jak tam bylo hodne bile, urezavaly se synchronizacni impulsy a vypadavala synchronizace na TV, byl vadny navrh tranzistoroveho sledovace na baseband. Musel jsem to opravit, pak to slo dobre.
SLAcka jsou prevazne nanic, to je jen takova vejicka, protoze stejne neexistuje dodavatel, kterej by ti ve smlouve podepsal, ze pri nedodrzeni SLA uhradi veskery skody.
Ostatne, kdyz si realne prectes vsemozny supporty a jeich pravidla, tak zjistis, ze ten nejlepsi support ti tak maximalne zajistuje, ze do tech 4 hodin ti nekdo zvedne telefon a rekne "OK, berem na vedomi". Vubec nikde neni receno, ze a za jak dlouho bude problem vyresen (pripadne to jsou minimalne dny).
Chtel sem kdysi pro jednoho zakaznika od dellu support (a bylo mi opravdu jedno kolik si za to reknou), kterej zajisti, ze do 4 hodin od nahlaseni problemu problem vyresej - trebas tim, ze privezou kompletni hw. Nebyli schopni neco takovyho poskytnout ... ani za penize ne ...
Takovi dodavatele jsou a neni jich malo. Jsou na to i pojisteni. Samozrejme musis podle toho mit reseni a HW. To ze to treba tak v realu nefunguje to mne jako technika nezajima. To uz si vyresi manazer se zakaznikem. Firma nesplnila povinnost za coz zaplati penale a bude uhanet dodavatele na nahrade skody.
To ze to nebyl schopen nabidnout Dell treba formou subdodavky nemusi byt chyba obchodniku, ale toho jak ta spolecnost funguje. Nebo mozna jste pro ne taky nebyli zajimavi;)