Konec třetího odstavce je špatně přeložený:
"...malý vzorek, konkrétně pouhých 99 kusů disku, pročež jediné, co lze říci s jistotou, je skutečnost, že o kondici hypotetického stého disku nelze říci nic."
"...data sample is still somewhat small. For example, if there had been just 1 (one) drive failure during the year, the Annualized Failure Rate (AFR) for that Toshiba model would be 0.92%—still excellent, not 0%."
Ve zdrojovém článku píšou, že kdyby byl jeden disk vadný, stále by z toho model Toshiba vycházel velmi dobře. Váš (automatický?) překladač ovšem přidal nesmyslný závěr že o tom nelze říci nic. Což je samozřejmě špatně, závěry lze dělat i na menším vzorku, jen je spolehlivost závěrů menší. Jak moc je menší, na to nám dokáže odpovědět statistika.
Můj tajný sen je, že se statistika povinně vyučuje celou dobu studia na vysoké škole, a to včetně humanitních oborů jako je novinařina apod.
Já chodil na VŠ na statistiku kde jsme měli přednášky (a některá cvika) spojené s nějakým humanitim oborem, už si přesně nepamatuji, jakým, ale byly tam samé holky. Takže váš sen se částečně stal skutečností. Bohužel, z toho jak jsem viděl jak je výuka bavila a jak vypadaly písemky bych moc na následné uplatnění v praxi moc nesázel...
Ta pasáž není překladem originálu, doporučuji znovu přečíst. Ne vždy píši jen čisté překlady. Nicméně jsem přidal doplňující větu. Věřím, že laskavý čtenář bude souhlasit, že vyvozovat závěry na vzorku 99 disků není rozumné, zatímco na vzorku např. 37 tisíc disků to už celkem rozumné je (nápověda: výrobní série).
Jak s tím vším souvisí Váš tajný sen, nechápu.
Jak jste přišel na to, že 99 disků není rozumný počet, a 37 000 disků už je rozumný počet? Jak kvantifikujete Vaši "rozumnost", abyste mohl říct, že tolik ano, tolik už ne? Nápověda nepomáhá.
Doporučuji znova pozorně přečíst co jsem napsal:
"závěry lze dělat i na menším vzorku, jen je spolehlivost závěrů menší."
A přesně to v původní zprávě dělají:
"For example, if there had been just 1 (one) drive failure during the year, the Annualized Failure Rate (AFR) for that Toshiba model would be 0.92%—still excellent, not 0%."
Neboli uvažují, co se stane, když jeden disk selže. Dostanou AFR 0.92%, což podle nich není špatné.
Vy jste tuhle úvahu šmahem zdrtil slovy "není rozumné". Proč, to není jasné. Možná kdybyste napsal jen pouhý překlad, dopadlo by to lépe.
Docela mě prudí, že mi odpovíte, přičemž děláte jako byste ani nečetl můj komentář. Co mi zbývá než to tupě vysvětlit znova?
Místo aby jste poděkoval za statistiku a za článek rešíte drobnosti. My provozujeme cca 8k+ mechanických disků a věřit nejde ničemu a nikdy, těch faktorů je tolik že prostě pracujeme metodou střídání modelů/kapacit ať se nedostaneme do fail-pasti, rád si vždy počtu jak si někdo dal práci uceleně se na problematiky disků podívat, jako soukromá firma by mohla prdnout jen PR zprávu obsahující dílčí info kde zdůrazní jak jsou velicí. Podle mě je tam snaha prostě situaci pomoci, protože jejich konkurenti na tom nemají jak vidělat profitují z toho všichni tím že se soustředí na ty ze spolehlivých serii/modelů. Mnohem víc bych řekl že ty storage firmy trápí různe pseud-smr techniky a spol kdy disk sice funguje ale o tom jak se chová a jak predikovat jak se chovat bude neví nikdo nic (ne věřejně).
Dobrá, tak ještě trochu jinak:
"závěry lze dělat i na menším vzorku, jen je spolehlivost závěrů menší."
Mám tady doma 1ks disku Samsung 2TB (modelové označení vem čert). Funguje po 6 letech provozu 24/7 stále ok, čili z toho vyvozuji závěr "XYZ". K čemu takový závěr komukoli je? Zejména mému kamarádovi, jemuž přesně stejný disk, ale z jiné výrobní série, umřel po 1 roce provozu.
Moje pointa je taková, že ano, sice můžete něco usuzovat na 99 discích, ale to něco bude chabě podložené a je úplně jedno, jak se budete ohánět oborem statistickým, čím více se blížíte k 1ks, tím více stojí vaše závěry za prd.
Můžete jakkoli citovat "závěr který oni z toho vyvozují" jako doklad Vašeho tvrzení, ale ono je to o něčem trochu jiném, je to spíše pouhé konstatování, nic víc.
Váš komentář jsem četl, stejně jako tento. Odpovídám či reaguji na to, co považuji za podstatné, což bláboly o novinařině nejsou (mimochodem narážku na to jste prozměnu zase přešel bez povšimnutí vy a je to samozřejmě v pořádku).
Rozdíl je v tom, že vy používáte velmi vágní termíny „není rozumné“ nebo “chabě podložené“, zatímco statistika to umí vyjádřit přesně v procentech. Když někdo vypočte, že hladina spolehlivosti je 10 %, je to úplně něco jiného, než váš dojem, že je to chybě podložené.
je úplně jedno, jak se budete ohánět oborem statistickým, čím více se blížíte k 1ks, tím více stojí vaše závěry za prd.
Není to jedno. Statistika dokáže spolehlivost přesně kvantifikovat, na rozdíl od vašich vágních formulací.
Nikoli, jeden o vědě a druhý o dojmech. Autor a vy zastupujete dojmy, ne ekonomické hledisko. Statistika samozřejmě netvrdí, že odhad získaný na vzorku 100 kusů je stejně hodnotný, jako odhad za 10 000 kusů. Právě naopak, statistika dokáže ty odhady exaktně porovnat.
Pokud to chcete na ekonomickém příkladu – vy tvrdíte, že nevíte, kolik stojí malé ani velké balení pracího prášku, ale že velké balení je určitě mnohem levnější. Matematika tvrdí, že malé balení má 2,4 kg a stojí 240 Kč, velké balení má 4 kg a stojí 370 Kč, takže velké balení je přesně o 7,50 Kč na kilogram levnější.
Probůh člověče, jak píše Miroslav Řezanina nad Vámi, melete pořád něco jiného než o čem byla zmínka v článku a co Vám tady vysvětluji v diskusi. Já Vám nijak nerozporuji, že můžete matematicky nějak kvantifikovat věci kolem 1ks či třeba těch 99ks nějakého produktu. Ale stojím si 100% za tím, že ty závěry, jakkoli je dokážete klidně zanalyzovat na přesná procenta, třeba na 8 desetinných míst, nejsou k ničemu, nemají vypovídací hodnotu. A ano, jsem osobně alergický na vyvozování závěrů z příliš malých množství vzorků, což mimo jiné znamená i to, že ze stejného důvodu nerespektuji závěry jakýchkoli předvolebních průzkumů (například). Takže si klidně dál melte něco o vědě vs dojmech, na tomto prostém faktu nic změnit nemůžete, i kdybyste se stavěl na hlavu. Ostatně to dokládá už samotný Backblaze tím, že tyhle výsledky nezařadil do statistiky, jen je uvedl jako doplňující.
To je právě to, co bylo napsáno úplně na začátku diskuse. Že by alespoň základy statistiky měl znát úplně každý. Celou dobu se vám tu snažíme vysvětlit, že to, jestli je vzorek „příliš malý“ nebo dostatečně velký, není otázka vašeho dojmu, ale dá se to spočítat. Např. slušné agentury dělající předvolební průzkumy je dělají na dostatečném vzorku lidí a zveřejňují i ta čísla udávající, jak přesný daný průzkum je.
Na druhou stranu, ta neznalost vám umožňuje psát, že si za něčím stojíte na sto procent a nebo že vypovídací hodnota je nulová – se statistikou byste se k těmto extrémním hodnotám a černobílému vidění světa nedostal. Akorát prosím nezaměňujte vaše dojmy za fakta.
Aniž bych se chtěl účastnit vaší debaty o statistice, dovoluji si vám připomenout jednou podstatnou věc. Backblaze nakupuje HDD ve velkých objemech (sériích), což je mimochodem důvod proč nemají momentálně disky WD (nedostalo množstevní slevu). Pokud mají 99 kusů nějakého modelu, je velmi pravděpodobné, že se jedná o stejnou šarži. Asi není třeba dále rozvádět, jaké statistické důsledky to ve skutečnosti má. Vaše srovnání s agenturou proto kulhá na obě nohy, Backblaze nedělá průzkum spolehlivosti disků a nevybírá si náhodně jednotlivé kusy. Proto je 99 kusů málo.
Takze kdyz jste tak kovany v te statistice, tak jaky je dostatecny vzorek disku? Prosim presne cislo a vzorec jak jste k tomu to cislu dosel. Bez techto udaju tu jen frajerite a delate chytreho. Protoze z meho pohledu jsou vase tvrzeni take dojmy, jen podlozene tim, ze tu hazite nejake obecne statisticke teorie.
Od mého předchozího komentáře se nic nezměnilo, takže to stále není tak, že pro n disků je vzorek nedostatečný a pro n+1 je dostatečný. Pořád je to tak, že pro n disků existuje pravděpodobnost (větší než nula a menší než jedna), že váš odhad o dalším disku bude správný. Ani kdybyste těch disků měl miliardu, nebudete mít stoprocentní jistotu o dalším disku v pořadí.
Proto vám např. nikdo seriózní nenabídne SLA 100 %, protože nemůže mít stoprocentní jistotu, že se nic nestane, může se k ní akorát přibližovat.
K dalšímu studiu doporučuji začít zde: interval spolehlivosti.
Tahle debata mi připadá trochu zcestná a obávám se, že bez znalosti a pochopení teorie (pravděpodobnost, statistika, spolehlivost) i zbytečná.
Žádný dostatečný vzorek disků neexistuje, resp. každý si může zvolit takový, jaký chce (lze-li). Z většího vzorku lze odvodit přesnější údaje; kdyby se dal zvolit vzorek nekonečný veliký, byly by hodnoty přesné. Pokud mám malý vzorek, musím počítat s větší chybou - to je ale podstata statistických metod. Záleží na rozhodnutí zákazníka nebo koho, co je pro něj přijatelné.
Úplně stejně, jen naruby, funguje statistická přejímka - kupuji dejme tomu 1000 výrobků a dohodneme se na kontrole náhodně vybraných 10 kusů. Pokud vyhoví, považuje se za vyhovující celá série, a klidně v ní může být ukryto 100 zmetků; holt statistika ;-). (Jasně, je to složitější, postupů existuje řada.)
Miroslav Řezanina: "Takze kdyz jste tak kovany v te statistice, tak jaky je dostatecny vzorek disku? Prosim presne cislo a vzorec jak jste k tomu to cislu dosel. Bez techto udaju tu jen frajerite a delate chytreho. Protoze z meho pohledu jsou vase tvrzeni take dojmy, jen podlozene tim, ze tu hazite nejake obecne statisticke teorie."
Ale o to nejde jak já rozumím statistice. Jde o to, že Ježek jí nerozumí, a přesto si dovolí zahodit závěr původních autorů a udělat vlastní závěr o spolehlivosti. TO je ten problém! Nemá dostatečné vzdělání, a přesto Ježek dělá vlastní závěry, aniž by si dokázal obhájit, jak k tomu došel. Pořád jsem od něho neslyšel, proč si myslí že 99 kusů je málo, a kolik je hodně. Fór je, že správná odpověď leží v hladině spolehlivosti. Ale to prostě Ježek odmítá chápat.
A abys neremcal:
1, statistice rozumím velmi málo, i když očividně mnohem více než Ježek.
2, strčit tu nějaký vzorec není jednoduché, protože nemám původní data, jenom výsledky. Takže třeba ani nemám ponětí, jaké jsou hustoty rozdělení poruchovosti disků. Určitě to nebude jednoduchá gausovka, ale něco komplikovanějšího, tedy hned teď vím, že ať tu strčím sebelepší vzorec, bude špatně.
3, Opět, o vzorec tu nejde, jde o to že novinář ti předloží článek, do kterého strčí své názory, aniž by tomu rozuměl.
Mohu zkusit jen tuto jednoduchou úvahu, a doufám že jsem nic nepopletl: s jakou hladinou spolehlivosti jsme určili, že daný typ disků Toshiba dané výrobní série má poruchovost menší než 0.01 (pro daný počet pracovních hodin). 0.01 pro to, že neselhal ani jeden z 99 disků, tedy uvažujeme že poruchovost je menší než 1/99 ~=0.01. Pak ln(P(0)) = n*ln(1-p'), kde 1-P(0) je hladina spolehlivosti, 1-p' je minimální spolehlivost, n je velikost vzorku. A tedy lze vypočíst, že dané disky mají poruchovost menší než 1% s hladinou spolehlivosti 95.5%, pro daný počet pracovních hodin.
Opět, opakuji opět a znova, bez původních dat je ten vzorec NA NIC.
Jak jsem psal výše, líbí se mi přístup autorů původního článku:
For example, if there had been just 1 (one) drive failure during the year, the Annualized Failure Rate (AFR) for that Toshiba model would be 0.92%—still excellent, not 0%."
Tedy i kdyby jeden disk selhal, pořád z toho daný model disků vychází velmi dobře.
Upřímně si myslím, že míra ignoranství, které Ježek ukázal v tomto článku a v této diskuzi, je za hranou, a redakce by se ho měla zbavit. Tohle není problém, který závisí na dojmech nebo pocitech. Statistika je tvrdá věda, která se dnes a denně používá při popisech dějů, analýze dat, výrobních procesech, právě pro to, aby někdo dokázal říct, co je hodně a co je málo na základě faktů a ne na základě pocitů.
"Že by alespoň základy statistiky měl znát úplně každý."
Ja si treba myslim ze zitra by melo mrznout a snezit..... ale ono nebude. Z toho mi vychazi ze neni dulezite co by melo byt, ale co je.
Kdyz se tak dobre vyznate ve statistice, rozeznate take v novinarine rozdil mezi zpravodajstvim a publicistikou???
Já se ve statistice nevyznám dobře, pouze znám úplné základy, které by měl znát každý. Rozdíl mezi zpravodajstvím a publicistikou znám, děkuji za optání. Ovšem ani do zpravodajství ani v publicistiky nepatří to, že autor vezme převezme cizí zprávu a tu kvůli neznalosti, tu kvůli nepozornosti ji pokazí. Pokud byste snad chtěl argumentovat tím, že publicistika obsahuje i subjektivní názory, pak nezapomeňte na to, že fakta a názory jsou disjunktní množiny. Názory vychází z faktů a z hodnot, nejsou to alternativy k faktům. Můžete mít názor na to, jestli by pro lidstvo bylo lepší, kdyby Země měla větší či menší poloměr, ale nemůžete mít názor na to, kolik poloměr Země je. No, a pak bych jenom připomněl takovou drobnost, že diskutujeme pod zprávičkou. Ten společný kořen se slovem zpravodajství není náhoda, zprávička je opravdu zpravodajský útvar. I když v klasickém žurnalistickém názvosloví by tohle byl zpravodajský článek, protože klasická novinová zpráva má jeden odstavec, případně rozšířená zpráva dva odstavce, delší útvary už se považují za zpravodajský článek.
Calculon: Do detailů, co přesně je interval spolehlivost i a co hladina spolehlivosti, nemá smysl se v této debatě pouštět. Pokud myslíte můj komentář z 14. 2., tam je to napsané jako zkratka, že někdo určí hladinu spolehlivosti, nad naměřenými daty provede výpočet a příslušnou hypotézu buď vyvrátí nebo nevyvrátí. Ale nechtěl jsem to takhle rozebírat, protože by to některým akorát zamotalo hlavu.
> nesmyslný závěr že o tom nelze říci nic. Což je samozřejmě špatně, závěry lze dělat i na menším vzorku
Pokusim se pridat malinko - sice trivialniho - ale racia:
1a - pro analyzu spolehlivosti se casto pouziva Poissonovo rozdeleni (PD)
1b - bude-li fail 1 na vzorku 100, z hlediska PD to znamena, ze jedno sigma je 1
1c - takze na hladine spolehlivosti ~60% lze rici, ze chybovost je mezi 0-2%
1c - na hladine 99% vime, ze spolehlivost bude 0-4%
Takze vysledny udaj muze byt zcela nekonkluzivni.
2 - na statistice 1 navic neni obvykle delat nejakou analyzu, nebot veskere zavery se opiraji o neco, co se pak muze ukazat jako cerna labut.
toz tak
Rozumný vzorek při chybovosti disků okolo jednoho procenta je asi 900 ks. Když by měly chybovost nižší, třeba okolo půl procenta, tak asi 1800 ks. Naopak kdyby chybovost byla vyšší, třeba okolo tří procent, tak stačí asi 300.
Takže 99 disků se moc říct nedá.
Můj odhad je jen, že chybovost může být až okolo pěti procent, ale ve statistice nejsem zrovna moc dobrý, takže tímhle posledním tvrzením si nejsem zrovna moc jistý, ale velikosti potřebných vzorků snad ještě umím odhadnout. :D
mna zase zaujalo to odporucanie vyhnut sa SMR diskom. Dva roky dozadu som kupoval disk a snazil sa vyhnut SMR - neverili by ste, ale v tom case mi pripadala informacia, ci je disk SMR alebo nie ako asi najtajnesie strazene tajomstvo a podla modelu ani S/N sa to na 100% zistit nedalo.
Zmenilo sa nieco odvtedy?
Nejspíš jsou 2TB a 6TB WD Red EFAX se SMR: https://forums.tomshardware.com/threads/wd-red-2tb-two-versions.3510475/ u 4TB kdo ví. SMR je pořád státní tajemství.
u 2.5":
- cokoliv >=4TB je SMR
- jedinej 3TB co NEni SMR je "Toshiba MQ03ABB300" (kterej se ale uz asi 1/2-1rok (v CR?) neprodava)
- u <=2TB (nevim zda to plati stale)
-- kdyz to ma 128MB je to pravdepodobne SMR
-- pokud to ma 8MB skoro urcite to NEni SMR
-- pokud je vyska 15mm NEjde o SMR
-- pokud je vyska 7/9mm tak cim bliz 2TB tim je spis jde o SMR