Vlákno názorů k článku Měření výkonu CPU na scestí: ovlivnit výsledky testů lze mnoha způsoby od K> - "případně medián všech měření " - vrtá mi...

  • Článek je starý, nové názory již nelze přidávat.
  • 10. 8. 2021 8:34

    K>

    "případně medián všech měření " - vrtá mi to hlavou. Proč medián? Jaký smysl má použití mediánu místo průměru při měření výkonu CPU?

  • 10. 8. 2021 9:07

    Ondra Satai Nekola
    Zlatý podporovatel

    Lepe to odstrani "ulety". Trebas kdyz se ti pri jednom behu testu z peti spusti nejaka narocnejsi systemova uloha na pozadi a zpomali ho na polovinu, tak to vic zahyba s prumerem nez s medianem.

  • 10. 8. 2021 10:35

    K>

    Hm. No dobrá. Chtěl jsem odpověď autora, ale když už jste to načal....

    Průměr je (obvykle) nejlepší odhad náhodné veličiny. Medián ne. V případě rovnoměrného rozdělení hustoty rozdělovací funkce náhodné veličiny průměr a medián mají stejnou hodnotu. Ale je potřeba znát ono rozdělení. Pokud není známo, nelze jen tak od boku průměr a medián zaměňovat.

    Popsané "úlety" jsou ale důsledkem vlivu, který chceme v datech potlačit. To se dá řešit dvěma způsoby. První je vyřazení výsledků, o kterých víme že byly ovlivněny. To není vždy jednoduché, a často vede ke špatné volbě dat, které je potřeba vyřadit. A obvykle se to nedá dělat bez rozumně velkého množství pozorování. Druhá možnost je prostě vliv zahrnout do výsledné nejistoty, a nejistotu snížit počtem opakování měření. To také vede k některým dalším typům chyb.

    Já chtěl vědět, jestli autor ví co dělá, nebo jen tak zaměňuje průměr a medián, jak se hodí. Protože tohle většina lidí dělá, použijí medián jako způsob odstranění nechtěného vlivu, čímž obvykle dostanou jiný výsledek než chtěli.

    A jen tak od boku můžeme zkusit úvahu, jak asi vypadají výsledky měření. Jde o dobu výpočtu nějaké úlohy, která má za optimálních podmínek minimální možný čas výpočtu. Rychleji to prostě procesor nedokáže vypočítat. Tento výsledek je ovlivněn dalšími nechtěnými úlohami, teplotou procesoru atd. Všechny tyto vlivy dobu výpočtu jen zpomalují. Tedy hodnota, kterou tester nejspíš touží získat, je právě minimum ze všech naměřených dat. Jakákoliv větší hodnota je jen více zatížená okolními vlivy. Ale tuhle úvahu berte s nadhledem, testování procesorů jsem ve velkém nezkoušel, nevím jaké jsou vlivy bufferů apod.

  • 12. 8. 2021 10:31

    K>

    Ech, jsem idiot. Samozřejmě v prvním odstavci místo "rovnoměrného" jsem chtěl napsat "normálního" (ala Gaussova). I když ta věta platí shodou okolností pro oba rozdělení.
    A taky můžeme vyvodit, že testování CPU nemá normální (nebo rovnoměrně) rozdělení, protože hodnota je zdola omezena, (nemůže být menší než onen ideální čas výpočtu).

    Takže ať na to koukám jak chci, použití mediánu místo průměru je bez dalšího šetření nepodložená pitomost.