Také se nad tím pozastavuji. Tím spíše, že zdrojáky/texty jsou čím dál častěji v UTF-8, což je vysloveně bajty nehorázně plýtvající formát.
U HTML se mezery/tabelátory řešit nemusejí. Libovolná sekvence bílých znaků se chová stejně jako jediná mezera (až na určité případy), takže stačí šoupnout jedinou mezeru a dál se tím nezabývat.
UTF-8 zase až tolik neplýtvá - v případě zdrojáků se většina použitejch znaků vejde do 1 B.
A jasně, u HTML bílý znaky obvykle nehrajou roli (ostatně stejně jako u většiny zdrojáků), ale pro odsazování se používaj. Nicméně tam, kde je větší provoz, je stejně zapnutá komprese, takže ani v HTML nejsou mezery zrovna takovej problém pro kapacitu sítě...
V případě UTF-8 zdrojáků, kde jsou často literály unicode textové řetězce v různých národních jazycích, to moc úsporné není.
U HTML si nepamatuji, kdy jsem ho formátoval ručně. Zatím to vždy vygeneroval nějaký generátor. Nicméně pointa je i ta, že ve formulářích či webových editorech ten znak tabulátoru prostě nevložíte. Tabulátor přeskakuje mezi políčky.