Názor k článku Napsat správně mezinárodní aplikaci v Qt nemusí být snadné od Jakub Galgonek - Článek, zdá se, trochu zmatkuje i v případě...

  • Článek je starý, nové názory již nelze přidávat.
  • 27. 12. 2010 11:57

    Jakub Galgonek (neregistrovaný)

    Článek, zdá se, trochu zmatkuje i v případě paměťových nároků. Pro jednotlivé rozsahy a kódování by náročnost měla být tato:

    unicode rozsah        | UTF-8  | UTF-16 | UTF-32
    --------------------------------------------------
    0000 0000 - 0000 007F |   1B   |   2B   |   4B
    0000 0080 - 0000 07FF |   2B   |   2B   |   4B
    0000 0800 - 0000 FFFF |   3B   |   2B   |   4B
    0001 0000 - 0010 FFFF |   4B   |   4B   |   4B

    UTF-8 je tedy horší než UTF-16 na rozsahu 0800-FFFF, a to pouze o jeden bajt.

    Co se týče v článku zmíněné cyrilice, ta používá rozsah 0400-04FF. Její znaky tedy zaberou jak v UTF-8 tak v UTF-16 shodně dva bajty. Dokonce i na tu arabštinu (rozsah 0600-06FF) u obou vystačí ještě dva bajty.