Názor k článku Napsat správně mezinárodní aplikaci v Qt nemusí být snadné od Jakub Galgonek - Článek, zdá se, trochu zmatkuje i v případě...

27. 12. 2010 11:57

Jakub Galgonek (neregistrovaný)
Článek, zdá se, trochu zmatkuje i v případě paměťových nároků. Pro jednotlivé rozsahy a kódování by náročnost měla být tato:

unicode rozsah | UTF-8 | UTF-16 | UTF-32 -------------------------------------------------- 0000 0000 - 0000 007F | 1B | 2B | 4B 0000 0080 - 0000 07FF | 2B | 2B | 4B 0000 0800 - 0000 FFFF | 3B | 2B | 4B 0001 0000 - 0010 FFFF | 4B | 4B | 4B

UTF-8 je tedy horší než UTF-16 na rozsahu 0800-FFFF, a to pouze o jeden bajt.

Co se týče v článku zmíněné cyrilice, ta používá rozsah 0400-04FF. Její znaky tedy zaberou jak v UTF-8 tak v UTF-16 shodně dva bajty. Dokonce i na tu arabštinu (rozsah 0600-06FF) u obou vystačí ještě dva bajty.

Zprávičky