Akta X 0309

30. 9. 2003

Doba čtení: 4 minuty

Líbí se vám článek?
Podpořte redakci

Velké firmy chtějí binární verzi XML; je to rozumný požadavek, nebo útok na samu podstatu tohoto jazyka? Ve W3C se tomu rozhodli přijít na kloub. James Clark chce přinést novou kvalitu do editování XML v Emacsu. Pracovní skupiny W3C v průběhu září nešetřily novými dokumenty.

Příznivce mimozemských civilizací a pa(ra)vědních oborů musím zklamat. Toto je mírně komentovaný přehled některých událostí, které se během měsíce září seběhly kolem XML. A ještě varování. Pokud tento formát článku nenarazí na dostatečně tuhý odpor čtenářů, nelze vyloučit, že se bude opakovat.

Binární reprezentace XML

Diskuse o binárním kódování informací obsažených v dokumentech XML jsou stejně staré jako tento formát sám. O zavedení standardního binárního zápisu usilují hlavně velké firmy. Konsorcium W3C se nyní rozhodlo převzít aktivitu v této oblasti a na 24. až 26. září svolalo do kalifornské Santa Clary pracovní seminář (The W3C Workshop on Binary Interchange of XML Information Item Sets). Cílem je shrnutí současných konkrétních zkušeností s binární reprezentací XML a vyjasnění postojů zainteresovaných subjektů. Svá stanoviska a návrhy ohledně „binárního XML“ prezentovaly kromě jiných firmy IBM, Sun, Nokia, Microsoft, Canon, Oracle, Adobe a Software AG. Stanoviska (position papers) byla s předstihemzveřejněna, o závěrech W3C z tohoto semináře zatím není nic známo.

Ve prospěch binární reprezentace se uvádějí dva hlavní důvody. Menší velikost přenášených souborů a jejich rychlejší načítání. Na tyto dva aspekty lze pohlížet odděleně a jejich řešení se mohou ubírat různými směry. Snadným a dostupným řešením problému velikosti je prostá komprimace textových souborů XML. Urychlení načítání by vyžadovalo zásadnější změmu přístupu – ukládání informací obsažených v dokumentu XML přímo do binárního proudu. Někdy se v této souvislosti mluví o předparsovaném XML. Příkladem takovéhoto přístupu je převod XML do abstraktní syntaxe ASN.1 a použití jejího binárního kódování.

Oba výše zmíněné důvody mají racionální opodstatnění. Existují dokonce experimenty s binárním kódováním, které měly dosáhnout významných zlepšení v obou ohledech. Pravdivost těchto tvrzení nikdo nezpochybňuje, panují však pochybnosti o relevanci obou hledisek pro skutečné, praktické aplikace. Velikost přenášeného textového HTML byla vždy v porovnání s grafikou, aplety a dalšími objekty celkem zanedbatelná. U XML a XHTML je to podobné. Zazipování několika nebo několika desítek kilobajtů kvůli šířce pásma dnes nikomu nestojí za námahu. Kdyby tomu bylo jinak, určitě by na to dynamický trh webového softwaru zareagoval. Pokud mohu soudit, přenos komprimovaných souborů se příliš nerozšířil ani na úrovni aplikací. Také rychlost načítání dokumentů není v drtivé většině případů nijak limitujícím faktorem. V praxi většinou parsování nezabírá významnou část celkové doby zpracování.

Má tedy smysl vymýšlet nový a pravděpodobně složitý standard? Kdo o něj má ve skutečnosti zájem? Rozhodně výrobci softwaru. Binární kódování jim umožní přidávat a prodávat nové funkce. A abychom nebyli nespravedliví, binární formát by mohl usnadnit expanzi XML na mobilní zařízení, kde hraje významnou roli jak velikost přenášených dat, tak nároky na omezené systémové prostředky. Zájem Nokie nebude tak docela náhodný. Tak či onak, W3C bude muset pod tlakem svých významných členů dojít k nějakému závěru. Můj osobní odhad je, že se dříve nebo později binární reprezentace XML z dílny W3C dočkáme.

Nový editor XML pro Emacs

James Clark zveřejnil alfa verzinXML, nového módu pro editování dokumentů XML v oblíbeném editoru GNU Emacs. Novinkou je kontextová validace editovaných dokumentů oproti schématu Relax NG. Současné módy buď validují podle zastaralého DTD (psgml), nebo se specializují pouze na vybrané aplikace XML (xslice – XSLT, XSL-FO). Navzdory deklarované alfa verzi je již nXML dostatečně stabilní pro běžnou práci a poskytuje obvyklé funkce, jako je vizuální zvýrazňování či validace v reálném čase. Vzhledem k nesporné kvalitě dosavadních Clarkových projektů (např. Jade, XT, Expat, nebo také XSLT 1.0 a Relax NG) se všichni, kdo editujeme XML v Emacsu, máme na co těšit.

Specifikace

5. září pracovní skupina W3C pro RDF (RDF Core Working Group) představila šest nových verzí svých pracovních dokumentů. Jedná se o novou generaci specifikací RDF, které by měly doplnit a nahradit platné doporučení W3C z roku 1999. Dokumenty již jsou v pokročilém stádiu standardizačního procesu; aktuální verze zohledňují připomínky vznesené během období poslední výzvy (Last Call). Změny nejsou nijak zásadní; sem tam přibyl či ubyl atribut, příklad nebo byla upřesněna formulace. Zde je přehled aktuálních dokumentů:

Jen o týden později jiná pracovní skupina, XML Linking Working Group, uvedla jako svou poznámku návrh syntaxe identifikátorů fragmentů pro XML. Identifikátor fragmentu (tedy část URL za znakem #) syntakticky vychází z rámce XPointer Framework a schématu XPointer element(). Tento přístup umožňuje vcelku flexibilní a intuitivní adresování na úrovni elementů. Posuďte sami:

doc.xml#Title – element s ID Title, zkrácená verze – obdoba fragmentů v HTML.
doc.xml#element(Title) – totéž v plné notaci.
doc.xml#element(/1/3/2) – druhé dítě třetího dítěte prvního elementu na nejvyšší úrovni.
doc.xml#element(Title/4) – čtvrté dítě elementu s ID Title.

Seriál: Akta X

Přečtěte si všechny díly seriálu Akta X nebo sledujte jeho RSS

Vstoupit do diskuse (43 názorů)

Sdílet

Binární reprezentace XML

Nový editor XML pro Emacs

Specifikace

Akta X 0502

Akta X 0503

Akta X 0504

Autor článku

Petr Cimprich

Témata:

Komerční sdělení

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Budoucnost zpracování dokumentů s AI

ARM Windows má lepší emulaci x86. Rozběhne programy a hry, které doteď nešly

Koalice chce na povinnosti z digitální ústavy o dva roky více, hledá se viník zpoždění

Když malý usnul, otevírala notebook. Nyní má úspěšný byznys pro nejmenší

[AKTUALIZOVÁNO 21. 11.]Black Friday spouští lavinu slev! Zjišťujeme, kde a na čem lze ušetřit i…

Musk chce upgradovat státní IT systémy, návrh na rozdělení Googlu, nový minipočítač od Microsoftu

Stříteský: Obchodníci dostávají v zahraničí vyšší sankce a slevy mají výrazně omezené

První vývojářská verze Androidu 16 přezdívaného Baklava je tu. Jaké novinky a funkce přináší?

Krátké vlny: Odklad práva na digitální služby a Milouš Jakeš o kyberbezpečnosti

Jak uplatní pracující důchodci u zaměstnavatele slevu na pojistném?

Akta X 0309

Sdílet

Binární reprezentace XML

Nový editor XML pro Emacs

Specifikace

Akta X 0502

Akta X 0503

Akta X 0504

Autor článku

Petr Cimprich

Témata:

Čtěte dále

<img class="design-article-review__image" src="https://i.iinfo.cz/images//root/urs/Vyvoj-115754947249086-thumbnail.png" alt=" "> Akta X 0309

Komerční sdělení

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Budoucnost zpracování dokumentů s AI

Mohlo by vás zajímat

Postřehy z bezpečnosti: pád tržiště pro DDoS útoky

Z našich webů

ARM Windows má lepší emulaci x86. Rozběhne programy a hry, které doteď nešly

Koalice chce na povinnosti z digitální ústavy o dva roky více, hledá se viník zpoždění

Když malý usnul, otevírala notebook. Nyní má úspěšný byznys pro nejmenší

[AKTUALIZOVÁNO 21. 11.]Black Friday spouští lavinu slev! Zjišťujeme, kde a na čem lze ušetřit i…

Musk chce upgradovat státní IT systémy, návrh na rozdělení Googlu, nový minipočítač od Microsoftu

Stříteský: Obchodníci dostávají v zahraničí vyšší sankce a slevy mají výrazně omezené

První vývojářská verze Androidu 16 přezdívaného Baklava je tu. Jaké novinky a funkce přináší?

Krátké vlny: Odklad práva na digitální služby a Milouš Jakeš o kyberbezpečnosti

Jak uplatní pracující důchodci u zaměstnavatele slevu na pojistném?

Dále u nás najdete

Firmy mají řešit byznys, ne hledat účtenky, razí Fidoo

SSD už také mají obrovskou kapacitu – až 122 TB

Prokletí slavného spisovatele: duševní poruchy a sebevraždy

Osvědčené způsoby, jak snížit vysoký krevní tlak

ÚOOÚ šetří české vydavatele kvůli „pay or ok“

Windows chystá offline AI vyhledávání souborů

V obchodech je máslo s obsahem tuku jen 61 %. Rarita, ale povolená

Od pokeru do dílny: Vyrábí v ní nábytek z ohýbaného betonu

Čeští středoškoláci očekávají vypuštění své družice

Vyzkoušeli jsme test, který ukazuje, co jsme zdědili po předcích

Lumbální punkce sice vypadá děsivě, ale nebolí

Obsah vytvořený pomocí AI vidíte každý den. Jen to nevíte

Nejen Coca-Cola, ale i Lidl má červený vánoční kamion

Deepl nově umí překládat v reálném čase řeč

Pokud potřebujete půjčit, nemusíte prodávat bitcoiny. Stačí je zastavit

Nitroděložní tělíska jsou spolehlivá a hodí se i pro mladé ženy

Přílišné uklízení škodí plicím stejně jako cigarety

Novu nebude tvořit AI. A umělé moderátory v ČRo nečekejte

Vánoční slevy operátorů? Daleko za očekáváním

Jak Mikýř vyděsil Novu, ale nakonec vydělaly obě strany

Akta X 0309