Hledání svobodného formátu

9. 5. 2005
Doba čtení: 4 minuty

Sdílet

V souvislosti se svobodným software se často hovoří také o svobodných formátech souborů pro přenos dat. Formátů je velké množství, ale jen málo z nich splňuje všechny požadavky. Přinášíme obecné shrnutí situace a možnosti, jak ji řešit.

Možnost jednoduché výměny informací je stará jako lidstvo samo. Od začátku jsme vyvíjeli způsoby komunikace, ať to byly kouřové signály, nebo zvuky bubnů. Dohodnout se společným jazykem byl náš cíl. Dokonce jsme vymysleli univerzální jazyk Esperanto.

Pak přišly na řadu počítače. V počátcích to byly uzavřené stroje a každý z nich byl unikátním kusem hardware. Jak počítačů přibývalo, objevila se nutnost výměny dat. V tu dobu přišly operační systémy, které sjednotily prostředí i datové struktury.

Dalším krokem byl Internet, kde se jako univerzální formát pro výměnu dat prosadilo především HTML, které je univerzální, multiplatformní a vcelku bezproblémové.

Tou dobou to vypadalo růžově a byli jsme rádi, jak nám to funguje. Dokonce i válka prohlížečů, která Internet rozdělila na dva nekompatibilní tábory, nás nakonec zase tak nepoznamenala.

Pak ale přišly počítače do kanceláří a objevil se veliký problém. Potřebujeme univerzální formát dat, který by nám umožňoval bez problémů komunikovat s našimi kolegy a partnery. A tady jsme se zasekli. Konec, tma.

Samozřejmě se problém netýká jen textových dokumentů, ale v této oblasti je nejpalčivější. Vlastně nejsme ani tak nároční, jak by se na první pohled mohlo zdát. Náš milovaný formát by měl mít tyto vlastnosti:

  • Jeho specifikace musí být známá a zdokumentovaná.
  • Měl by být dostatečně stabilní a neměnný.
  • Musí být svobodný a nikdo nesmí omezovat jeho použití.
  • Jeho implementace musí být bezproblémová.
  • Měl by ho podporovat každý velký kancelářský balík.

Na první pohled tedy velmi jednoduché požadavky, které by neměly činit problémy. Ale jak víme, ono to není tak jednoduché. Popíráme tím základní touhu po komunikaci. Co tedy máme k dispozici? Samozřejmě formátů obecně je celá řada, ale my se podíváme jen na ty nejznámější.

DOC

Pseudostandard hlavně na platformě MS Windows. Bohužel jeho specifikace není známá a Microsoft ji úzkostlivě tají. Navíc se už několikrát změnila a jistě se změní znovu. Výhodou je jeho podpora ve všech kancelářských balících. Sice mizerná, ale je. Bohužel to je jediný požadavek, který tento formát splňuje.

PDF

Formát firmy Adobe, který se velmi rozšířil především díky dobré dokumentaci a uvolněné specifikaci. Je ideální pro přenos souborů především díky široké podpoře a multiplatformnosti. Bohužel PDF můžeme označit za „koncový” formát, protože jeho následná úprava je bez zakoupení komerční aplikace problematická nebo přinejmenším nesnadná.

HTML

HTML je také svobodný a univerzální formát, o kterém můžeme říci, že jej podporují naprosto všechny platformy. Nevýhodou je snad jen fakt, že nedokáže zaručit výslednou podobu za všech okolností, jako je tomu u PDF. Pro běžný přenos dat je však vyhovující a dovoluje také bezproblémovou editaci.

XML

Do XML se vkládají velké naděje a časem by mohlo posloužit jako formát budoucnosti. Je otevřené, svobodné a jednoduše zpracovatelné. Jeho nevýhodou je ale velmi volná definice, takže je nutno nad ním vystavět další formát, který by byl závazným standardem pro přenos konkrétních dokumentů.

RTF

RTF je také velmi rozšířeným formátem. Jedná se o nebinární formát, který umožňuje ukádat i velmi komplikované formátování. Je velmi stabilní a podporuje jej drtivá většina textových editorů. Jeho jedinou nevýhodou je větší velikost, která obvykle dosahuje násobků velikosti jiných formátů.

Formát OOo

Nativní formát OpenOffice.org splňuje většinu požadavků na správný formát. De facto se jedná o XML, které je společně s ostatními soubory (například obrázky) komprimováno běžným kompresním algoritmem. Jedinou nevýhodou je zatím jeho omezená podpora v ostatních kancelářských balících. Nový formát pro OOo 2.0 byl ale přijat konsorciem OASIS a je pravděpodobné, že se stane ISO normou. To by znamenalo veliký posun v oblasti formátů souborů a snad by tento oficiální standard začala akceptovat většina firem.

V současné době je situace velmi nepřehledná a zmatená. Chcete-li si být jisti, že váš dokument otevře kdokoliv, musíte jej poslat v html. Pokud ale potřebujete zachovat jeho podobu, musíte sáhnout po PDF a doufat, že má uživatel nainstalován jeho prohlížeč. Univerzální a bezproblémový formát zatím nemáme. Každopádně nejrozumnější se zdá být RTF. Bohužel je nevýhodou jeho nepoměrně větší velikost proti ostatním formátům.

Otázkou ale zůstává, zda je tu vůle něco změnit. Microsoftu situace vyhovuje, ovládá formátový trh a buduje si svůj monopol. Běžní uživatelé jsou také spokojení, jim to nějak funguje, co na tom, že musejí používat konkrétní produkt? Buď ho už mají, nebo si ho ilegálně zkopírují.

Udělal jsem si malý průzkum pomocí Google, abych si ověřil, jak je to s jednotlivými formáty na Internetu. Je mi jasné, že to nejsou přesná čísla, ale šlo o to zjistit přibližný stav.

bitcoin_skoleni

  • PDF – 70 milionů
  • DOC – 10 milionů
  • RTF – 1 milion

Výsledek je poměrně pozitivní. Situace je pro RTF poměrně nepříznivá, ale PDF je na tom mnohem lépe než DOC. Důležité každopádně je stále prosazovat některý ze svobodných formátů, aby si i běžný uživatel uvědomil, jak je jejich existence důležitá. Jedině tak jsme schopni zatlačit na firmy podporující uzavřené formáty, a tím můžeme něco změnit.

Ohromnou chybou by bylo přijmout názor „Nejrozumnější je DOC, protože ho jakž takž podporují všichni, a tak ho zatím budu používat taky.”. Přispěli bychom stagnaci, která panuje teď. Čím více se budeme sami snažit podpořit alternativní formáty, tím více o nich bude slyšet a tím dříve také nastane změna.

Jaký formát dokumentů používáte nejčastěji?

Autor článku

Petr Krčmář pracuje jako šéfredaktor serveru Root.cz. Studoval počítače a média, takže je rozpolcen mezi dva obory. Snaží se dělat obojí, jak nejlépe umí.