Takže zlatá adresářová struktura...
Takhle jednoznačně to napsat nelze.
Adresáře se dobře hodí pro jednoznačně zařaditelné soubory. Např. všechny soubory (a další adresáře) uživatele "Tomas" budou v adresáři /home/tomas
.
Jenže ne všechna data lze tímto způsobem jednoznačně zařadit. Vezměte si třeba jen fotografie. Takovou fotografii budete chtít zařadit podle datumu, podle akce kde jste to fotil, podle místa a třeba i podle lidí, kteří se dané akce účastnili a jsou na dané fotografii a třeba i podle použitého objektivu a fotoaparátu. Takže pak můžete vyhledávat ve fotkách všechny snímky, kterých se účastnil Petr. Nebo všechny snímky z dubna 2007. Nebo kombinace těchto kritérií - např. všechny fotky Petra pořízené objektivem Canon EF 50 mm f/1,8. Toto už pomocí klasického stromu (adresářové struktury) neuděláte. Pomocí linků by to možná šlo, ale na to už potřebujete software, který se bude starat o aktualizaci těch symlinků. To už je lepší implementovat tagy. Zkrátka jakákoliv data, ke které potřebujete přistupovat na základě mnoha různých parametrů do stromu neumístíte.
Doteď prostě adresářový strom někam nakopíruji (nebo udělám např. 'tar czf fotky_datum.tar.gz fotky/') a jsem v suchu.
Bohužel nejste v suchu. Už dneska je problém zachovat při archivování např. ACL a rozšířené atributy souboru. Což jsou věci, které tu jsou s námi již hodně dlouho. Aby mě nikdo nechytnul za slovo, netvrdím, že to zálohovat nelze. Jistě že lze. Ale obecná podpora v archivačních nástrojích neexistuje. Bohužel ani obecná podpora od systémů souborů.
Štítky nad soubory (tak jak si je představuji já) rozhodně nemohou být uloženy v nějaké DB. Musí je umět samotný systém souborů. A aplikace, tak jak se dnes ptají třeba na datumy vytvoření, tak se budou stejným mechanismem ptát na tagy.
Dnešní implementace jsou šílené. Pro hudební soubory si DB tagů (získaných tu z ID3, tu z internetu, tu na základě preferencí uživatele) udržuje přehrávač. Pro fotografie si (v základu stejnou DB) udržuje nějaký soft galerie. Změníte soft (třeba proto, že nezvládá takový počet fotografií) a o všechny tagy přijdete. Pokud by tagy byly součástí metadat udržovaných systémem souborů, bylo by to bez problémů.
Zrovna hudební soubory a fotografie představují typická data, pro která je adresářový strom zcela nevhodný. Příklady jsem uváděl výše. V podstatě jde o to, že strom umožňuje přístup na základě pouze jednoho kritéria a tím je cesta k danému souboru. K těmto datům ale potřebujete přístup z mnoha různých "stran". A to už do (jednoho) stromu neumístíte.