Vlákno názorů k článku Plány a novinky pro GNOME 3 od anonym - Používání štítků mi přijde o dost komplikovanější než...

  • Článek je starý, nové názory již nelze přidávat.
  • 27. 4. 2009 3:10

    bez přezdívky
    Používání štítků mi přijde o dost komplikovanější než používání adresářové struktury. (Navíc výpočetně nesporně náročnější.). Zatímco adresáře jsou víceméně pevně dané, u štítků se lehce sklouzne k synonymům. Navíc jsou štítky dnes řešeny jen jednorozměrně, což při počtu kategorií, které za léta mám vytvořené v adresářové struktuře, vede k nepřehledné situaci. Ve výsledku se štítky budou stejně časem organizovat do grafu. Takže zlatá adresářová struktura...
  • 27. 4. 2009 9:37

    Ondřej Tůma
    To záleží na komplikovanosti oné adresářové struktury a množství dat. Tímto se již nějaký ten pátek zabývám a vím o čem mluvím. V určité chvíli totiž jednocestná stromová struktura nestačí. Pravda je že tu máme linky, a tak není problém mít jeden dokument hned v "několika podadresářích (složkách).

    Vtip je v tom, že při určitém množství prostě jednodušší škatulkování dokumentů nestačí. Něco jiného je spravovat 100 dokumentů, něoco jiného 1 000 a něco jiného 10 000.

    Samozřejmě že i při používání štítků musí uživatel dodržovat jistá pravidla, jinak by se do toho zamotal ještě víc.

    Tedy souhlasím s tím aby takový aplikace byla součástí gnome, ale jen jako alternativa ke starému způsobu. Dokázal bych si představit si to v systému nastavit a změnili by se mě pak ve všech gtk aplikacích dialogová okna otevřít, uložit atd...
  • 27. 4. 2009 10:11

    MichalB
    Bronzový podporovatel
    Tady by mi už spíše seděl FS založený na databázi - tedy něco, co bylo v plánu pro Win Vista. Bohužel z toho sešlo, takže Vista jsou jen další nepoužitelné Widle.
  • 27. 4. 2009 14:39

    bez přezdívky
    Kolik budete mít štítků na 10 000 dokumentů? Možná 10, ale dost možná taky 500. Jak se v takových 500 štítcích vyznáte?

    Další problém, který nastává je, že když přiřazujete štítek, tak snad v žádné aplikaci nevidíte, kolik dokumentů daný štítek má. Na co je mi štítek, který má 1000 dokumentů a v té hromadě se opět nevyznám? Dobrá přilepím další štítek - jaký? Štítek který zobecňuje, nebo štítek který konkretizuje? Resp. budu při vyhledávání dělat se štítky OR nebo AND?
    Nakonec to sklouzne k fulltext prohledávání štítky-neštítky. Problém prvotního škatulkování se jen převádí na problém vyhledávání(odsunutí problému je vždy populární).

    Myslím, že celkově je těch problému s _dnešní implementací_ (podtrhuji) štítků daleko víc než při klasické stromové struktuře. Ale aproximuji jen ze svých zkušeností, takže se nepřu, jestli to většina vidí jinak.
  • 27. 4. 2009 17:27

    Ondřej Tůma
    Naprosto souhlasím s _dnešní implementací_. Ono myšlenka dobrá a provedení hrozné je často jádro pudla. Ale pokud jde o mojí zkušenost, pak je to např. redakční systém a "nálepky" - což jsou právě ty štítky.

    A vím o lidech, kteří se již dávno orientují např. podle tagů v mp3 souborech. Ale jak sem již psal, i zde se musí dodržovat jistá pravidla a ukázněnost, jinak to prostě nejde.

    Štítky dle mého názoru krásně upřesním co hledám. Dám příklad z praxe, mám skupinu dokumentů které patří k jedné firmě, ale typy dokumentů jsou různé, objednávky, smlouvy, reklamace, nabídky, faktury atd... V současné době řeší toto různé CMS a DMS, ale štítky jsou způsob, jak mít smlouvy na "jednom" místě a zároveň je párovat k jedné firmě, k jednomu zaměstnanci atd..
  • 30. 4. 2009 19:24

    Lael Ophir (neregistrovaný)
    10k dokumentů se ještě dá udržet čistě na FS, když nastavíte správně pravidla. Výš to začíná být poměrně vážný problém. Firmy mají běžně stovky tisíc až desítky milionů dokumentů.
  • 27. 4. 2009 10:54

    Heron
    Takže zlatá adresářová struktura...

    Takhle jednoznačně to napsat nelze.

    Adresáře se dobře hodí pro jednoznačně zařaditelné soubory. Např. všechny soubory (a další adresáře) uživatele "Tomas" budou v adresáři /home/tomas.

    Jenže ne všechna data lze tímto způsobem jednoznačně zařadit. Vezměte si třeba jen fotografie. Takovou fotografii budete chtít zařadit podle datumu, podle akce kde jste to fotil, podle místa a třeba i podle lidí, kteří se dané akce účastnili a jsou na dané fotografii a třeba i podle použitého objektivu a fotoaparátu. Takže pak můžete vyhledávat ve fotkách všechny snímky, kterých se účastnil Petr. Nebo všechny snímky z dubna 2007. Nebo kombinace těchto kritérií - např. všechny fotky Petra pořízené objektivem Canon EF 50 mm f/1,8. Toto už pomocí klasického stromu (adresářové struktury) neuděláte. Pomocí linků by to možná šlo, ale na to už potřebujete software, který se bude starat o aktualizaci těch symlinků. To už je lepší implementovat tagy. Zkrátka jakákoliv data, ke které potřebujete přistupovat na základě mnoha různých parametrů do stromu neumístíte.

  • 27. 4. 2009 14:14

    JirkaS (neregistrovaný)
    Co do funkce by se mi to takhle líbilo. Ale už od počátku, kdy se o tomto způsobu ukládání začalo poprvé mluvit (ještě v souvilosti s WinFS), mě na tom děsí jedna věc. Zálohování a archivace.

    Doteď prostě adresářový strom někam nakopíruji (nebo udělám např. 'tar czf fotky_datum.tar.gz fotky/') a jsem v suchu. Pokud ale budu mít oštítkováno, otagováno apod., tak pokud budu nucen obnovit data ze zálohy (vytáhnout z archivu), tak budu mít stejně jen nějakou štítkuprostou adresářovou strukturu. Prostě ty štítky nejsou a nebudou součástí těch dat. Musí se k nim zálohovat ještě něco, zřejmě nějaká databáze. A formáty databází jsou dost proměnlivé v čase, takže nevěřím, že bych ji za pár let bez problémů obnovil...
  • 28. 4. 2009 10:10

    Heron
    Doteď prostě adresářový strom někam nakopíruji (nebo udělám např. 'tar czf fotky_datum.tar.gz fotky/') a jsem v suchu.

    Bohužel nejste v suchu. Už dneska je problém zachovat při archivování např. ACL a rozšířené atributy souboru. Což jsou věci, které tu jsou s námi již hodně dlouho. Aby mě nikdo nechytnul za slovo, netvrdím, že to zálohovat nelze. Jistě že lze. Ale obecná podpora v archivačních nástrojích neexistuje. Bohužel ani obecná podpora od systémů souborů.

    Štítky nad soubory (tak jak si je představuji já) rozhodně nemohou být uloženy v nějaké DB. Musí je umět samotný systém souborů. A aplikace, tak jak se dnes ptají třeba na datumy vytvoření, tak se budou stejným mechanismem ptát na tagy.

    Dnešní implementace jsou šílené. Pro hudební soubory si DB tagů (získaných tu z ID3, tu z internetu, tu na základě preferencí uživatele) udržuje přehrávač. Pro fotografie si (v základu stejnou DB) udržuje nějaký soft galerie. Změníte soft (třeba proto, že nezvládá takový počet fotografií) a o všechny tagy přijdete. Pokud by tagy byly součástí metadat udržovaných systémem souborů, bylo by to bez problémů.

    Zrovna hudební soubory a fotografie představují typická data, pro která je adresářový strom zcela nevhodný. Příklady jsem uváděl výše. V podstatě jde o to, že strom umožňuje přístup na základě pouze jednoho kritéria a tím je cesta k danému souboru. K těmto datům ale potřebujete přístup z mnoha různých "stran". A to už do (jednoho) stromu neumístíte.

  • 28. 4. 2009 12:49

    JirkaS (neregistrovaný)
    Já neargumentoval proti tvému názoru, s ním souhlasím.
    Šlo mi jen o to, poukázat na problémy s ukládáním a zálohováním těch metadat. Pokud budou ve filesystému a půjdou rozumně zálohovat spolu s daty, pak OK. Ale jak sám říkáš, dnešní implementace jsou šílené a jsou tu logicky implementace nekompatibilní mezi jednolivými aplikacemi. A to je to, čeho se bojím, že ty data někde budu poctivě zadávat a za nějakou dobu mi to bude k ničemu...
  • 30. 4. 2009 19:16

    Lael Ophir (neregistrovaný)
    Ve Windows je zálohovací API, které tohle řeší. Navíc metadata je dnes nejlepší skladovat rovnou v souborech, a jen je indexovat. WinFS byla pěkná myšlenka, ale praktická realizace by byla zřejmě peklem pro uživatele. Všechny aplikace by bylo nutné přepsat, aby WinFS podporovaly.
  • 30. 4. 2009 19:22

    Lael Ophir (neregistrovaný)
    Zálohovací API pro Windows řeší i ACL a extended atributy. Většina backup aplikací ho používá. Na Linuxu je to pravda asi jiné kafe.

    Metadata by opravdu měly obsahovat soubory (extrakce metadat i ACL se provádí pomocí pluginů). Nad tím je dobré postavit indexer, a výstupy z něj potom můžete prezentovat různými způsoby. Indexování umí už tuším Windows 2000, k NT4 byl Index Server jako doplněk zdarma. Od Visty k tomu konečně máme i GUI.
  • 27. 4. 2009 14:53

    bez přezdívky
    Rozumím. Omezil jsem svoje tvrzení na "dnesni implementaci" štítů. :-)

    S fotkama jsme taky zápasili. Pokud máte víceméně uzavřenou množinu dokumentů, tak je situace asi jednoduchá. Jenže fotky rostou a rostou. Neznám nikoho ve svém okolí (včetně náruživých fotografů), komu by vydrželo svědomité nalepování štítků. Kromě problémů, které jsem už uvedl, jsem si vzpomněl ještě na fakt, že je třeba najít rozumnou úroveň popisu fotografie. Buď bude moc obecná (málo štítků), pak vám to vyhodí mraky fotografií, nebo bude příliš detailně popsaná a pak, vzhledem k neexistenci žádných váhových koeficientů (je tam jen Petrův obličej nebo jen jedna noha, mám dát čtítek "u moře", "moře" nebo "na moři" atd.) vám to taky může vyhodit změť dokumentů atd.

    Leckdo říká, že komunismus byla taky dobrá myšlenka, jen provedení nestálo za nic. Se štítky mi to připadá podobné. Človek, natož skupina lidí, ty pravidla těžko dlouhodobě dodrží.