ako pisu aj tu: http://www.techworld.com.au/article/340870/open_source_deduplication_software_released_linux ,
je to urcene najma pre virtualizovane prostredia ako je VMware, xen a pod.
Pripomenulo mi to trosku NetApp…
Sdilena cast budou hlavne standardni binarky z balicku, takze kdyz se posere, tak se proste balicky preinstaluji a je to.
Spis bych se bal o stabilitu tech odlisujicich se casti. Krome toho neco se muze posrat v PC kdykoli, muzem treba zacit obavami o prenastaveni nejakeho bitu v RAM kvuli zareni zvenci, preskoceni nejakeho elektronu pri ceste po tech par atomu sirokych cestach v CPU, atd… bezne PC neni zdaleka tak stabilni a deterministicky stroj, jak se muze na prvni pohled zdat, to ze jede nekolik bilionu operaci 100% deterministicky neznamena ze obcas neco neujede.
Takze nakonec stejne musi mit clovek plan B, co delat az se to posere.
Jak uz tu nekdo podotknul, hodi se deduplikace hlavne pri virtualizaci. Pokud mate nainstalovanych 200 virtualnich OS a kazdy zabira 2 GB mista na disku (dohromady tedy 400GB), budou deduplikovana data zabirat neco kolem 20 – 30GB coz je velka uspora. Nasledne to vede k usnadneni zalohovani atd.:)
1) vmfs ve vmware4 umi deduplikovat sam.
2) Jak vmware view, tak Xen i KVM umi pokud vim zdileny image a delat k tomu jen rozdily.
3) openVIrt etc umi zdilene adresare (stejne jako solarisove zony)
4) Java ? tak to date jenom do FUSE … no leda ze by to byl referencni navrh, ale v C++ je windows, Linux je v C bez objektu ;-))
Taky si myslite, ze tenhle FS je vystrel slepyma do temnoty ?