Hlavně by mě zajímalo, zda Calibre udělalo něco s převáděním djvu formátů do jiných, protože to předchozí verze neuměly, i když to v možnostech bylo. Dále mu dělala problém konverze do PDF, úplně se vždy rozházel formát. PDF jsou lepší na dělání anotací, některé čtečky nepodporují poznámky u epubu.
Převádět DjVU do jiného formátu je kapitální zvrhlost, která je mimo to zcela zbytečná - do PDF si to můžete "vytisknout". Akorát tím ale přijdete o veškeré výhody, protože kvalita stejně nikdy nemůže být lepší než he v DjVU. Z wavelet komprimované bitmapy totiž originální předlohu, natož plaintext text neuděláte ani kdybyste se rozkrájeli.
"vylepšení interpunkce" ... spis jeji zmrveni, nema totiz zadnou moznost nastavit trebas spravne uvozovky, takze to prevede samo na US. Navic editor neumoznuje, a to tak ze vubec, pracovat s metainformacemi.
Ctecka pak trvale neumi cist v pdb v cestine (nezobrazi diakritiku), navic ma pro nekoho velmi nemilou vlastnost, ze si napriklad pri cteni epub tento zaroven modifikuje, protoze si to, kde ctenar skoncil zapisuje do nej (za tohle by se melo strilet).
Prevodnik je pak trvale nastroj naprosto tragickej ... 80% pdf neprevede vubec (respektive vygeneruje zmet hexa znaku), cestina je samo v tomhle ohledu naprosto mimo jeho shopnosti. Pri prevodech z doc/odt/... pak dava daleko lepsi vysledky plugin do oo/lo.
OCR to nedela, protoze to by fungovalo daleko lip, snazi se z toho vydolovat text, ale funguje to tak max na EN (a samo se pri tom totalne rozpadne formatovani, ale to je dany PDFkem samym). Jakmile v tom je diakritika, tak je vysledek naprosta tragedie, ostatne presne stejne jako ty pdb. V nich to diakriticky znaky projistotu vynecha uplne.
A víte o tom, že PDB nenese žádnou informaci o použitém kódování, takže ho konverzní utilita může tak maximálně hádat? Že když Calibru řeknete, že to PDB je například v Windows-1250, tak s češtinou žádné problémy mít nebude a převede to, kam budete chtít?
Obdobné nepřesnosti máte s tím PDF. Pokud použijete dobře vygenerované české PDF (např. z LaTeXu), tak vám z něj Calibre vyrobí EPUB (nebo cokoliv jiného) s naprosto správnou češtinou. Pokud do toho vložíte PDF, které dobře vygenerované není, tak to samozřejmě dopadne hůře, přesně podle principu Garbage In, Garbage Out.
Jiste ze to muze leda hadat, ale je spousta ctecek, ktere ho kupodivu uhadnou, a spravne. Stejne tak se ctecka muze zeptat, pripadne alespon umoznit kodovani vybrat, ani jedno z toho mozne neni.Jedine co potencielne mozne je, je provest konverzi s parametrama z radky, ale ani to nefunguje spravne (zkusel jsem to na cele radce souboru). Zajimave, ze trebas takovy pspad, ac to neni zadna ebook ctecka, to otevre ve 100% pripadu spravne ... asi disponuje cernou magii.
Co je to dobre vygenerovane PDF? To jsou jenom pindy. PDF mi zcela korektne zobrazi jak acrobat reader, tak foxit, tak js hruza firefoxu => jedinej kdo to neumi je calibre. Tudiz tomu PDF nic neni. Jen to calibre proste neumi. Ostatne, prevod v calibre dopadne velmni podobne jako pokus o cpy&paste, kde se diakritika bud odpari, nebo z toho vznika zmet znaku.
Navic ovladani tyhle veci mi prislo odjakziva ponekud chory, ale to je samo vec vkusu.
Asi je zbytečné to psát, protože podle stylu vyjadřování ve vašich příspěvcích je zřejmé, že víte všechno nejlíp a pokud náhodou někde jsou chyby, tak ve vesmíru, v žádném případě ne ve vás, ale pro kompletnost:
1) Je to možné, a ne jen "potenciálně". Podívejte se na parametr --input-encoding, resp. "kódování vstupních znaků".
2) Vždyť píšu, třeba výstupy LaTeXu. Se zobrazením to nemá nic společného. Zato s copy and paste všechno. Zkuste si třeba http://www.kiv.zcu.cz/pad2013/template/sbornikpad2013.pdf
A to otvírání v PSPadu jste zkoušel jen s českými texty nebo jste zkoušel také např. japonštinu? To že PSPad, tak „chytře“ pracuje s češtinou může být způsobeno tím, že v něm máte natvrdo nastavené kódování na češtinu.
Měl jste ty soubory se správným kódováním (UTF-8) nebo v nějakém prasáckém formátu (Win-1250)?
Vyhráváte bludišťáka
"Vylepšit interpunkci" převede bdquo na „ Když se podíváš co se změnilo uvidíš.
Editor umožňuje vložit libovolný znak a navíc vložit libovolný znak ze schránky, případně bdquo; Další bludišťák! ldquo; Uvozovky sám nepřevádí. Editor umožňuje pracovat s metainformacemi a umí to Calibre také.
V pdb zrovna nic nemám. Ano každá čtečka, která si pamatuje pozici, modifikuje jeden k tomu určený soubor epubu(on je totiž epub archiv). To nemá vliv na text knihy a umožňuje to pokračovat ve čtení na jiném zařízení.
Asi dělám něco špatně, protože to v Calibre převádím. PDF obsahující text se převede a to dle úrovně své sprasenosti.
koukam placal co vubec netusi o cem placa, takze milej placale
"" to neprevede na „“ ... protoze to nelze takto nastavit, ale prevede to na “” , coz jsou uplne jine a vcestine naprosto nepouzitelne znaky (sem zvedav, jak si stim root poradi).
Mata to samozrejme editovat neumi, to se da jedine v calibre jako takovym, ale ne v editoru samotnym, takze zase plkas a nevis o cem. Mozna tak maximale ve zdrojaku, coz je vskutku user friendly ...
Toto se opravdu dobre modifikuje .... obzvlast, kdyz tam je treba neco pridat, ze, trebas nazev ... hmm.
<metadata xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:opf="http://www.idpf.org/2007/opf"> <dc:identifier id="BookId" opf:scheme="UUID">urn:uuid:6006fb0b-f515-4d9d-9516-523a91edafec</dc:identifier> <dc:language>cs</dc:language> <dc:date opf:event="modification">2014-09-02</dc:date> <meta content="0.7.4" name="Sigil version" /> </metadata> <manifest> <item href="toc.ncx" id="ncx" media-type="application/x-dtbncx+xml" /> <item href="Text/Section0001.xhtml" id="Section0001.xhtml" media-type="application/xhtml+xml" /> <item href="Styles/stylesheet.css" id="stylesheet.css" media-type="text/css" /> </manifest> <spine toc="ncx"> <itemref idref="Section0001.xhtml" /> </spine> </package>
pdf obsahujici cesky text to neprevede v 90% pripadu, muzu poskytnout nekolik set prikladu. A opravdu nemluvim o scanech, ale o textu.
A ani nahodou, kazda normalni ctecka si to, kde uzivatel skoncil zapisuje to SVEHO k tomu urceneho indexu, protoze stejnou knizku muze cist 10 lidi zaroven, a kazdy je aktualne nekde jinde, takze zapisovat do knihy muze leda debil. Ale jo, podle predstav vyvojaru calibre ma mit kazdej user v /home 10GB knizek, stejnych jako 150 jinejch uzivatelu, protoze tak to ma byt ...
PDF obsahující češtinu mi v 90 % případů převede, jen to občas chce ručně nastavit vstupní kódování. Větší problém je spíš s odstavci a odřádkováními, kdy ani heuristika někdy nestačí. Výsledný dokument pak tvoří hromada odstavců o délce jednoho řádku z původního PDF.
A co se reading progress týče, tak to je otázka use case. Já zase netuším, proč bych si dělal 150 uživatelů a dával jim 10 GB knížek. Stačí mi jeden uživatel, zato ale chci sdílet informaci o poslední přečtené stránce mezi několika zařízeními. A mám takový pocit, že většina uživatelů Calibre to má taky tak. ;-)
"" to neprevede na „“
Protože k tomu ta funkce není určena. Dělá totiž něco úplně jiného. Až přestanete nadávat, dupat nožičkou a šířit bludy, možná na to přijdete. Na záměnu špatných uvozovek můžete použít funkci najdi/nahraď.
Metadata umí editor editovat ve zdrojáku. U nové knihy titul vyplním v nabídce. A napsat (title)Titul(/title) nepovažuji za problém. Mohu použít i nabídku Calibre. Kdy použiji který způsob je na mě.
Záložky Calibre jdou smazat a když spustíte kontrolu, tak tu nabídku dostanete.
Číst stejnou knížku může několik korektorů a ti chtějí vědět co ten předchozí udělal (pokud nepoužívají například git), nebo 10 debilů. Inteligentní lidé mají svou kopii a tak se jich to, co dělám na své čtečce / případně v Calibre netýká.
Prostě si přiznejte, že vaše problémy se nacházejí mezi vašima ušima. To, že něco neumíte/neznáte neznamená, že za to může někdo jiný.
Jiste, ty to nepovazujes za problem, protoze zcela zjevne vubec netusis, jak ten format vypada ... jen tu placas.
Takz emilej placale, uz vidim jak zivy, jak BFu, kterej si chce trebas jen lehce upravit knizky a doplnit do nich nejaky info, rucne vklada ..
<dc:contributor opf:file-as="Voprsalek,Karel" opf:role="ill">Karel Voprsalek</dc:contributor>
Jenom proto, aby doplnil ilustratora
Pripadne ...
<dc:title>Nazev</dc:title>
Protoze mu uzasny editor neumozni to udelat jinak. O pripadnych slozitejs formatovanych informacich ani nemluve.
Tak funkce je urcena k tomu, aby prevedla znaky na typograficky spravne znaky. A typograficky spravne uvozovky (a spousta jinych znaku) jsou (pro tebe velke prekvapeni) pro kazdy jazyk definovany jinak. A jelikoz to neumi regularni vyrazy, tak se samozrejme ani nedaji uvozovky nahradit spravne nijak jinak. Takze tu neplkej o vecech, o kterych vubec netusis jak maji vypadat.
Na korekce jsou urceny uplne jine aplikace a s debilitou ukladani a predevsim modifikace (a mrveni) knizek nemaji nic spolecnyho. Nasrano na krku tady pak mas leda ty, nebot samozrejme doma mas 20 pocitacu, aby kazdej i potencielni navstenik mohl mit svoji kopii od kazde hovadiny, kterou by nahodou chtel pouzit ...
Ne, lepsi je netvrdit, ze nastroj neco umi, kdyz to zcela zjevne neumi. Sigil umi jak wysiwyg editaci, tak samozrejme upravu zdrojaku, tak pochopitelne (F8) editaci meta informaci.
Jediny co me na nem aktualne sejri je, ze padne nahubu, pokud ho mam overenej v RDPcku a prepnu sesnu. Zatim sem nenasel vuli a silu instalovat si kvuli tomu nejaky visualko, abych si to oddebugoval.
problem je v tom, ze ctecka pri kazdem otevirani pdb provede nejprve konverzi na epub a pak teprve zobrazi ten epub. Nejlepsi reseni je tedy provest tu konverzi vsech pdb jen jednou, nastavit pri prevodu ve Vzhled a Chovani polozku Kodovani vstupnich znaku na cp1250 a je to, pak ta ctecka funguje, jak ma.
Druhy otravny problem pri prevodu je, ze odstavce jsou oddeleny mezerou a nikoliv odsazenim. Pro tento pripad staci do Extra CSS pridat
p {text-indent: 1.5em; margin-top: 0em; margin-bottom: 0em}
Jinak editor regularni vyrazy umi, po CTRL + F muzu normalne regularni vyrazy pouzivat.
„vylepšení interpenkce“ - je myšleno pomocí najdi/nahraď regulérních výrazů v editoru
pdb je asi stokrát překonaný prehistorický formát a problém s češtinou bude nejspíš způsoben tím, že ten soubor bude v nějakém prasáckém kódování a ne utf-8
problém s PDF bude nejspíše podobný, většina pdf z ulozto edice a jiných warez zdrojů bude nejspíše natvrdo formátovaná na A4ku a možná zprasená i jiným způsobem
při exportu z ODT (nebo z DOC přes ODT) do ebookových formátů funguje Calibre na uspokojivých cca 85% a s češtinou nemá vůbec žádné problémy, tedy pokud máte dokumenty v UTF-8, jak je normální v toto století
Jiste, bez vykladat tem milionum booku, ze je nekdo ma prekodovat a prevadet ...lol. Automaticky prevod je naprosto knicemu ... navic prevodnik parametr s kodovanim zvesela igonoruje (mozna uz neplati, ale zkousel sem to v nekolika ruznych vezich, a fungovalo to tak v 1% pripadu spravne, v 80% pripadu "nahodny pristup" (= nektere znaky OK, jine nikoli) a ve zbytku to nefungovalo vubec.
Jiste ... trebas doc ... nebo pdf ... a mimochodem, vis proc si lidi ukladaji na disky knizky, filmy, muziku, ... ??? Zjevne nikoli ... protoze uz za tyden to muze byt nedostupne. A to treba proto, ze se nekdo rozhodne, ze 70let po smrti je malo, a prodlouzi se to na 90 nebo 100 ...
Mimochodem, v knihovne maji nakradeno na 10 zivotu ... svine jedny ... a pucujou to zadarmo hajzlove ...
Z FAQ calibre:
Neither the Kindle nor the Nook provide any way to manipulate collections over a USB connection. If you really care about using collections, I would urge you to sell your Kindle/Nook and get a Kobo. Only Kobo seems to understand that life is too short to be entering collections one by one on an e-ink screen :)
Note that in the case of the Kindle, there is a way to manipulate collections via USB, but it requires that the Kindle be rebooted every time it is disconnected from the computer, for the changes to the collections to be recognized. As such, it is unlikely that any calibre developers will ever feel motivated enough to support it. There is however, a calibre plugin that allows you to create collections on your Kindle from the calibre metadata. It is available from here.
Amazon have removed the ability to manipulate collections completely in their newer models, like the Kindle Touch and Kindle Fire, making even the above plugin useless, unless you root your Kindle and install custom firmware.
Calibre na Linuxu používám už asi tři čtvrtě roku. Určitě nevyužívám jeho celý potenciál, ale pro správu knihovny jsem nenašel lepší nástroj. Prakticky využívám 3 funkce - import knihy, stáhnutí metadat dané knihy z internetu, konverze do daného formátu (typicky epub).
Ale autor článku by si jej po sobě měl alespoň 3x přečíst. Je opravud hodně chyb a relativně často použité slovo relativně...
Calibre je pro ruční práci s knihami fajn nástroj (ačkoliv je Sigil více autorsky zaměřený nástroj, připadá mi Calibre opravu lepší). Co mě na něm ovšem schází je ovladatelnost z příkazové řádky (pominu-li těch pár argumentů, které jsou spíš pro formu). Pro dávkové zpracování knih to není a co je horší, pro dávkové zpracování elektronických knih neexistují prakticky žádné rozumné nástroje (tedy minimálně co se formátu EPUB a MOBI týče, pro práci s PDF je nástrojů a knihoven dost).
Validace by se ještě jakž takž dala zvládnout s epubcheckem (C++kový flightcrew je kupodivu pomalejší než javový epubcheck, nemluvě o tom, že jeho výstupy nejsou právě ideální - nedokáže detekovat některé nedostatky ve validitě OPF souborů, hlavně co se metadat týče). Pro práci s MOBI soubory lze sice jakž takž použít kindlegen, ale taky žádná sláva (chybové zprávy vypisuje do stdout, nemluvě o tom, že při dostatečně nevalidní knize - stačí non-well-formed XML v OPF souboru - prostě zdechne a neřekne vůbec nic).
Pokud byste pak chtěli řešit třeba něco složitějšího, jako třeba generování náhledů z EPUBů, dávkové změny metadat, apod., máte smůlu a nezbude vám nic jiného, než si napsat utility vlastní, což je lidově řečeno masakr. Specifikace formátů jsou sice známé, nicméně už jen zběžné prostudování formátu OPF, nebo NCX vás od něčeho takového bezpečně odradí (čeká vás XML ve dvou vzájemně se prolínajících namespacech - už jen normalizace je práce pro vraha).
Samostatnou kapitolou je pak manipulace s obsahovými částmi knihy. Například dávkově modifikovat obálku knihy je nesnadný úkol (chcete mít všechny knihy upravené tak, že na titulní stránce bude obrázek přebalu bez "keců" od vydavatele? Jde to, ale zapotíte se). Rovněž práce s obsahem/navigací může být zbytečně složitá. Nutno podotknout, že to je důsledek (podle mého názoru) poněkud přebujelé specifikace EPUB formátu. Vzhledem k tomu, že drtivá většina běžně dostupných knih (minimálně na českém trhu) je generována v Adobe InDesignu (který interně používá knihovnu Sigil), můžete se těšit i na to, že struktura tímto nástrojem vygenerovaného OPF souboru je otřesná (běžně chybí dc:language, dc:identifier se vyskytuje vícekrát, bez označení schématu, nedostatečné uvedení rolí dc:creator, jednou je namespace DC uvedený v kontejneru metadata, podruhé je u namespace inline v každém elementu metadat, a podobně).
Vím že tento příspěvek je dost off-topic, píšu jej sem spíše jako varování těch, kteří by si snad (nedej bože) chtěli napsat nějaké nástroje na dávkové zpracování elektronických knih - tuto myšlenku s klidem zavrhněte a zůstaňte u ruční editace knih v Calibre. Neříkám, že to nejde (mluvím z vlastní zkušenosti - jeden takový on-line systém jsem komerčně napsal), ale za ty nervy co vás to bude stát, to prostě nestojí a opensource (a kupodivu ani closedsource) řešení neexistují.
Zlaté Calibre!
Například dávkově modifikovat obálku knihy je nesnadný úkol (chcete mít všechny knihy upravené tak, že na titulní stránce bude obrázek přebalu bez "keců" od vydavatele?
Kalibre je na správu knih a ne na editaci bitmap. I většina uživatelů vybavena Photoshopem by měla problémy s tím aby vyretušovala nějaký text z obrázku a vy chcete po Kalibre, aby to dělal dávkově a automaticky?
Nechci, a kdybyste četl text pozorně, tak byste si zajisté všiml, že ani v této, ani v jiných částech nekritizuji Calibre, ale obecně nástroje na dávkové zpracování elektronických knih (což je snad jediná věc, kterou Calibre neumí :), které buď neexistují, nebo jsou nevalné kvality. Kromě toho výměna obálky není otázkou editace bitmapy, ale editace první (X)HTML stránky, která je součástí knihy, což Calibre bez problémů zvládá (když už se o tom teda bavíme)...
Ale Calibre přece umí editovat knihy hromadně - v zobrazených knihách vybereš standardním způsobem knihy se kterými chceš pracovat( hint: Ctrl-A pro všechny zobrazené), a pak můžeš všechny najednou převádět do jiných formátů za stejných podmínek, a nebo jim všem najednou editovat metadata. Součástí Calibre je i řádková utilita ebook-converter, která toho umí taky docela dost.
pokud pomůže
http://www.ptejteseknihovny.cz/uloziste/aba001/2012/databaze-knih-s-jejich-isbn
převod a jednoduchý filtr mám/nemám si uděláš.
Pokud jsou knihy v té knihovně novější, tak databazeknih.cz má aplikaci pro android, která by měla přes čárkový kód zobrazit informace o knize (mohlo by to ušetřit nějaké to datlování).
https://play.google.com/store/apps/details?id=cz.databazeknih.android