PDF v zásadě není problém, protože pokud jsou to naskenované stránky (takže je to náhrada za sérii .jpg), tak s tím stejně nic nenaděláte, při vytváření pdf (třeba TeXem) zase není problém vyrobit "čtečkový" formát, který bude na těchto zařízeních čitelný.
Víc by mě u téhle čtečky vadila absence podpory formátu pdb, protože řada e-booků je dostupná jen v něm.
PDF je vzdycky problem, jednoduse proto, ze ten format by (teoreticky) mel odpovidat tiskovemu vystupu. Pokud nekdo neco ponechava jako scan, tak jde prevazne o knizky se slozitym formatovanim, spoustou obrazku, tabulek, ... s cimz si zadny OCR neporadi bez manualnich korektur.
Pokud nekdo scanuje ciste text, tak samozrejme vysledek OCRkem prevede. Ovsem i tak je to bez korektur prevazne plne chyb.
Tragedii pak je, kdyz neco podobneho zverejni narodni knihovna ... lol ... (mozna to uz spravili, ale veskera capkova tvorba byla zverejnena jako OCRkovane scany - bez jekehokoli formatovani, kapitol, odsazeni .... proste hruza)
Národní knihovna a nebo Městská knihovna Praha?
Četl jsem takhle Krakatit, právě jsem tehdy také nadával, žádné rozlišení kapitol, i odstavce byly slité dohromady... A to bylo právě z Městské knihovny v Praze. Ale byla to jedna z prvních věcí, co jsem četl na Kindlu. Mám pocit, že pak vyrobili novější verzi, kde už to bylo lepší...
To jsou zase polobludy: '(..) při vytváření pdf (třeba TeXem) zase není problém vyrobit "čtečkový" formát (..)'. Pisatel asi v zivote nesazel v TeXu, a nebo si ho, jak je u nas kdoviproc oblibene, plete s LaTeXem.
Verim, ve v LaTeXu je to, aspon u dokumentu, ktere se LaTeXove sablone prilis nevzpouzeji, snadne (presto bych uvital odkaz pro blbe, muze se mi to nekdy hodit). V TeXu je to obecne zhola nemozne, resp. mozne uplne stejne, jako u PDF -- jen velmi spatne, ve zvlastnich pripadech a za cenu znacneho domrseni stranky.
Mýlíte se vy. Tenhle problém jsem nedávno řešil a v čistém TeXu je to opravdu jednodušší.
Pro TeX mi stačí v optimálním případě zadat do do hlavičky dokumentu \magnification = magstep No, kdy za to No dosazuji konkrétní číslo (pro tisk na A4 stačí 1 (což je implicitní, takže se dá tento řádek pouze zakomentovat), pro Kindle (a jiné podobné čtečky) to bude 2 nebo 3, 4 přečtu i na mrňavém displeji Nokie E72.
Pokud nebudu mít k dispozici příslušné fonty (dané velikosti), tak je buď ručně nakompiluji, případně se dopustím prasečiny a spustím dvipdf pod rootem (některé instalace TeXu v takovém případě samy provedou kompilaci příslušných fontů).
V LaTeXu bude tento problém trochu složitější (minimálně bude třeba poshánět nebo nadefinovat sazbu na velikost stránky A5, A6, nebo dokonce A7 (což není úplně triviální záležitost, svého času jsem se s něčím podobným potýkal a moc úspěšný jsem nebyl). Nebo patřičně nazvětšovat fonty pro normální text, nadpisy atd. (opět to není úplně triviální záležitost a předdefinované styly mi zde budou spíš překážet). Nebo nadefinovat vlastní styly (děkuji pěkně, nemusím).
Takže pokud půjde o hladký text s tu a tam vloženým obrázkem, tak spíš budu podobný problém řešit v čistém TeXu než v LaTeXu, jedině u složitě formátovaných textů bych šel do znásilňování LaTeXu.
Snad by se u toho LaTeXu ještě dala ralativně snadno udělat skrčka, že byste to vysadil vícesloupcově (pro Kindle by při fontu 12 pt stačila dvousloupcová sazba, pro displej Nokie E72 - a podobné 3 - 4 sloupce, pro tablety by asi stačily 2 - 3 sloupce) a muselo by se při čtení přejíždět na začátek dalšího sloupce, nebylo by to tedy pohodlné čtení ekvivalentní optimu blízké velikosti písma.
A námitku, že chcete vlastní velikost písma, třeba 16,7 pt, neberu, protože vlastní velikost písma si nemůžete navolit ani na papírové knížce.
Ocividne mluvite o necem zcela odlisnem. Mluvite o pripadu, ze v TeXu mate dokument velmi chudy na makra. Tam neni o cem se bavit. Pokud mate v TeXu jiz hotovou vysazenou knizku (plakat, tabulky), je predelani hodne az nesmirne obtizne. Neresim nesmyslne zadani, resim typickou ulohu, ze autor posle nakladateli knizku/clanek. V TeXu tedy jen za podminek, ze nakladatelstvi by zverejnilo dostatecne nadcasovou sablonu -- utopie. DocBookiste s FOPisty se o to snazi leta s vysledky, rekneme, skromnymi. (A uplne automatizovana sazba zas nikdy neda spolehlive graficky koukatelny vysledek.)
Záleží na tom, jaká makra to jsou a kdo je jakým způsobem napsal. Mohou skutečně existovat makra striktně určená pro výsledný konkrétní formát stránky (absolutně v cm nebo inch), nicméně při troše slušnosti při psaní budou ta makra vycházet z nějaké délkové míry (třeba délky strany tiskového zrcadla) a na ni přepočítávat vše ostatní.
Druhou věcí je, že při tvorbě e-booku máme k dispozici zpravidla holý text od autora (+ soubory s obrázky), a ten nějak zalamujeme, a na tuhle činnost je TeX (včetně možnosti parametrizovat toto zalomení pro různou velikost fontů nebo různou velikost stránky) neskonale lepší než cokoli jiného.
Resili jsme to tu pred casem, vehementne jsem se domahal napr. ja. Root mi pomohl, nasledkem diskuse jsem si koupil 6" Nook Simple Touch, rootnutej s OrionViewerem a moc mi to pomohlo. Jiste by mohlo bejt lip, ale i v tech 800x600 se mi naprosta vetsina odborne literatury cte lip (po oriznuti okraju vetsinou jednosloupcova PDF/DjVu na sirku, vicesloupcova po rozkrajeni v ctecce na vysku).
Ad: "uzivatele zadaji pdf, protoze nechapou, ze pdf neumi reflow". Myslim, ze PDF celkem chapu, pred lety jsem programoval docela casto v PostScriptu a vyrazove prostredky jsou podobne. Tady ale az tak nejde o to, co kdo chape. Scanovane dokumenty premluvite stezi, a takovych je vetsina clanku starsich nez z 90. let.
Dale si uplne nejsem jist, jak soucasne cteci formaty umeji zachazet napr. s netrivialni matematikou, protoze tyhle formaty naopak zase vubec neznam. Ale i pokud je toto vyreseno skvele, jak v kratkem case premluvite IEEE, Springer, Elsevier, Wiley... a dalsich par alespon desitek nakladatelstvi, aby
1. vydavali svoje casopisy v ohebnych formatech
2. do nich prevedli tech cca 100 let nazpatek?
Vysledkem je, ze kostnate, geometricky pevne formaty jsou a budou jeste nejakych par desitek let potreba.
A to kde ze se vezme ta lidska sila na prevod scanu do textovych formatu u toho mnozstvi clanku, u nichz je tak zhruba jeden ctenar z deseti milionu behem deseti let? A presto je role i takto malo ctenych clanku v technicke ci prirodovedne praci nesmirne dulezita, i kdyz nemaji prodejnost/kopirovatelnost jako Hary Potr.
Na shitozni a zachybovany prevod OCRkem neni treba nakladatele, to si ze scanu muze pustit kazdy doma sam. A1e rnoc rne nebav! ci5t takovy b|bosti.
Kupodivu mezi ctenari ... a na podobne zachybovany book sem nenarazil uz hodne dlouho, nehlede na to, ze pokud to nekdo nascanuje, muze to nekdo jiny protahnout OCR a nekdo dalsi udelat korekturu - driv nebo pozdejs z toho vyleze vysledek.
A ze budou primarne prevadeny veci, o ktere je zajem? No to je celkem logicke. O zbytek se muzou postarat nejaka sdruzeni/nadace/... podstatne je, aby takove konani nebylo po staleti(uz ted se bavime o +- 150 letech) nezakonne.
O dila stara 150+ let je zajem velmi vyjimecne, specielne pokud to jsou odborne publikace - pak prevazne plati, ze co je v nich uvedeno uz davno neni pravda (v tomhle pripade plati casto uz po par letech od vydani).
Ja nic chapat nepotrebuju. Proste vim, co chci a to je pdf. Zadne reflow netreba, staci, kdyz ctecka zvlada zakladni ukony, snadny zoom a posun po strance, presun na dalsi sloupec, nikoli stranku u dvousloupcove sazby, apod. Velka ctecka mi pripada na cesty nepohodlna a na 6" jsem zatim byl schopen pohodlne precist vse, co jsem potreboval i v pdf. Ja jsem zadal a dostal jsem. Sice nechapu, ale dulezitejsi je, ze mam.
Souhlasím. Jednou jsem našel dokonce i dvě verze téhož odborného článku ve formátu PDF. Jeden pro A4 a jeden pro A5 (a ten je na čtečce čitelný bez rolování). Myslímže by mohl jít vývoj tímto směrem. Každá třebas diplomka by navíc v sobě obsahovala variantu formátování pro zhruba A5. V reflow moc nevěřím zvlášte u vzorců, obrázků a vůbec tam, kde je lámání stránky podstatné.
Napsal jsem to do článku. Do tohoto i do několika těch předešlých. Spousta čtenářů, které nezajímá a nebaví IT, chce pohodlně nakoupit knihy v nějakém e-knihkupectví. Proto řada čteček má na takové e-obchody přímé napojení a je možné v těchto čtečkách přímo vybírat, kupovat a stahovat knihy. Je to v každém případě plus, protože kdo nechce, ten to nepoužije, ale kdo to potřebuje, ten to má po ruce. Takže - I just win!
Bylo by to plus, pokud by existovalo standardizovane API a uzivatel by jednoduse pridal dalsi http odkaz a tim mel pridan dalsi obchod, ve kterem muze primo nakupovat.
Jinak je to spise minus, protoze pak prevazne plati, ze dostat do ctecky cokoli z jineho zdroje, neni zcela trivialni ukon.
=> ctecky svazane s nejakym shopem radsi nebrat.
To není pravda. Neviděl jsem žádnou čtečku, která by omezovala uživatele při nahrávání vlastního obsahu. A to dobrá polovina z nich byla svázaná s konkrétním dodavatelem obsahu. Kindle má Amazon, Bookeen má PalmKnihy, eWooky je Wooky, eReading má vlastní čtečku a podobně. Nikdo z nich nelimituje uživatele v nahrání vlastního obsahu.
Dokáže čtečka pracovat s vlastními písmy vloženými do E-PUB? A dokáže to i v případě jejich DRM ochrany?
Moje zkušenosti jsou, že některé čtečky vložená písma ignorují, a jiné zase v případě jejich DRM ochrany odmítnou dokument zobrazit.
Je rovněž otázkou, jak si čtečka poradí s chráněnými dokumenty celkově.
Rovněž by mě zajímalo, zda neumí, jako některé čtečky, u PDF vyseparovat text a zobrazit ho bez stránkového formátování.
epub je zipnuty adresar s html subormi a xml meta definiciou indexu s nazvami jednotlivych suborov s textom. da sa tam pridat ttf, do html prislusne css ktore to ttf referencuje a nasledne to cele zipnut.
pre nook classic (ktory out-of-box nepodporuje diakritiku ani uzivatelske fonty) je to okrem rootnutia jediny sposob ako citat epuby s diakritikou.
momemtnalne nemam poruke ziadny takyto upraveny epub, ale myslim ze napr. calibre vie bez problemov robit podobnu fontovu magiu.
Dodatečně moc děkuji za vyzkoušení, i když výsledek zklamal. Vypadá to, že každý výrobce čteček si e-pub implementuje po svém a pro tvůrce knih z toho vznikají problémy.
Už i Amazon v novém KF8 umožňuje vlastní fonty a kniha pak lépe vypadá, když například v historickém románu je možno použít na nadpisy pseudogotické písmo a u rukou psaných dopisů nějaký psací font.
U e-pub ale není jistota, zda se kniha s DRM chráněnými písmy vůbec v některých čtečkách zobrazí a bez DRM je zase problém s licencí k jednotlivým písmům.
Opět tak vzniká problém roztříštěného trhu, kdy si zákazník přečte, že čtečka má luxusní podporu plna formátů, ale žádný neumí pořádně. Naposled jsem se třeba setkal s čtečkou, kde při použití kurzivy v textu bylo následující písmeno částečně oříznuto. Prostě "paráda".
To ale plati o vsech textovych formatech. To neni o epubu, ale o tom, ze ctecka nemusi vykonostne zvladat, navic sme u toho, co za 20 let spousta lidi stale nechape - ze prece nejde o pixely, ale o to, aby to slo precist. Ve finale si stejne uzivatel muze font vybrat jaky chce (co mu ctecka umozni).
Onehda sem se strasne smal, kdyz mi jeden zakaznik cumel pres rameno a zacal se rozcilovat, ze se mi na jejich webu nezobrazuje nejaky blikajici hnus a ze mam uplne jine fonty ... nedokazal pochopit, ze to je proste tim, ze ja sem si takhle nastavil prohlizec, a on s tim proste nic neudela.
BTW: SW ctecka co je soucasti calibre to zobrazi vcetne fontu (oboje), sigil detekuje fonty s Adobe DRM.
když už jsme u louží: a jak je na tom vlastně s impregrací? Když vytáhnu čtečku ze zimy do tepla, orosí se.. vadí to čtečkám? U této konkrétně když vidím ty vojenské pohybové buttony, tak bych věřil, že vydrží i třeskutý mráz (koneckonců stejně jako žiguli bývají výrobky z východi povětrnostně dost dimenzované).
Já na svém androidovi (nejen) na pdb používám Cool Reader:
http://www.coolreader.org/e-index.htm