Názory k článku Skenování knih pro tablety, čtečky a telefony se Scan Tailor

Zasílat nově přidané názory e-mailem

Článek je starý, nové názory již nelze přidávat.

3. 4. 2012 8:37

xpozitron (neregistrovaný)

Zdravím,
tak nějak jsem očekával i postup protažení OCR aby bylo možné provést "reflow" a aby text nebyl uložen jako obrázek čímž se velikost výsledného ebooku značně mění a přibývá možnost hledání v textu.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 4. 2012 8:09

VfB (neregistrovaný)

Nechci být rejpal ale pojmenovat pouhé nascanované obrázky jako e-book se mi zdá trošku troufalé.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2012 8:59

Jarda_P

Hm, dokonce je to v repo Debianu. Ale kdyz byla rec o cteckach, tak jsem take doufal, ze na konci vypadne epub a ne PDF, ze ktereho ctecky moc na vetvi nejsou.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 4. 2012 12:07

VfB (neregistrovaný)

nebo ještě spíše mobi, který čtou snad všechny čtečky
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 4. 2012 13:31

Jarda_P

Radsi epub. Na mobi jsem zatim nenasel editor, konverze mobi->epub v Calibre nejak nedopadne vzdy tak docela uzasne, zatimco obracene jsem s tim nemel problemy. Ja radsi snadno editovatelny a konvertovatelny format.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 4. 2012 10:41

Tomáš Pinkas (neregistrovaný)

To JardaP, VfB, xpozitron: chápu vaše zklamání. Epub, mobi, OCR v mém článku skutečně nenajdete, nutno říci, že zcela záměrně. Vysvětlím: osobně zastávám názor, že OCR se hodí pro beletrickou nebo jinou oddechovou literaturu. Tedy pro texty, kde člověk rozpozná chybu OCR vlastním úsudkem. Ale zkuste se učit třeba matematiku z textu, o kterém nevíte, zda nemohou být ve vzorcích zaměněny písmena... :-)

Jelikož si skenuji téměř výhradně nebeletrické knihy, upřednostňuji originální text, byť ve formě obrázků, než něco, co "odhadl" OCR software. Např. poslední dobou jsem se zabýval literaturou o stavbách rodinných domů, obsahující mnoho obrázků, grafů, výpočtů tepelných ztrát, názvů materiálů a technologií. Pochybuji, že tam by OCR bylo použitelné.

Krom toho, nesetkal jsem se s čtečkou, tabletem nebo mobilem, který by nezvládal obstojně PDF. Samozřejmě u "obrázkových" PDF rozhoduje velikost obrazovky, ale jak říkám, na mobilu se vyplatí číst si tak max. beletrii, nikoli technickou literaturu.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 4. 2012 17:10

Miloslav Ponkrác

Zvláštní, zřejmě je málo známá skutečnost, že v PDF, jakonžto i v jiných formátech jde kombinovat text s obrázky. Zřejmě je třeba provést větší osvětu na tomto poli.

Navíc moje OCR převádí text do textu a vzorce nechvá jako obrázky.

Ale jak říkám, to už je vyšší level – zřejmě se to učí až na doktoranském studiu, že je možné text a obrázky vzájemně v jednom dokumentu kombninovat. Zřejmě příliš těžké na pochopení.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 4. 2012 20:01

Jarda_P

Jeste byste tu mohl vyklopit postup. Tedy pouzity software a zakladni kroky. My si uz zbytek nejak domyslime.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2012 9:38

Bedna (neregistrovaný)

A ja že Cuneiform je strop.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2012 10:22

pek (neregistrovaný)

http://unpaper.berlios.de/

https://github.com/Flameeyes/unpaper
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2012 11:13

Petr (neregistrovaný)

Sosnul jsem z netu balik temer 17 tisic knizek v polstine, jsou tam jak stare, tak nove, format TXT cp1250. Podle chyb v textu to vypada na OCR, ale setsakra kvalitni. Opravdu by me zajimalo, jak neco takoveho vzniklo. 17 000! Jak se neco takoveho dela? Nezda se mi, ze by nekdo sedel a scanoval treba Sailor on Horseback od JACK LONDON a pak to ORCkoval a kontroloval.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2012 12:41

Mard (neregistrovaný)

Jo, přesně tak se to dělá. Člověk si to naskenuje a pak si to při opravě přečte. A při druhé opravě si to přečte další člověk :-)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2012 19:05

Ed (neregistrovaný)

Viz http://www.pgdp.net - distributed proofreaders. Vyborna zabava na dlouhe jarni vecery :)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 4. 2012 11:54

Ondřej Kučera (neregistrovaný)

Hlavní vtip je v tom, že těch lidí je hodně.

Jeden člověk by to nedal, ale když každý udělá jednu?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2012 16:19

bigo (neregistrovaný)

Takže jsme se dověděli, že ScanTailor je takový krám, že je třeba mu všechna data předchroupat ImageMagickem. Jaká může být jeho kvalita, když ImageMagick (který existuje taky jako knihovna) nedokázali tvůrci programu zaintegrovat přímo do ScanTailoru? Aspoň vím, že druhý díl číst nemusím.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2012 20:44

Jarda_P

Tak v Bubuntu to jeste neni ani verze 1. Cili asi dost ranna verze. Mozna, ze integrace Imagemagic je v planu, ale nejsou zatim clovekohodiny. Krome toho mozna maji web s feature request a muzete jim napsat.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 4. 2012 9:48

RaJ (neregistrovaný)

ScanTailor jsem použil na W7 v práci i doma na Ubuntu. Určitě neumím využít všechny vlastnosti, takže se těším na 2. díl, ale i tak mi dost usnadnil práci - ořezaní, rotaci, alespoň nějaké vyčištění je možné udělat rutinně, bez toho, že bych musel opravovat v graf. editoru každou stránku zvlášť.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 4. 2012 15:24

TomBA (neregistrovaný)

je evidentne veľmi zaujímavá téma. Zďaleka nie všetka literatúra sa dá v súčasnosti kúpiť v digitálnej forme. Mnohí čitatelia majú doma stohy kníh, ktoré by chceli digitalizovať.
Pre mňa najzaujímavejší portál venujúci sa tejto problematike je http://www.diybookscanner.org.
V jednotlivých sekciách fóra sa človek dočíta zaujímavé informácie o problematike deštruktívneho i nedeštruktívneho scanovania, fotenia, príprave pre OCR, OCR, calibre......
Je tam niekoľko pekných hackerských konštrukcií zariadení na fotenie i linky na profi riešenia.
Okrem ScanTailora sa tam v poslednom čase stále viac hovorí o javovskej aplikácii BookScanWizard. Skúsil som s ňou spracovať jednu 100+ stranovú knižku a aj mne sa zdá práca s ňou príjemnejšia a priamočiarejšia.
Kvalitný opensource OCR s podporou SK (kontrola naskenovaného textu spellerom či nebodaj grammarom) som zatiaľ nenašiel. <irónia>Verím, že to bude hneď ďaľšia aplikácia, do ktorej sa pustí slovenský univerzálny softwarový gigant Slovanet po dokončení slovenského anti-spam riešenia</irónia>
Používam ABBYY Fine reader, ale nie som s ním spokojný. Stará maďarská Recognita dosahovala pred 8 rokmi lepšie výsledky. Ani neviem kde na smetisku dejín (alebo v kremíkovom nebi) skončila. Teda viem, nahradil ju software Omnipage vraj s vylepšenými technológiami, ale výsledky SK textu sú s týmto software podstatne horšie. Po kratšom učení (20 min, pol hodinka) sa pri Recognita výsledky násobne zlepšili. Pri Omnipage ten pocit nemám....

Zasílat nově přidané názory e-mailem

Zprávičky

Kontroverzní Recall ve Windows 11 nakonec vyšel, ale jen pro Qualcomm Snapdragon

Naučte se pracovat s Dockerem a kontejnery (školení)

Raspberry Pi Pico 2 W s 2,4 GHz WiFi a BT 5.2

Komerční sdělení

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Budoucnost zpracování dokumentů s AI

Názory k článku Skenování knih pro tablety, čtečky a telefony se Scan Tailor

Zprávičky

Kontroverzní Recall ve Windows 11 nakonec vyšel, ale jen pro Qualcomm Snapdragon

Naučte se pracovat s Dockerem a kontejnery (školení)

Raspberry Pi Pico 2 W s 2,4 GHz WiFi a BT 5.2

Komerční sdělení

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Budoucnost zpracování dokumentů s AI

Dále u nás najdete

Ať Google prodá prohlížeč Chrome, navrhuje ministerstvo

SSD už také mají obrovskou kapacitu – až 122 TB

Vyhněte se chybám a prodlužte životnost USB flash disku

Firmy mají řešit byznys, ne hledat účtenky, razí Fidoo

Youtubeři a influenceři se musí registrovat

Sledují vás přes HDMI? Útok využívá elektromagnetické záření

Jak Mikýř vyděsil Novu, ale nakonec vydělaly obě strany

Vyzkoušeli jsme test, který ukazuje, co jsme zdědili po předcích

Deepl nově umí překládat v reálném čase řeč

Dřívější neplodnost dnes řeší miniinvazivní operace

Lumbální punkce sice vypadá děsivě, ale nebolí

Otestujte, jak znáte reklamní slogany

Je možné vyhrát nad Temu? Prodejci her se to podařilo

Děti, které nemají praktika, mohou jít do nemocničních ordinací

Opatrně s kofeinovým práškem, už jedna lžička je životu nebezpečná

Vláda chce odložit účinnost "digitální ústavy" o dva roky

Nejen Coca-Cola, ale i Lidl má červený vánoční kamion

Vánoční slevy operátorů? Daleko za očekáváním

Změny v náhradním plnění zaměstnavatelů od roku 2025

Pokud potřebujete půjčit, nemusíte prodávat bitcoiny. Stačí je zastavit