Vlákno názorů k článku Editace PDF v Linuxu: velký oříšek od freshmouse - Mno, jak řekli už lidé výše... Článek je...

  • Článek je starý, nové názory již nelze přidávat.
  • 3. 9. 2008 8:05

    freshmouse (neregistrovaný)
    Mno, jak řekli už lidé výše... Článek je bohužel o všem a o ničem. (Proč už pro Root.cz nepíše Adam Štrauch, ten vypadal jako autor docela nadějně?)

    Především bych se ale chtěl zeptat, kdo potřebuje editovat PDF. Možná jsem natvrdlý, ale nerozumím důvodům editace tohoto formátu. Jestli někdo dostává soubory PDF, které má editovat, pak je to spíš problém člověka, co takové soubory rozesílá v tomto formátu (a ne např. ve formátu nějakého textového procesoru). Stačí jej požádat, aby dodal i jiný formát.

    Zkrátka se mi zdá, že se řeší problém, ale ne jeho důvody. Tudíž se nepodchycuje další šíření problémů a dokonce se podporuje jejich vznik. Ach jo. :-(
  • 3. 9. 2008 8:52

    Karel (neregistrovaný)
    On je tohle trochu začarovaný kruh. Plno lidí (a bohužel jsou někteří z nich zákazníky nebo dodavately) nechápe, že PDF je formát "pouze ke čtení" a klidně vám v tom pošlou cenovou nabídku. Přesněji řečeno, vy pošlete například do AutoContu mnohařádkovou poptávku (jako plain text) a oni vám jako odpověď pošlou mnohařádkový (a někdy i několikastránkový) dokument ve formátu .pdf (s logem, adresami, čárkami a rámečky). Pokud chcete ceny a případně další texty dostat do nějakého rozumného formátu, musíte to opsat. A člověk z AutoContu se brání, že mu to "systém" neumí uložit jinak než jako .pdf a ještě dodá, že přeci PDF už jde převádět. A to je právě ten začarovaný kruh - "hloupí" lidé vyvolávají u ostatních deprese svou ignorancí, ti ostatní se snaží s tím nějak vyrovnat a nějak "to" obejít a tím zpětně dávají zapravdu těm hloupým v tom, že "vždyť to vlastně dělám správně".

    PS: Já osobně data zaslaná v .pdf shlédnu a dále nezpracuji. Zatím mi to vždycky prošlo. Ovšem po přečtení tohoto článku se obávám, že mně časem někdo donutí tyhle soubory zpracovávat s tím, že "vždyť je to editovatelné".
    PS2: Občas dostávám data i v .bmp - uživatel ofotí obrazovku, na které je vidět tabulka v MS Excel. Na tohle křičím a beru to jako osobní útok - a je pravda, že se to ti lidé rychle naučí nedělat.
    PS3: Příklad s AutoContem není smyšlený, to se nám skutečně stalo (naposledy minulý týden). Sám za sebe si ovšem myslím, že problém není v jejich "systému" ale u dotyčné "kontaktní osoby".
  • 3. 9. 2008 9:55

    anonymní
    "A člověk z AutoContu se brání, že mu to "systém" neumí uložit jinak než jako .pdf a ještě dodá, že přeci PDF už jde převádět"

    Tak na tohle musi clovek reagovat "Tak mi to prepiste, nebo mi to teda zkonvertujte".

    "Ovšem po přečtení tohoto článku se obávám, že mně časem někdo donutí tyhle soubory zpracovávat s tím, že "vždyť je to editovatelné"."

    Na to by bylo asi fakt potom nejlepsi importovat to do GIMPu a v bitmape tam pridat vlastni poznamky a poslat dal jako PDF. A kdyz se nekdo bude rozcilovat, ze ten text nejde zkopirovat, tak jenom odvetit "Bohuzel nam to prislo jako PDF, tak to jako PDF posilam dal, stezujte si u odesilatele".

    Je pravda, ze hodne subjektu dava k dispozici PDF. Chapu to jako ze tohle je finalni dokument a dal se zpracovavat a upravovat nema. On na to opravdu neni staveny - odstavce jsou tam samozrejme vysazene jako jednotlive radky, takze editaci jednoho slova se nezmeni sazba celyho odstavce. Stejne jako u PS. Takze pokud chci od nekoho dostavat data, ktera mam dal zpracovavat, tak v nejakem formatu, kde jsou ta data logicky seskupena (XML, CSV...).
  • 3. 9. 2008 21:20

    bez přezdívky
    …Na to by bylo asi fakt potom nejlepsi importovat to do GIMPu a v bitmape tam pridat vlastni poznamky a poslat dal jako PDF. A kdyz se nekdo bude rozcilovat, ze ten text nejde zkopirovat, tak jenom odvetit "Bohuzel nam to prislo jako PDF, tak to jako PDF posilam dal, stezujte si u odesilatele"…
    To si můžeš dovolit ty jako soukromá osoba, firma ale ne. Osobně bych si od takové firmy nekoupil ani teplou vodu.
  • 3. 9. 2008 11:40

    dustin (neregistrovaný)
    Nabídky také posíláme v PDF generovaném z OpenOffice. Není důvod, aby klient nabídku upravoval, naopak to není žádoucí. Vykopírovat texty lze bez problémů v Acrobat Readeru a zkopírovat do OpenOffice. Teď jsem si vyzkoušel, že se diakritika nepoškodí ve Win, v kubuntu se bohužel při tomto postupu zmrví některé znaky.
  • 3. 9. 2008 15:50

    JS (neregistrovaný)
    No a prave kvuli takovym zoufalcum, jako vy, kteri si mysli, ze lide chteji ty dokumenty upravovat, kdyz je ve skutecnosti chteji jenom strojove cist, vedemu tuto diskusi.
  • 3. 9. 2008 18:29

    freshmouse (neregistrovaný)
    Strojově číst? Co si pod tím mám představit?

    Ty si ke každému letáku sestrojíš program, který ho nějak zpracuje? Asi ne... :-) Tak co tím myslíš?
  • 4. 9. 2008 11:12

    JS (neregistrovaný)
    Ja to samozrejme nedelam, protoze si jako obcan nekupuji nic ve velkem. Ale dokazu si predstavit, ze firma, ktera nakupuje opravdu hodne neceho a kazdy mesic, potrebuje znat ceny zbozi ve strojove zpracovatelnem (= citelnem pocitacem) formatu. Napriklad kvuli ruznym inventarnim aplikacim.
  • 5. 9. 2008 9:47

    dustin (neregistrovaný)
    V takovém případě se domluví s dodavatelem na společném formátu. Inventární aplikace s tím nijak nesouvisí, ty čtou ceny z účetního systému, kam se ukládají přijaté faktury (téměř vždy ručně pořizované, jen málo firem používá standardy typu EDI) a výpisy z účtu (obvykle načítané automaticky ze souboru z banky). Poněkud umělý důvod, proč bychom neměli našim klientům posílat nabídky v PDF :)
  • 3. 9. 2008 16:44

    Karel (neregistrovaný)
    Je potřeba si říci, proč zákazníkovi ten dokument posíláte. Pokud je to závazný dokument, který sám o sobě má povahu smluvního závazku, pak chápu, že se snažíte bránit jeho dodatečným úpravám. Pokud to ale není závazný dokument (to, že někdo něčím takovým upraveným zamává neznamená, že to musí za tuto cenu dostat), pak se otevírá další otázka - bude zákazník chtít tento dokument dále zpracovávat? Pokud o vaší nabídce víte, že je podkladem pro výběrové řízení, pak byste měl udělat maximum pro to, aby s ní šlo dále pracovat. Jinak riskujete, že skončí tam kam patří - pečlivě přečtená a v koši.

    A co se vykopírování textu týká - to s úspěchem funguje jen do chvíle, než vám někdo v .pdf pošle tabulku, kde jsou některá políčka přes více řádků. Pak se z toho stane drsná piplačka.
  • 3. 9. 2008 22:31

    dustin (neregistrovaný)
    Samozřejmě, že cenová nabídka je závazný dokument. Nevím, v jakém byznysu se pohybujete, ale naši klienti očekávají, že co slíbíme, to umíme dodat.

    A jaké jsou alternativy? DOC - většina ze stovek našich firemních klientů nemá OpenOffice, tedy museli bychom také používat MS Office, tedy Windows. Navíc hrozí klasické hrátky s historií změn (podívejme se, jak si s tou cenou hráli). DOC mi pro finální nabídku přijde velice neprofesionální.

    HTML - jak tam dát obrázky? HTML mail - kolik lidí - obchodníků umí vyrobit pěkný HTML mail s obrázky, aby se 100% správně zobrazil na všech možných mailových klientech? Navíc kolik klientů umí správně přeposlat HTML mail kolegovi, když má nastavené vytváření textových mailů?

    Mám dojem, že teorie a praxe bývají velice rozdílné. Je to však praxe, co nás živí.
  • 4. 9. 2008 10:13

    anonymní
    souhlasim s vami: zavazna nabidka je na urovni napr. faktury - a kdo prosim zasila treba fakturu v nejakem editovatelnem formatu - bud ji mate na papire nebo v PDF - o zadnem standardnim formatu v tuzemsku nevim a prece by to dost ulehcilo praci, dnes to nekdo musi preklofat do pociatce, takze do doby zavedeni standardni overene vzajemnje komunikace se budou muset s temito zavaznymi dokumenty delat nasledujici teatry...
  • 3. 9. 2008 15:46

    anonymní
    Je ale velky rozdil mezi tim vytahnout z pdf data, coz dobre zvlada stary dobry pdftotext a mezi tim tento format upravovat, to jest treba pripsat nejaky text dovnitr odstavce a cely ho prezalomit, nebo upravovat format a podobne. Vytahnout text z pdf je trivialni problem, pokud neni text preveden do krivek, rozumej na obrazek. V takovem pripade je to temer trivialni problem, pomuze ocr. Nic z toho neni editace PDF o cemz je tento clanek a je to holy nesmysl.
  • 3. 9. 2008 18:30

    freshmouse (neregistrovaný)
    Obávám se, že cenová nabídka je přesně ten typ dokumentu, pro který je PDF vhodný.
  • 10. 5. 2019 12:15

    bez přezdívky

    na vytažení textů a tabule z PDF se výborně hodí :
    pdftotext -layout *.pdf layout.txt