DevTools Chromu toto umi i pres GUI. Neumi tedy PDF ale screenshot cele stranky Vam udela.
https://developers.google.com/web/updates/2017/04/devtools-release-notes#screenshots
[k3dAR]
Asi mam blbou verzi (Debian stable, ver. chrom: 71.0.3578.80), nebo mi tam neco chybi. V manualovych strankach neni o tom ani pismenko. Mozna mi tam neco chybi. Jak budu mit cas a naladu, zkontroluju jeste doporucene zavislosti.
Neni to nic, o co bych brecel (ja to momentalne nevyuziju), jen jsem byl zvedavy.
Doporučuji se podívat i na Selenium https://www.seleniumhq.org/. Je to projekt pro automizaci, který využívá právě headless mód a ne jenom Chrome. Pro mě s bonusem, že jedním z jazyků je Python.
A ten screenshot se dela kdy? V momente kdy fajruje document.ready? To ale stale neznamena ze musi byt vse nacteno. Urcite tam bude nejaky parametr pro timeout nebo nejake jine veci kterych by se dalo chytit. Samozrejme castokrat bude asi screenshot na document.ready uplne stacit, to je fakt.
https://github.com/GoogleChrome/puppeteer
Můžete si ve stránce počkat třeba na doběh skriptu, vyhodnocení podmínky.
umí to výše zmíněné Selenium https://selenium-python.readthedocs.io/
Chrome i Firefox umí headless režim, kdy pořídí snímek obrazovky/ stránky nebo uloží kód stránky atp. což se hodí pro testování a automatizaci webových stránek, které nejsou načtené hned poté, co pošlou HTTP 200 OK.
Jsou i služby, které to využívají komerčně na překlad blokovaných/ složitých stránek pro low-cost telefony např. v Indii:
"I worked around the clock for over a week, 20 hours a day to create a new version of Browserling that can handle hundreds of thousands of users and can run thousands of Chromes in kiosk mode on servers with terabytes of ram. I put it to the test and it worked flawlessly"
http://www.catonmat.net/blog/incredible-events-at-browserling
Osobně jsem např. použil cutycapt (http://cutycapt.sourceforge.net/) na uložení kurzů z jedné konkrétní stránky, což by jinak byla pro jednu kolegyni manuální práce. Hlavní díl práce spočívá v řádcích:
cutycapt --url=https://www.commerzbank.de/de/hauptnavigation/kunden/kursinfo/devisenk/taegliche_devisenmarktkurse/taegliche_devisenkurse.jsp --out=kb-test.html --delay=2000
sed ':a;N;$!ba;s/th>\s*/th>/g' kb-test.html | awk -F "</*t[hrd]>|</*t[hd]><t[hd] class=\"num\">" '/<\/*t[rhd]>.*[A-Z][A-Z]/ {print $2 ";" $4 ";" $5 ";" $6 ";" $7 }'
Není to nějak elegantní, ale jako příklad rudimentárního užití takových headless prohlížečů dobré.