Škoda, každý takový pokus o zpracování a poskytování dat ve slušném formátu považuji za chvályhodný. Sám jsem služby nevyužíval (nemám televizi, rekordéry ani přehravače či televizní kartu), takže jsem nijak projektu neprospěl. Doufám že aspoň autor získal užitečné zkušenosti a investovaný čas(úsilí, peníze, ...) se mu vrátí při příštím projektu.
Když už, tak by to chtělo dát do tv_grab_cz
, který je součástí XMLTV.
Zkusil jsem si jen tak cvičně stáhnout data od Seznamu – mají to v JSONu – převést to na XML a pak přes XSLT do XMLTV formátu. :-)
Ale taky tam jsou špatně názvy (epizody, díly). Leda udělat nějaký filtr pro nejoblíbenější seriály, který to z těch názvů bude vyžírat – v podstatě celkem jednoduchá XSLT šablona pro jednotlivé seriály na základě regulárního výrazu. A asi by to šlo i obecně – číst římské číslice (epizody) a arabské v závorkách (díly). Akorát tam občas budou nejednoznačnosti nebo bordel (některé filmy mají v závorce rok, někdy jsou dva díly seriálu jako jedna položka programu).
tv_grab_huro - pred nejakym tym rokom som tam pridal par riadkov pre cesko (port.cz) a slovensko (port.sk) kedze to tahalo program pre madarsko z port.hu a rumunsko z port.ro. nakoniec som sa na to vykaslal tak neviem v akom je to stave ale slo to celkom lahko pre mna ako cloveka bez akychkolvek skusenosti s perlom takze nejaky ten perl guru by to mal zmaknut bez problemov
Nerozumim tomu, proc je nutne za data platit. To neni mozne stahnout program z webovych stranek jednotlivych televiznich stanic a naparsovat je do XML?
Format, ve kterem jednotlive stanice programy na webu zverejnuji se asi muze casto menit, ale pro nejakou mensi komunitu uzivatelu by nemel byt prilis velky problem to udrzovat aktualni aspon pro nejsledovanejsi stanice ne?
Je nejaky problem v autorskem zakone? Nebo TV stanice sve programy na strankach nezverejnuji?
Ano, je problém v autorském zákoně. TV program je autorské dílo (databáze) a dále šířit jakákoli odvozená díla je možné jen se souhlasem TV stanic. Které vám ten souhlas nedají, protože mají nasmlouvané exkluzivní smlouvy s agenturami, zajištujícími placené sestavování programů pro tisk.
Navíc programy na stránkách TV stanic nejsou zdaleka nejkvalitnějším zdrojem, neobsahují tolik škatulek, kolik by obsahovat mohly.
Nicméně projekt s podobným záměrem existuje na xmltv.arcao.com.
Zajimave, dalsi duvod, proc autorsky zakon v soucasne podobe nerespektovat a zrusit.
Urcite by to slo ale obejit tak, ze by se zverejnily pouze parsovaci skripty, ktere by XML data ze stranek TV stanic nebo ze tv.sms.cz ziskaly. Autorsky zakon zakazuje kopirovani programu, ale kazdy si prece muze spustit skript, ktery mu data ze stranek stahne a nemusi data nikam sirit. Nebo se pletu?
Myslím, že zpřístupním ta data, co používám teď, někde na www.tvpc.cz, jak jsem psal včera do mythtv-cz mailing listu. Beru to z frantisheq.sk a spravuju číslování seriálů, opravuju strukturu XML a trošku čistím. Není to ideální, ale je to asi to nejlepší, co se dá sehnat.
Finální řešení je brát to přímo z EPG, protože u nás se televize chovají úplně debilně a místo aby ta data v zájmu vyšší sledovanosti cpaly lidem v požadovaných formátech, tak si je snad křečkují nebo co - prostě trapas...
uz len epizody, obsadenie, vycistit a je to. ostatne hovadiny neskor
http://dl.dropbox.com/u/441189/test.xml
Pridavam pohlad z druhej strany:
Pracujem vo firme, ktora dodavala data pre p. Hanusku. Mal projekt, ktory pocital s tym, ze sa prida viac ludi. Model mal fungovat tak, ze pan Hanuska bude platit nam za data a este mu aj par korun zostane. Dost korun mu od Vas vsetkych zostalo, lebo nam za data nezaplatil a aj nam oznamil, ze s projektom konci. Ak by mal niekto zaujem o podobny projekt a chcel by legalne data, tak sa kludne na nas moze obratit. Nie sme neziskova organizacia, no nebranime sa ziadnemu ekonomickemu modelu.
Marek Jurak
URI, spol. s r. o.
Trencin
uri@tdi.sk