Tedy, jestli bych si dovolil vlastní zkušenost, ona zmíněná použitá funkce vyhledávání s našeptáváním se prostě v tomto objemu dat dostatečně optimalizovat nedá. Jak ostatně přiznává i autor, když píše že u nich řeší tytéž problémy s objemem o několik řádů nižším.
Tudíž , v tomto objemu celostátních IS žádná "systémová řešení", ale naopak, povolovat už v návrhu jako naprostou výjimku, u které se velkými písmeny napíše "BUDE způsobovat trvalé problémy a přetížení", a ať se pod to laskavě někdo zodpovědný podepíše, a nese si za to potom osobní zodpovědnost.. A nebo se to nepovolí, a bude se už v návrhu hledat jiné řešení. Přitom, jen tak z hlavy mne napadají hnedle dvě, poměrně efektivní.
To první, když už se v předešlém kroku ověřuje identita uživatele dle čísla jeho dokladu, tak se taky mohla rovnou stáhnout a nabídnout jeho adresa trvalého bydliště, což by naprosté většině lidí (a kór v době nouzoveho stavu) stačilo.
A za druhé, když už tedy, tak se to mohlo poměrně jednoduše předem omezit na co nejmenší lokalitu. Což třeba už jen aby uživatel zadal PSČ, jen tento rozsah adres se načetl, a jen v něm pak toto
Nicméně, v čem je asi přímo systémový problém, je zkrátka nutné si uvědomit, že informační systémy pro státní správu už ve fázi návrhu přebírají a kopírují byrokratické a neefektivní vlastnosti a postupy státní správy jako takové. A jak ta pracuje , popsal už stařík profesor Parkinson, na tom se ani s moderní technikou nic nemění, spíš naopak, ten chaos je ještě větší..
Tedy, jestli bych si dovolil vlastní zkušenost, ona zmíněná použitá funkce vyhledávání s našeptáváním se prostě v tomto objemu dat dostatečně optimalizovat nedá.
Ale jo, metody by se našly. Žádná tak účinná, jako když je implementovaná na straně prohlížeče, ale nulové možnosti to taky nejsou.
Tudíž , v tomto objemu celostátních IS žádná "systémová řešení", ale naopak, povolovat už v návrhu jako naprostou výjimku, u které se velkými písmeny napíše "BUDE způsobovat trvalé problémy a přetížení", a ať se pod to laskavě někdo zodpovědný podepíše, a nese si za to potom osobní zodpovědnost.
Souhlas. Někdo by měl nést odpovědnost i za to, že to nenapsal.
A za druhé, když už tedy, tak se to mohlo poměrně jednoduše předem omezit na co nejmenší lokalitu. Což třeba už jen aby uživatel zadal PSČ, jen tento rozsah adres se načetl, a jen v něm pak toto
To nebude fungovat dobře. PSČ už spousta lidí ani nezná. Já jsem se v posledních patnácti letech stěhoval několikrát a PSČ neznám. Nepotřebuji ho, korespondence mi chodí do práce (zřídka) a úřady datovkou. PSČ má v sobě zakořeněná generace Husákových dětí a starší, protože to byla doba, kdy se to zavádělo a bylo to v životě potřeba. Dnes se lidé čím dál víc vyhýbají České poště, a nikdo jiný PSČ neprožívá.
Souhlasím, že v Praze (a možná i jiných velkých městech) mnoho lidí PSČ nezná a nikdy pořádně neznalo (Praha 4 je pro většinu prostě 140 00).
Ale měl bych do fóra jeden dotaz (možná stupidní, už jsem dlouho mimo obor) - proč vůbec řešit zadávání adres přes našeptávač? Kdysi jsem potřeboval UIR-ADR (zřejmě předchůdce RÚIAN) a k datům byl vzorový vyhledávač v kaskádě kraj - okres - obec - ulice/část obce - číslo popisné/orientační/evidenční. Asi to není sexy, ale nedá se na tom snad nic zkazit.
k datům byl vzorový vyhledávač v kaskádě kraj - okres - obec - ulice/část obce - číslo popisné/orientační/evidenční
Protože územní členění je různé. Kaskáda kraj - okres - obec platila za socialismu. Dnes pro jedno členění kraje využíváte, pro druhé obce s rozšířenou působností. Ulice a číslo orientační je jen orientační název, identifikuje se ale podle katastrálního území a čísla popisného (či evidenčního). PSČ je poštovní členění. Praha je město, okres i kraj - resp. aby to nebylo jednoduché, v určité úrovni to není Praha, ale Hlavní město Praha.
Těch průřezů územního členění najdete mnoho, každý správný. To ale nenásleduje uživatelskou přístupnost. Jeden zná PSČ, druhý ne. U sčítání lidu asi víte, v jakém kraji žijete, ale během mnoha činností to nevíte (když někomu posíláte poštu, proč byste hledal, v jakém kraji to je?). Část obce nevím, jestli se nutně shoduje s katastrálním územím - to by bylo zase důležité pro příslušnost popisného čísla... Někdy někdo zamění popisné a orientační číslo, někdy ve stejném katastrálním území naleznete zaměnitelné páry.
...bla, bla, a právě z těchto důvodů existují našeptávače, které z fragmentů znalostí (i stavu mysli) dohledávají nejpravděpodobnější kandidáty. Je to určitě účelnější, než cepovat lidem do hlavy jedno vybrané územní členění.
PSC hlavne neni a nikdy nebyl unikatni identifikator mista,obce, ci casti obce ani to ten clovek co to vymyslel takto neplanoval.
Je to jen dorucovaci okrsek Ceske posty. Je to jen logisticke id oblasti ktere se obcas i kryje uzemnepravnimi celky/adresou nic vic. Dulezite je zduraznit OBCAS... nebot:
Jedna cast obce muze mit vice PSC.
Jedna ulice muze mit vice PSC.
Vice obci muze mit jedno PSC
Cast obce se muze zmenit a PSC zustava a vice versa.
Dva vchody velkeho panelaku / casti panelaku muzou mit ruzna PSC
PSC se muze menit dle optimalizace dorucovani posty ci pripadne pri prehozeni dorucovaci posty.
PSC dorucovaci posty pod kterou clovek spada muze byt mnohem dale nez neblizsi posta.
Miluju kdyz musim po urednicich opravovat pobyt v obci kdyz jim tam na zaklade PSC padne nevalidni / prvni obec. Na tom je komicke ze dorucovaci sluzby ktere maji velka depa primo v nasi obci maji taktez ten samy problem.
6. 4. 2021, 17:45 editováno autorem komentáře
Takovéhle zadávání adresy je ovšem pro uživatele velmi otravné. Mimo jiné i proto, že se začíná krajem a okresem, které si lidé s adresou nespojují. Programátoři to mají rádi, protože je krásný výběr z kaskády comboboxů, kdy vždy předchozí combobox omezí ten následující. Nicméně dnes už se dbá na UX, takže je nejlepší zadávat adresu přes našeptávač. Uživatel zadá začátek ulice a číslo, už tahle kombinace typicky vede na jednotky záznamů, ze kterých už si uživatel vybere.
Našeptávač se dá udělat i rychlý - nejvíce dotazů je těch krátkých - a protože jsou krátké tak si je můžete předpočítat nebo zacachovat. Navíc nemusí být nijak složitý: dotaz si normalizujete (odháčkujete) a hledáte v indexech prefixů slov. Pro krátké prefixy máte i index kombinace prefixů. Pro dlouhé stačí vyfiltrovat podle toho, který dá nejméně výsledků a zbytek profiltrovat sekvenčně. Dá se to vymyslet samozřejme ještě výrazně lépe, ale tohle je přibližně základ.
ten objem dat je titěrný, několik stovek MB, RÚIAN databázi pro našeptávač adres používáme na spoustě projektů.
Problém je spíše to okamžité zpracování, na to se státní systémy (a jejich dodavatelé) zatím učí, doteď nebyl problém mít časy zpracování i v desítkách sekund, najednou přijde projekt, kde je potřeba mít odezvu pro 99 % dotazů do 50 ms na backendu. Nastavení testů pak odpovídá očekávání a zkušenostem.