Vlákno názorů k článku Sčítání.cz: jak to příště zvládnout lépe aneb úvahy o dnešním IT od petrph - Tedy, jestli bych si dovolil vlastní zkušenost, ona...

  • Článek je starý, nové názory již nelze přidávat.
  • 6. 4. 2021 10:32

    petrph

    Tedy, jestli bych si dovolil vlastní zkušenost, ona zmíněná použitá funkce vyhledávání s našeptáváním se prostě v tomto objemu dat dostatečně optimalizovat nedá. Jak ostatně přiznává i autor, když píše že u nich řeší tytéž problémy s objemem o několik řádů nižším.
    Tudíž , v tomto objemu celostátních IS žádná "systémová řešení", ale naopak, povolovat už v návrhu jako naprostou výjimku, u které se velkými písmeny napíše "BUDE způsobovat trvalé problémy a přetížení", a ať se pod to laskavě někdo zodpovědný podepíše, a nese si za to potom osobní zodpovědnost.. A nebo se to nepovolí, a bude se už v návrhu hledat jiné řešení. Přitom, jen tak z hlavy mne napadají hnedle dvě, poměrně efektivní.
    To první, když už se v předešlém kroku ověřuje identita uživatele dle čísla jeho dokladu, tak se taky mohla rovnou stáhnout a nabídnout jeho adresa trvalého bydliště, což by naprosté většině lidí (a kór v době nouzoveho stavu) stačilo.
    A za druhé, když už tedy, tak se to mohlo poměrně jednoduše předem omezit na co nejmenší lokalitu. Což třeba už jen aby uživatel zadal PSČ, jen tento rozsah adres se načetl, a jen v něm pak toto

    Nicméně, v čem je asi přímo systémový problém, je zkrátka nutné si uvědomit, že informační systémy pro státní správu už ve fázi návrhu přebírají a kopírují byrokratické a neefektivní vlastnosti a postupy státní správy jako takové. A jak ta pracuje , popsal už stařík profesor Parkinson, na tom se ani s moderní technikou nic nemění, spíš naopak, ten chaos je ještě větší..

  • 6. 4. 2021 11:01

    Miroslav Šilhavý

    Tedy, jestli bych si dovolil vlastní zkušenost, ona zmíněná použitá funkce vyhledávání s našeptáváním se prostě v tomto objemu dat dostatečně optimalizovat nedá.

    Ale jo, metody by se našly. Žádná tak účinná, jako když je implementovaná na straně prohlížeče, ale nulové možnosti to taky nejsou.

    Tudíž , v tomto objemu celostátních IS žádná "systémová řešení", ale naopak, povolovat už v návrhu jako naprostou výjimku, u které se velkými písmeny napíše "BUDE způsobovat trvalé problémy a přetížení", a ať se pod to laskavě někdo zodpovědný podepíše, a nese si za to potom osobní zodpovědnost.

    Souhlas. Někdo by měl nést odpovědnost i za to, že to nenapsal.

    A za druhé, když už tedy, tak se to mohlo poměrně jednoduše předem omezit na co nejmenší lokalitu. Což třeba už jen aby uživatel zadal PSČ, jen tento rozsah adres se načetl, a jen v něm pak toto

    To nebude fungovat dobře. PSČ už spousta lidí ani nezná. Já jsem se v posledních patnácti letech stěhoval několikrát a PSČ neznám. Nepotřebuji ho, korespondence mi chodí do práce (zřídka) a úřady datovkou. PSČ má v sobě zakořeněná generace Husákových dětí a starší, protože to byla doba, kdy se to zavádělo a bylo to v životě potřeba. Dnes se lidé čím dál víc vyhýbají České poště, a nikdo jiný PSČ neprožívá.

  • 6. 4. 2021 13:16

    bez přezdívky

    Souhlasím, že v Praze (a možná i jiných velkých městech) mnoho lidí PSČ nezná a nikdy pořádně neznalo (Praha 4 je pro většinu prostě 140 00).

    Ale měl bych do fóra jeden dotaz (možná stupidní, už jsem dlouho mimo obor) - proč vůbec řešit zadávání adres přes našeptávač? Kdysi jsem potřeboval UIR-ADR (zřejmě předchůdce RÚIAN) a k datům byl vzorový vyhledávač v kaskádě kraj - okres - obec - ulice/část obce - číslo popisné/orien­tační/evidenční. Asi to není sexy, ale nedá se na tom snad nic zkazit.

  • 6. 4. 2021 13:57

    Miroslav Šilhavý

    k datům byl vzorový vyhledávač v kaskádě kraj - okres - obec - ulice/část obce - číslo popisné/orien­tační/evidenční

    Protože územní členění je různé. Kaskáda kraj - okres - obec platila za socialismu. Dnes pro jedno členění kraje využíváte, pro druhé obce s rozšířenou působností. Ulice a číslo orientační je jen orientační název, identifikuje se ale podle katastrálního území a čísla popisného (či evidenčního). PSČ je poštovní členění. Praha je město, okres i kraj - resp. aby to nebylo jednoduché, v určité úrovni to není Praha, ale Hlavní město Praha.

    Těch průřezů územního členění najdete mnoho, každý správný. To ale nenásleduje uživatelskou přístupnost. Jeden zná PSČ, druhý ne. U sčítání lidu asi víte, v jakém kraji žijete, ale během mnoha činností to nevíte (když někomu posíláte poštu, proč byste hledal, v jakém kraji to je?). Část obce nevím, jestli se nutně shoduje s katastrálním územím - to by bylo zase důležité pro příslušnost popisného čísla... Někdy někdo zamění popisné a orientační číslo, někdy ve stejném katastrálním území naleznete zaměnitelné páry.

    ...bla, bla, a právě z těchto důvodů existují našeptávače, které z fragmentů znalostí (i stavu mysli) dohledávají nejpravděpodobnější kandidáty. Je to určitě účelnější, než cepovat lidem do hlavy jedno vybrané územní členění.

  • 6. 4. 2021 17:44

    Trident

    PSC hlavne neni a nikdy nebyl unikatni identifikator mista,obce, ci casti obce ani to ten clovek co to vymyslel takto neplanoval.

    Je to jen dorucovaci okrsek Ceske posty. Je to jen logisticke id oblasti ktere se obcas i kryje uzemnepravnimi celky/adresou nic vic. Dulezite je zduraznit OBCAS... nebot:

    Jedna cast obce muze mit vice PSC.

    Jedna ulice muze mit vice PSC.

    Vice obci muze mit jedno PSC

    Cast obce se muze zmenit a PSC zustava a vice versa.

    Dva vchody velkeho panelaku / casti panelaku muzou mit ruzna PSC

    PSC se muze menit dle optimalizace dorucovani posty ci pripadne pri prehozeni dorucovaci posty.

    PSC dorucovaci posty pod kterou clovek spada muze byt mnohem dale nez neblizsi posta.

    Miluju kdyz musim po urednicich opravovat pobyt v obci kdyz jim tam na zaklade PSC padne nevalidni / prvni obec. Na tom je komicke ze dorucovaci sluzby ktere maji velka depa primo v nasi obci maji taktez ten samy problem.

    6. 4. 2021, 17:45 editováno autorem komentáře

  • 6. 4. 2021 18:10

    Filip Jirsák
    Stříbrný podporovatel

    Takovéhle zadávání adresy je ovšem pro uživatele velmi otravné. Mimo jiné i proto, že se začíná krajem a okresem, které si lidé s adresou nespojují. Programátoři to mají rádi, protože je krásný výběr z kaskády comboboxů, kdy vždy předchozí combobox omezí ten následující. Nicméně dnes už se dbá na UX, takže je nejlepší zadávat adresu přes našeptávač. Uživatel zadá začátek ulice a číslo, už tahle kombinace typicky vede na jednotky záznamů, ze kterých už si uživatel vybere.

  • 6. 4. 2021 19:43

    ebik

    Našeptávač se dá udělat i rychlý - nejvíce dotazů je těch krátkých - a protože jsou krátké tak si je můžete předpočítat nebo zacachovat. Navíc nemusí být nijak složitý: dotaz si normalizujete (odháčkujete) a hledáte v indexech prefixů slov. Pro krátké prefixy máte i index kombinace prefixů. Pro dlouhé stačí vyfiltrovat podle toho, který dá nejméně výsledků a zbytek profiltrovat sekvenčně. Dá se to vymyslet samozřejme ještě výrazně lépe, ale tohle je přibližně základ.

  • 6. 4. 2021 20:08

    Filip Jirsák
    Stříbrný podporovatel

    U adres nemá smysl něco hledat, dokud nemáte alespoň dvě části – potřebujete název (ulici nebo obec) a číslo. A když už máte ty dvě části, je to dost specifické, takže nedává smysl to předpočítávat nebo kešovat. Naopak pokud z toho názvu máte víc než pár znaků, dostanete rovnou pár výsledků.

  • 6. 4. 2021 11:54

    Uncaught ReferenceError:

    ten objem dat je titěrný, několik stovek MB, RÚIAN databázi pro našeptávač adres používáme na spoustě projektů.

    Problém je spíše to okamžité zpracování, na to se státní systémy (a jejich dodavatelé) zatím učí, doteď nebyl problém mít časy zpracování i v desítkách sekund, najednou přijde projekt, kde je potřeba mít odezvu pro 99 % dotazů do 50 ms na backendu. Nastavení testů pak odpovídá očekávání a zkušenostem.

  • 7. 4. 2021 13:25

    Adam Kalisz
    Stříbrný podporovatel

    A jak podle Vás řeší našeptávání teda Google, Microsoft, Amazon?
    Myslím, že by výkyv v zátěži nějakých 200 000 spojení neznamenal ani pixel na grafu v monitoringu...

    Se zbytkem souhlasím. Lepší UX by bylo nejen u státních aplikací, ale třeba i těch od Googlu, Microsoftu a Amazonu super.