Názor k článku Sčítání.cz: jak to příště zvládnout lépe aneb úvahy o dnešním IT od ebik - To o čem mluvíte platí až když je...

Článek je starý, nové názory již nelze přidávat.

6. 4. 2021 19:28

ebik

To o čem mluvíte platí až když je napsaná podstatná část fráze (adresy) a výsledková množina je malá. Problém s sql databází je, když posíláte dotazy, které mají velkou výsledkovou množinu a tu ještě necháváte řadit, abyste vypsali nejlepší výsledky na začátku. To jsou dotazy kdy je napsáno málo písmen - těch je z principu hodně, a přitom se hodně opakují. Jednou z variant je mít predpočítaný index pro našeptávání. Tím je to podobné fulltextu (jen se používá jiný index - indexují se prefixy a ne pouze celá slova).
Pokud chcete používat sql databázi tak to asi také jde, ale musíte umět dotazy cachovat, abyste právě těmi krátkými a stejnými dotazy nezatěžovali databázi. Obzvlášť, když jsou zdrojová data neměnná, tak se vyplatí mít velkou cache nebo právě předpočítané indexy.

Jinak zrovna adresy málokdo skloňuje, takže morfologie problém není. unicode issues a podobně se dají řešit normalizací vstupu. Obzvlášť když našeptáváte jen české (a případně slovenské) adresy, a zahraniční necháváte bez našeptání. Takže bohatě stačí vzít adresu jako neutříděnou množinu slov, a našeptávat podle nalezených prefixů v této množině. Lidé často pochopí, že jim stačí z každého slova napsat prvních několik písmen. Horší je to s našeptávačem povolání, protože tam člověk často neví co se od něj očekává - jaký je "oficiální" název jeho povolání. Tam by se naopak hodil fulltext který by matchoval nějak obecněji. (Něco ve stylu "zadam to do googlu a pár prvních odkazů mi prozradí jak se tomu běžně říká".)
- Zobrazit celé vlákno

Zprávičky

Filmová klasika od Národního filmového archivu odteď na YouTube

CESNET otestoval přenos 400 Gb/s na 846 kilometrů pomocí QSFP-DD transceiverů

Valve Steam Link funguje s Raspberry Pi 3 až 5

Názor k článku Sčítání.cz: jak to příště zvládnout lépe aneb úvahy o dnešním IT od ebik - To o čem mluvíte platí až když je...

Zprávičky

Filmová klasika od Národního filmového archivu odteď na YouTube

CESNET otestoval přenos 400 Gb/s na 846 kilometrů pomocí QSFP-DD transceiverů

Valve Steam Link funguje s Raspberry Pi 3 až 5

Dále u nás najdete

Notebook Asus ExpertBook P5: Pracant s výborným displejem

AI systémy, které v Česku zřejmě nikdy neuvidíte

Sledují vás přes HDMI? Útok využívá elektromagnetické záření

Limity pro registraci k DPH v roce 2025

Placené Mapy.cz jsou tady

Spisovatel Karel Poláček zřejmě zemřel později, než se soudilo

Kdy se OSVČ vyhne platbě sociálního pojištění?

„Nemáme na tom zájem“. Opozice brzdí TV poplatky

Stát by měl zavést minimální ceny za jednotku alkoholu

Klienti VZP nemusí nosit plastovou kartu, mohou mít elektronickou

Smart home na vzestupu, české domácnosti jsou čím dál chytřejší

„Pan šéf chtěl ve skutečnosti říct…“ aneb cena pusy na špacíru

Kyberbezpečnost bude nákladná. Proč NÚKIB tvrdí opak?

elementary OS 8 je desktopový operační systém podobný macOS

Ředitel Intelu odstoupil po nejhorším období za 40 let

Poplach kvůli evidenci youtuberů. Co se reálně děje?

Stojíme na rozcestí, kde jde o víc než o procenta emisních cílů

Evropská peněženka digitální identity bude revoluční

O bonusy u VZP můžete papírově žádat už jen týden

Nedostatek železa se projevuje únavou, bledostí a dušností