Prosim, rad by som sa opytal na vas nazor na riesenie nasledovneho problemu:
Tabulka, cca 2 mil zaznamov, jeden z nich textovy, dlzka cca 30 az 40 znakov obsahujuca slova napr. ferko mrkvicka v katedrale.
Problem: v tomto stlpci potrebujem efektivne vyhladavat zaznamy obsahujuce zadane slova. Priklad:
Vyhladavam ferko mrkvicka kat - zaujimaju ma zaznamy obsahujuce ferko, mrkvicka a zaroven vsetky slova ktore zacinaju na kat tj. A napriklad yssie uvedena katedrala ale a katedra atd.
V klasicke databaze sa to da riesit via lika. Mna napadlo pouzit klasicku databazu, stlpec tokenizovat tj. Vytvorit slovnik vsetkych moznych slov a nasledne v relacii 1 ku N priradit pre jednotlive zaznamy idcka do slovnika tj. Pre priklad vyssie idcka vsetkych styroch slov. Nasledne vyhladavat v slovniku tj. Zistit idcka, cezmidcka zistit idcka zaznamov a tak sa dopracovatk vysledku. Avsak mozno existuje specializvana databaza o ktorej neviem ;)
Za kazdy napad budem vdacny ;)