Podle mě je vyhledávání v emailech šílená práce, protože existuje příliš mnoho formátů, v jakém je posílán (html vs txt, kódování).
Pro své potřeby všechny maily při obdržení převádím do textu, přílohy ukládám zvlášť, a na fulltextové vyhledávání používám standardní nástroje (grep, případně <regex.h>).
Ano, novy dovecot (2.4) bude mit fts flatcurve primo v sobe. Pro 2.3 je ale mozna pouzit flatcurve taky, jen si to clovek musi nastavit rucne. Na webu maji navod, jak na to. Vychazel jsem z jejich webu.
Musite pocitat s tim, ze indexy sezerou nejakou kapacitu disku. Mam asi 600GB posty a indexy berou nizsi desitky GB. Cekal jsem vetsi zatez v dobe indexace, ale nijak vyrazne se to neprojevilo.
Ve schrankach jsou i desitky tisic emailu, stovky tisic asi nemam.
Funguje to moc pekne, uzivatele si pochvaluji.
Inu, podle dokumentace Thunderbirdu to vypadá, že ten chce vždy mermomocí všechno stáhnout a fulltext dělat u sebe, takže ať už server umí cokoliv, tak si moc nepomůžete.
Dovecot například umí použít hned několik full text enginů. Takže pokud byste použil klienta, co posílá vyhledávání přes IMAP tak by to asi byl vcelku fofr. Možná něco jako Trojitá?