Vlákno názorů k článku Knihovna Pandas: použití metody groupby, naformátování a export tabulek pro tisk od atarist - Předpokládám že jako v R bude i v...

6. 1. 2021 18:42

atarist

Předpokládám že jako v R bude i v Pandas groupBy efektivnější pro faktory (nebo pro category v pandas) že? Jedná se nám o dost obrovské soubory, máme přibližně 1 nový záznam za sekundu a data pro cca celý rok, takže tam by větší efektivita měla hrát roli.

(zatím je to možné řešit seskupením v DB, ale to nebude pracovat až bude zdrojem dat kafka - pokud to neumí kstream).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 1. 2021 10:38

Pavel Tišnovský

Zlatý podporovatel

Chcete do Pandas tahat přímo data z Kafka témat? Tak asi je to použitelné - jaký je use case?

Zprávičky