Odpověď na názor

Odpovídáte na názor ke zprávičce Video z workshopu The One Billion Row Challenge: je PHP rychlejší než Java?.

  • 12. 12. 2024 18:39

    kvr kvr

    Já jsem to jenom rychle přeletěl a neviděl jsem nikde ten Java kód - jestli by byl aspoň srovnatelný s tím, co dělal Php. Co použili za knihovny - třeba Jackson-csv byl podle mých měření asi dvakrát rychlejší než Apache commons-csv . Co se pak děje dál - konverze do nějakých nativních typů, parsování atd.

    Kdysi jsem pracoval na projektu, který konzumoval externí data převážně v CSV. Před cca 10-ti lety vybrali Perl, bo měl nejlepší rychlost s regex (prakticky další krok za načtením CSV). Nedávno jsem dělal porovnání - Perl je stále rychlý na samotné parsování (nativní kód), ale Java je porovnatelná. Regex má Perl rychlejší, ale u Java se můžou lépe cachovat / připravit a navíc pro speciální konverze lze použít lepší přístup. Paralelizace je jednoznačně na straně Java. A ohledně dalších vrstev integrace bude Java už jednoznačná volba. Hlavní pointa je v tom, že doba parsování CSV obecně byla zanedbatelná část problému.

    Co se týče statistik, Jackson-csv zvládal cca 1 M řádků za vteřinu (single thread, laptop 2020).