Nemohl jsem si nevzpomenout na jeden článek: http://scribblethink.org/Computer/javaCbenchmark.html
Pravda, je sice trošku starší, ale odpovídá na určité mýty ohledně výkonu, GC a JIT. Zvlášť doporučuji si přečíst část "Garbage collection- is it worse...or better?" (včetně "The cost of missing the cache").
Myslím, že sice konkrétní čísla a poměry z toho článku budou dnes již značně outdated, nicméně obecné principy se až tolik nezměnily. Jedna z věcí, které už (díky escape analysis) nebudou aktuální, je "For example, programs written with the thread-safe Vector class are necessarily slower (on a single processor at least) than those written with the equivalent thread-unsafe ArrayList class.". EScape analysis totiž dovede odstranit synchronizaci, není-li potřeba.