ESP neřeší kryptografický handshake vůbec, ESP můžete použít až ve chvíli, kdy už nějakou sadu algoritmů a klíčů dohodnutou máte. Takže byste nejdřív potřeboval IKE/isakmp nebo nějaký ekvivalent a ve výsledku byste vlastně jen prohodil pořadí těch dvou handshaků (nejdřív kryptografie, pak TCP). Navíc zrovna u IKE IIRC s jedním roundtripem nevystačíte.
Je samozřejmě pravda, že pro konkrétní dvojici klienta a serveru stačí IKE handshake provést jen jednou (za zvolenou dobu), ale pak stejně zůstane TCP handshake, zatímco QUIC pro následné dotazy handshake potřebovat nebude. A hlavně byste narazil na problémy s existující infrastrukturou, přes kterou by to neprošlo. (Navíc i spoustu problémů s IPsecem jako takovým, třeba nutnost definovat nějakou univerzálně povinnou sadu parametrů, aby se opravdu každý byl schopen a ochoten domluvit s každým.)
QUIC není dokonalý, to ani zdaleka. Souhlasil bych i s tvrzením, že místo aby problémy řešil, spíš je obchází. Je to prostě způsob, jak zlepšit komunikaci mezi webovým prohlížečem a serverem při zachování existující infrastruktury a respektování jejích omezení. Místo aby se tvůrci snažili "protocol ossification" řešit, vzali ji jako fakt a pokusili se dosáhnout co nejvíc v daných mantinelech.