V testu SQuAD (Stanford Question Answering Dataset), který zahrnuje více jak 500 článků k přečtení a potom vyžaduje odpovědi na více než 100 tisíc otázek, dosáhly dva algoritmy skóre větší než člověk.
Lidské skóre je 82,304. Algoritmus SLQA+ od společnosti Alibaba iDST NLP dosáhl skóre 82,440 a r-net+ od Microsoft Research Asia 82,650. Alibaba uvádí, že je to poprvé v historii, kdy algoritmus dosáhl většího skóre než člověk.
(zdroj: slashdot)