Mozilla.cz začala na voice.mozilla.cz sbírat české nahrávky pro projekt Common Voice. Ten má za cíl vybudovat otevřený hlasový dataset, na kterém bude možné trénovat systémy pro převod hlasu na text.
Zapojit se můžete buď čtením a nahráváním textů, nebo schvalováním již nahraných textů. K tomu není ani třeba mikrofon, stačí sluchátka. Pokud se zapojíte nahráváním, berte v potaz, že ruch v okolí nevadí, naopak je žádoucí vzhledem k tomu, že při převodu řeči na text se právě ruchy v pozadí velmi často vyskytují.
Anglická varianta už má stovky nahraných hodin a venku už je i první verze datasetu. Ta česká je teprve v plenkách. V budoucnu se přesune z české domény na oficiální voice.mozilla.org, stejně jako další jazyky.