Фейсбук 3 часа назад выложил довольно интересную работу и набор кода, которые обещают нам небольшой прорывчик в области распознавания речи - wav2vec-U это система, позволяющая распознавать звуки минуя процесс обучения на размеченных данных. Идея крутая и дает прямо большой рост качества распознавания, особенно для редких языков (там в работе проверяют на киргизском и татарском).
Очень любопытно, есть с чем поковыряться на выходных
https://github.com/pytorch/fairseq/tree/master/examples/wav2vec/unsupervised