Ладно, вот вам звуковая дорожка, где на первый взгляд идёт одно и то же, но, одно предложение записано живым человеком, а другое сгенерировано с помощью Text-to-Speech в Azure Cognitive Services Speech Services. Определите, где живой человек? В первой половине или во второй?