У DeepMind вышла в препринте любопытная, но скорее философская чем математическая статья "Reward is Enough", по мотивам которой в VB опубликовали развернутый обзор и пояснение - очень рекомендую почитать. Общая идея статьи отражена в заголовке: DeepMind утверджают что существующей уже технологии обучения с подкреплением достаточно для того, чтобы создать настоящий ИИ.

Я безусловно не такой специалист, как ребята из дипмайнда, но думаю что это довольно наивное предславление о разуме. Даже старик Фрейд, который если упрощать все пытался свести к инстинктам, не согласился бы https://venturebeat.com/2021/06/09/deepmind-says-reinforcement-learning-is-enough-to-reach-general-ai/
The Benefits of Using a YT Audio to MP3 Converter