При проектировании высоконагруженной системы нужно знать ее лимиты:
– сколько параллельных запросов может обработать микросервис допустимой latency?
– как много запросов может выдержать база данных, которую мы используем?
– как долго нужно ждать Push сообщения?
– как долго длится распределена транзакция и между какими сервисами происходит наибольшее задержка?
– И таких вопросов у нас было множество. В процессе тестирования мы использовали разный tooling: JMeter, ab, Gatling, но все они оказывали очень лимитированы возможности. Нам не удавалось нормально покрыть push flow (WebSockets / SSE), различные базы данных, было сложно имитировать различный workloads (update / read).

В этом видео Антон Молдован расскажет про свой опыт применения load testing.

https://www.youtube.com/watch?v=deL1TdguMB8
How to Easily Find YouTube Videos: A Comprehensive Guide