... | ... | @@ -72,33 +72,38 @@ Note que nessa implementação o endpoint congela a execução na chamada do mé |
|
|
1. O volume médio de acessos simultâneos esperado.
|
|
|
2. O tempo de resposta que será aceitável quando for próximo de três segundos.
|
|
|
|
|
|
A partir do resultado de cada cenário, iremos calibrar os fatores como o número de instâncias da api, consumo de RAM e CPU para que o tempo de resposta se mantenha próximo ao experado.
|
|
|
A partir do resultado de cada cenário, iremos calibrar os fatores como o número de instâncias da api, consumo de RAM e CPU para que o tempo de resposta se mantenha próximo ao esperado. Para análise dos cenários iremos utilizar gráficos de percentil, que irão nos mostrar qual a porcentagem de respostas que estarão abaixo de três segundos.
|
|
|
|
|
|
## Cenario 1
|
|
|
|
|
|
| nº de acessos simultâneos | nº de instâncias | nº de mensagens enviadas | RAM (mb) por instância |
|
|
|
|
|
|
| nº de usuários virtuais | nº de instâncias | nº de mensagens por usuários | RAM (mb) por instância |
|
|
|
| ------ | ------ | ------ | ------ |
|
|
|
| 1 | 1 | 4 | 300 |
|
|
|
|
|
|
![teste_1_jmeter](uploads/e39712b5361c1766818b8c5d2369a841/teste_1_jmeter.png)
|
|
|
![flotResponseTimesPercentiles__1_](uploads/0618f37e1e756f1c745241ffa4c56513/flotResponseTimesPercentiles__1_.png)
|
|
|
|
|
|
No primeiro cenário simulamos um usuário enviando quatro mensagens para o Rasa. O relatório do JMeter indica que todas as mensagens tiveram um tempo de resposta entre 0.5 segundos e 1.5 segundos. Nesse cenário temos apenas uma instância do rasa sendo exeuctada. O recurso de memória utilizado não foi customizado sendo o valor padrão definido pelo kubernetes.
|
|
|
No primeiro cenário simulamos um usuário enviando quatro mensagens para o Rasa. O relatório do JMeter indica que das quatro mensagens enviadas, três tiveram um tempo de resposta entre abaixo de um segundo e a quarta teve tempo de resposta de 1.8 segundos.
|
|
|
|
|
|
| porcentagem de respostas abaixo de 3s | porcentagem de respostas acima de 3s |
|
|
|
| ------ | ------ |
|
|
|
| 100% | 0% |
|
|
|
|
|
|
## Cenario 2
|
|
|
|
|
|
| nº de acessos simultâneos | nº de instâncias | nº de mensagens enviadas | RAM (mb) por instância |
|
|
|
| nº de usuários virtuais | nº de instâncias | nº de mensagens por usuários | RAM (mb) por instância |
|
|
|
| ------ | ------ | ------ | ------ |
|
|
|
| 10 | 2 | 4 | 300 |
|
|
|
| 10 | 1 | 4 | 300 |
|
|
|
|
|
|
Nesse cenário teremos dez usuários enviando quatro mensagens cada. Manteremos o número de instâncias do rasa e a mesma quantidade de RAM e CPU. Utilizaremos um gráfico de percentil, para avaliar quantas requisições ficaram abaixo de três segundos, e quantas ficaram acima. O gráfico a seguir demonstra esses valores.
|
|
|
Nesse cenário teremos dez usuários enviando quatro mensagens cada. Manteremos o número de instâncias do rasa e a mesma quantidade de RAM e CPU.
|
|
|
|
|
|
![flotResponseTimesPercentiles](uploads/864967aa26f74f59184cf44f7e78e283/flotResponseTimesPercentiles.png)
|
|
|
![flotResponseTimesPercentiles__2_](uploads/172749f160a6b0b8afc4faaee44ca321/flotResponseTimesPercentiles__2_.png)
|
|
|
|
|
|
| porcentagem de respostas abaixo de 3s | porcentagem de respostas acima de 3s |
|
|
|
| ------ | ------ |
|
|
|
| 50% | 50% |
|
|
|
| 5% | 95% |
|
|
|
|
|
|
|
|
|
## Cenario 3
|
|
|
|
|
|
|