Fix non terminating runner in register loop (!450) · Merge requests · GitLab.org / charts / GitLab Runner · GitLab

Clemens Beck requested to merge fix-non-terminating-runner-in-register-loop into main Nov 15, 2023

What does this MR do?

Fix non terminating runner in register loop

Unregistered runners asked to shut down (e.g. via kubectl delete ...)
get stuck in "terminating" because the signal will not be processed
until the register script (with 30 retries) completes.

Fixed by trapping the SIGINT and SIGQUIT signals.

Changelog: fixed

Why was this MR needed?

This fixes a problem often seen in GitLab chart pipelines, where jobs wait a very long time for a runner pod to finish.

What's the best way to test this MR?

Install a stable Helm release where a runner can not register (e.g. with a wrong register token)
Run kubectl delete pod <runner_pod> to delete the runner
Confirm the runner is stuck in "Terminating"
Upgrade to this branch
Run kubectl delete pod <runner_pod> to delete the runner
Confirm the runner terminates

Note: dumb-init's verbose mode (--verbose) might be helpful.

What are the relevant issue numbers?

Edited Nov 16, 2023 by Clemens Beck