Столкнулся сегодня с ошибкой в работе системного Cron. Текст ошибки совершенно не информативный, так что не понятно, в чем конкретно проблема. Начал разбираться самостоятельно, так как по выдаче гугла понял, что причин этой ошибки может быть масса. В итоге нашел решение при проверке /etc/crontab, который использовал для запуска периодических команд.
Началось все с того, что заметил проблемы с очисткой индексов elasticsearch с помощью curator. Он просто ничего не чистил и индексы распухли, заняв почти все место на диске. Пошел в консоль сервера смотреть, в чем проблема. Ручной запуск curator отработал, удалив устаревшие индексы. Стало понятно, что он просто не запускался. В /etc/crontab было правило на регулярный запуск.
Стал смотреть лог cron и нашел там ошибку:
Jun 3 04:04:01 [localhost] crond[811]: (/usr/bin/curator) ERROR (getpwnam() failed)
По тексту совершенно не понятно, в чем проблема. Быстро заглянув в гугл, понял, что однозначного ответа на причину ошибки не видно. Пошел еще раз смотреть crontab и понял, в чем проблема. Так как использовался системный cron, в нем надо указать имя пользователя, от которого будет работать команда. А я это забыл сделать. Должно быть так:
4 4 * * * root /usr/bin/curator --config /etc/curator/config.yml /etc/curator/action.yml
Пользователя root я забыл указать, поэтому и была ошибка исполнения. Не понятно, почему нельзя было нормально обработать эту ошибку и вывести ее в лог. Ведь очевидно же, что пользователя /usr/bin/curator в системных пользователях просто нет.