В последние несколько дней навожу порядки на “большом” домашнем сервере:
- Обновил domU с сервером статистики. На самом деле – раскатал новую систему и мигрировал данные, так как пришлось бы последовательно апгрейдить Debian 9 -> Debian 13. Реально, но в чистовой установке будет меньше мусора, да и Nagios за это время сменил мажорную версию и простого апдейта не получилось бы.
- После чего подобавлял кое-где munin-node и мониторинг хостов в Nagios’е: наконец-то убрал заглушку “return-ok” в мониторинге хоста и теперь карта красиво подсвечивает неработающие “ветки”, а также получаю меньше писем, если отвалился корневой узел.
Глаз зацепился в том числе и за подсвеченный красным раздел sensors в munin’е. Честно говоря, никогда не обращал внимания на ALERT’ы в выводе sensors, что-то показывает – и ладно.
Во-первых, поисключал явно нерабочее. Помогла эта ссылка. Дальше – больше: в ряде сенсоров (прежде всего – напряжения) были не прописаны минимальные и максимальные значения (либо было что-то неадекватное) – например, даже при корректном значении измерителя линии 3.3В в минимальных и максимальных значениях стоял ноль и датчик выдавал ALERT. В итоге чуть расширил свой кастомный конфиг для lm-sensors – /etc/sensors.d/local.conf
. В целом, синтаксис оказался достаточно простым: описываем секцию, обозначая чип или маской, или точным именем, дальше описываем то, что хотим сделать с опциями отдельных сенсоров, которые можно посмотреть по sensors -u
.
# https://superuser.com/questions/1828051/how-to-exclude-sensors-from-output chip "nct6792-*" ignore temp1 ignore temp4 ignore temp5 ignore temp6 ignore temp8 ignore temp9 ignore temp10 ignore in1 ignore in4 ignore in5 ignore in14 set temp3_max 75 set temp3_max_hyst 70 # +/- 5% для линий, которые на 3,3В set in2_min 3.3 * 0.95 set in2_max 3.3 * 1.05 set in3_min 3.3 * 0.95 set in3_max 3.3 * 1.05 set in7_min 3.3 * 0.95 set in7_max 3.3 * 1.05 set in8_min 3.3 * 0.95 set in8_max 3.3 * 1.05 # Что-то непонятное. Задал диапазон или 0-1В, или 1-2В. set in9_min 1 set in9_max 2 set in12_min 1 set in12_max 2 set in13_min 1 set in13_max 2 set in10_min 0 set in10_max 1 set in11_min 0 set in11_max 1 set in6_min 0 set in6_max 1 # Пара SSD. Адрес может смениться, если менять слоты chip "nvme-pci-0b00" ignore temp3 set temp1_min 0 chip "nvme-pci-0c00" set temp1_min 0 set temp2_max 100 set temp2_min 0 set temp3_max 100 set temp3_min 0
В тех сенсорах, в которых что-то показывалось, но непонятно, к чему оно относится (если они вообще подключены на плате) – просто задал широкий диапазон значений, чтобы не ругалось.
Еще одна полезная команда – sensors -s
от рута, чтобы применить изменения в конфиге.