В последние несколько дней навожу порядки на “большом” домашнем сервере:
- Обновил domU с сервером статистики. На самом деле – раскатал новую систему и мигрировал данные, так как пришлось бы последовательно апгрейдить Debian 9 -> Debian 13. Реально, но в чистовой установке будет меньше мусора, да и Nagios за это время сменил мажорную версию и простого апдейта не получилось бы.
- После чего подобавлял кое-где munin-node и мониторинг хостов в Nagios’е: наконец-то убрал заглушку “return-ok” в мониторинге хоста и теперь карта красиво подсвечивает неработающие “ветки”, а также получаю меньше писем, если отвалился корневой узел.
Глаз зацепился в том числе и за подсвеченный красным раздел sensors в munin’е. Честно говоря, никогда не обращал внимания на ALERT’ы в выводе sensors, что-то показывает – и ладно.
Во-первых, поисключал явно нерабочее. Помогла эта ссылка. Дальше – больше: в ряде сенсоров (прежде всего – напряжения) были не прописаны минимальные и максимальные значения (либо было что-то неадекватное) – например, даже при корректном значении измерителя линии 3.3В в минимальных и максимальных значениях стоял ноль и датчик выдавал ALERT. В итоге чуть расширил свой кастомный конфиг для lm-sensors – /etc/sensors.d/local.conf. В целом, синтаксис оказался достаточно простым: описываем секцию, обозначая чип или маской, или точным именем, дальше описываем то, что хотим сделать с опциями отдельных сенсоров, которые можно посмотреть по sensors -u.
# https://superuser.com/questions/1828051/how-to-exclude-sensors-from-output
chip "nct6792-*"
ignore temp1
ignore temp4
ignore temp5
ignore temp6
ignore temp8
ignore temp9
ignore temp10
ignore in1
ignore in4
ignore in5
ignore in14
set temp3_max 75
set temp3_max_hyst 70
# +/- 5% для линий, которые на 3,3В
set in2_min 3.3 * 0.95
set in2_max 3.3 * 1.05
set in3_min 3.3 * 0.95
set in3_max 3.3 * 1.05
set in7_min 3.3 * 0.95
set in7_max 3.3 * 1.05
set in8_min 3.3 * 0.95
set in8_max 3.3 * 1.05
# Что-то непонятное. Задал диапазон или 0-1В, или 1-2В.
set in9_min 1
set in9_max 2
set in12_min 1
set in12_max 2
set in13_min 1
set in13_max 2
set in10_min 0
set in10_max 1
set in11_min 0
set in11_max 1
set in6_min 0
set in6_max 1
# Пара SSD. Адрес может смениться, если менять слоты
chip "nvme-pci-0b00"
ignore temp3
set temp1_min 0
chip "nvme-pci-0c00"
set temp1_min 0
set temp2_max 100
set temp2_min 0
set temp3_max 100
set temp3_min 0
В тех сенсорах, в которых что-то показывалось, но непонятно, к чему оно относится (если они вообще подключены на плате) – просто задал широкий диапазон значений, чтобы не ругалось.
Еще одна полезная команда – sensors -s от рута, чтобы применить изменения в конфиге.