Sapere se l’hardware di un server funziona correttamente e soprattutto conoscere lo stato dell’array è fondamentale per non rischiare brutte sorprese.
Purtroppo il sistema di monitoraggio Nagios non è provvisto della funzione di check dello stato dell’hardware compatibile con i vari prodotti disponibili sul mercato. Fortunatamente presso il sito http://exchange.nagios.org sono disponibili diversi addon, plugin e altro che permettono di arricchire le funzioni di Nagios e quindi di monitorare diversi brand di hardware.
Utilizzando principalmente server HP Proliant, l’esigenza è di poter monitorare lo stato globale dei server e soprattutto se l’array è integro o in stato di failure… è vero che tendenzialmente è saggio configurare i server con sistemi RAID 5 ma se non siamo al corrente che un disco dell’array è danneggiato e trascuriamo il tutto… provate ad immaginare cosa succederebbe se anche un secondo disco decidesse di passare a miglior vita?
Per poter effettuare il monitoraggio dello stato dell’hardware dei server HP Proliant tramite Nagios, c’è un ottimo plugin che serve proprio a questo scopo: si chiama check_hpasm ed è reperibile presso il sito http://labs.consol.de. Per poter utilizzare questo plugin è indispensabile che sui server da monitorare sia attivo l’agent SNMP.
Installazione
Per procedere alla sua installazione, dobbiamo ovviamente scaricare il software per il nostro sistema di monitoraggio, Nagios appunto.
# wget http://labs.consol.de/wp-content/uploads/2010/01/check_hpasm-4.1.1.tar.gz
# tar –xzvf check_hpasm-4.1.1.tar.gz
Una volta scompattato l’archivio, impostiamo i parametri per l’installazione su CentOS:
# cd check_hpasm-4.1.1
# ./configure --prefix=/usr/lib/nagios/plugins
Procediamo quindi con l’effettiva installazione tramite il comando make:
# make
# make install
Su CentOS il plugin viene installato per default nella directory /usr/lib/nagios/plugins/libexec ma per un corretto funzionamento bisogna spostare il plugin nella directory /usr/lib/nagios/plugins dove risiedono tutti i plugin di Nagios.
Eseguito il comando make, nella directory check_hpasm-4.1.1/plugins-scripts viene creato il file check_hpasm che è appunto il nostro plugin compilato.
Per terminare l’installazione è sufficiente copiare questo file nella directory plugins di Nagios:
# cp check_hpasm-4.1.1/plugins-scripts/check_hpasm /usr/lib/nagios/plugins/
Configurazione
Terminata l’installazione, va definito il comando check_hpasm che Nagios utilizzerà per effettuare il monitoraggio del server editando il file command.cfg:
# vi /etc/nagios/objects/commands.cfg
define command { command_name check_hpasm command_line $USER1$/check_hpasm -H $HOSTADDRESS$ -C $ARG1$ -v --ignore-fan-redundancy* }
* Il parametro --ignore-fan-redundancy va specificato solo se il server non è dotato di fan ridondanti onde evitare continui warning.
Se tutto funziona correttamente, Nagios riporterà come status dell’hardware del nostro server il seguente messaggio:
Adesso l’hardware del nostro server è monitorato. Al verificarsi di un qualsiasi problema il sistema genererà un alert.
You showed an installation example on CentOS, where the plugins reside in /usr/lib/nagios/plugins.
You don't need the "make install" step because it will create a libexec subdirectory which you probably will delete later.
After "make" has finished, simply copy plugins-scripts/check_hpasm to /usr/lib/nagios/plugins.
Thanks for the hint.
I've amended the post.
Ciao, innanzitutto complimenti per l'articolo, un esposizione molto chiara.
Ho eseguito la configurazione menzionata; tuttavia quando si lancia il comando per effettuare il controllo dell'hardware del server HP si riscontra
CRITICAL - hpasmd needs to be restarted System: 'unknown', S/N: 'unknown', ROM: 'unknown'.
Non capsico come mai accade ciò...ho cercato molto in rete ma non riesco a trovare la soluzione
Se hai idee ti ringrazio.
Ciao,
mi associo anche io a MAX, stesso problema.
Grazie
Io ho effettuato l'installazione con la versione check_hpasm-3.5. E' stata rilasciata una versione successiva che non ho testato. Avendo virtualizzato tutti i server, non sono al corrente se la nuova versione causi problemi o meno.
Quale versione di check_hpasm utilizzi?