25
Jan
3

Monitorare i server HP Proliant con Nagios

check_hpasm1

Sapere se l’hardware di un server funziona correttamente e soprattutto conoscere lo stato dell’array è fondamentale per non rischiare brutte sorprese.

Purtroppo il sistema di monitoraggio Nagios non è provvisto della funzione di check dello stato dell’hardware compatibile con i vari prodotti disponibili sul mercato. Fortunatamente presso il sito http://exchange.nagios.org sono disponibili diversi addon, plugin e altro che permettono di arricchire le funzioni di Nagios e quindi di monitorare diversi brand di hardware.

Utilizzando principalmente server HP Proliant, l’esigenza è di poter monitorare lo stato globale dei server e soprattutto se l’array è integro o in stato di failure… è vero che tendenzialmente è saggio configurare i server con sistemi RAID 5 ma se non siamo al corrente che un disco dell’array è danneggiato e trascuriamo il tutto… provate ad immaginare cosa succederebbe se anche un secondo disco decidesse di passare a miglior vita?

Per poter effettuare il monitoraggio dello stato dell’hardware dei server HP Proliant tramite Nagios, c’è un ottimo plugin che serve proprio a questo scopo: si chiama check_hpasm ed è reperibile presso il sito http://labs.consol.de. Per poter utilizzare questo plugin è indispensabile che sui server da monitorare sia attivo l’agent SNMP.

check_hpasm2

1. INSTALLAZIONE
Per procedere alla sua installazione, dobbiamo ovviamente scaricare il software per il nostro sistema di monitoraggio, Nagios appunto.

# wget http://labs.consol.de/wp-content/uploads/2010/01/check_hpasm-4.1.1.tar.gz
# tar –xzvf check_hpasm-4.1.1.tar.gz

Una volta scompattato l’archivio, impostiamo i parametri per l’installazione su CentOS:

# cd check_hpasm-4.1.1
# ./configure –prefix=/usr/lib/nagios/plugins

check_hpasm3

Procediamo quindi con l’effettiva installazione tramite il comando make:

# make

check_hpasm4

# make install

Su CentOS il plugin viene installato per default nella directory /usr/lib/nagios/plugins/libexec ma per un corretto funzionamento bisogna spostare il plugin nella directory  /usr/lib/nagios/plugins dove risiedono tutti i plugin di Nagios.

Eseguito il comando make, nella directory check_hpasm-4.1.1/plugins-scripts viene creato il file check_hpasm che è appunto il nostro plugin compilato.

check_hpasm5

Per terminare l’installazione è sufficiente copiare questo file nella directory plugins di Nagios:

# cp check_hpasm-4.1.1/plugins-scripts/check_hpasm /usr/lib/nagios/plugins/

2. CONFIGURAZIONE
Terminata l’installazione, va definito il comando check_hpasm che Nagios utilizzerà per effettuare il monitoraggio del server editando il file command.cfg:

# vi /etc/nagios/objects/commands.cfg

define command {
command_name check_hpasm
command_line $USER1$/check_hpasm -H $HOSTADDRESS$ -C $ARG1$ -v –ignore-fan-redundancy*
}

* Il parametro –ignore-fan-redundancy va specificato solo se il server non è dotato di fan ridondanti onde evitare continui warning.

Se tutto funziona correttamente, Nagios riporterà come status dell’hardware del nostro server il seguente messaggio:

check_hpasm6

Adesso l’hardware del nostro server è monitorato. Al verificarsi di un qualsiasi problema il sistema genererà un alert.

firma


Autore: P@olo  Sono un sistemista informatico con ormai diversi anni di esperienza in ambito aziendale dove il mio metodo di lavoro è concepire ed implementare soluzioni IT utili (non datelo mai per scontato!) che rispondono alle reali esigenze lavorative.


Enjoyed reading this post?
Subscribe to the RSS feed and have all new posts delivered straight to you.
3 Comments:
  1. Gerhard LausserNo Gravatar 5 Mar, 2010

    You showed an installation example on CentOS, where the plugins reside in /usr/lib/nagios/plugins.
    You don’t need the “make install” step because it will create a libexec subdirectory which you probably will delete later.
    After “make” has finished, simply copy plugins-scripts/check_hpasm to /usr/lib/nagios/plugins.

  2. P@oloNo Gravatar 5 Mar, 2010

    Thanks for the hint.
    I’ve amended the post.

  3. maxNo Gravatar 3 Sep, 2010

    Ciao, innanzitutto complimenti per l’articolo, un esposizione molto chiara.
    Ho eseguito la configurazione menzionata; tuttavia quando si lancia il comando per effettuare il controllo dell’hardware del server HP si riscontra

    CRITICAL – hpasmd needs to be restarted System: ‘unknown’, S/N: ‘unknown’, ROM: ‘unknown’.
    Non capsico come mai accade ciò…ho cercato molto in rete ma non riesco a trovare la soluzione

    Se hai idee ti ringrazio.

Post your comment