PDA

View Full Version : monitoring HS lors de traitement sur le serveur


math
04-28-2006, 03:02 PM
Bonjour,


j'explique très rapidement mon pblm.
je monitore une 60 aine de serveurs de toutes sortes.
sur certains de ces serveurs ont lieu des alimentations/traitements de base de donnée.
lors de ces alims, la machine consomme énormément de CPU et d'IO disque, ce qui fait que je ne peux plus monitorer le serveurs.
Resultat -->j'ai 30 tests qui me sont remontés en alertes systématiquement et pollue ma boite mails.

Je ne peux pas planifier les dates de traitements.

questions :
1-est il possible de forcer une sorte de priorité pour autoriser tout de meme le monitoring (SNMP, NRPE ...). je sais ca me parait dur.
2-comment faire pour ne pas se faire polluer par la boite mail. cad recevoir une seule et unique notification d'alerte. j'ai pourtant mis le Notification_interval à 0 * 60 secondes pour le recevoir qu'une seule fois


je joins un graph qui montre clairement la période de traitement
toute aide est la bienvenue.

julio
04-28-2006, 03:29 PM
c'est quand meme pas normal ton cpu ne tourne pas si fort que ca. J'ai vu des serveurs avec un cpu a 100% toute la journée et aucun pb pour monitorer les bases oracle etc etc.

c'est des machines a bout de souffle ou koi ?

math
04-28-2006, 03:31 PM
bah je sais bien que c'est bizarre.
ce sont pourtt des machines toutes neuves quadri-pro et tt le bazarre :<

pour info l'OS est un WIN2k pour ce serveur la

math
04-28-2006, 03:40 PM
qestion : est ce que le fait d'augmenter le timeout et le nb d'essai arrangerait les choses?

je pense que c'est sauté pour mieux reculé et je suis meme pas sur que ca va arranger les choses

math
04-28-2006, 03:51 PM
pour approfondir la question, j ai tres svt ce message la :
Connection refused by host ou No data was recieved from host! (mais uniquement pdt les traitement, pas de FW entre les deux serveurs ou je ne sais quoi qui bloquerait le réseaux)

julio
04-28-2006, 04:03 PM
augmente le timeout voir, mais normalement ca doit passer sans trop de pb... le reseau n'est pas fortement utilisé aussi pendant ce temps de traitement ?

math
04-28-2006, 04:07 PM
nan c'est uniquement un traitement en local
la preuve en image