PDA

View Full Version : [regle] droits check_graph_traffic


agriva
05-19-2005, 11:51 AM
lorsque je j'execute le plugin check_graph_traffic en root tout marche bien par contre lorsque j'utilise l'utilisateur nagios, j'ai des pb de droits sur les repertoires /tmp/traffic et /usr/local/oreon/trafficMap/trafficAverage qui pourtant a les droits 775 et appartient à nagios.
Comment ca se fait?

agriva
05-19-2005, 02:42 PM
ca a tt l'air de ressemler a ce sujet http://www.oreon.org/Forum/viewtopic.php?t=191&highlight=traffic&sid=f9cd235f12b00fa90865801d5fe3ff8b sauf que j'ai supprimé tous les fichiers que j'avais créé avec root en lancant la commande et ca ne marche tjs pas...
j'ai tjs : return code of 13 is out of bound
et lorsque j'execute la cmd sous l'utilisateur nagios
can't open /usr/local/oreon/trafficMap/trafficAverage for writting...
pourtant ll /usr/local/oreon/trafficMap/ retourne :
777 nagios average

julio
05-19-2005, 02:53 PM
bah oui c'est pas /usr/local/oreon/trafficMap/trafficAverage mais /usr/local/oreon/trafficMap/Average ... changes dans le plugins...

agriva
05-19-2005, 03:02 PM
/usr/local/oreon/trafficMap/trafficAverage est le message d'erreur mais le chemin ds le plugin est bien : /usr/local/oreon/trafficMap/average
En fait, y a bioen un pb de droit car loggé en utilisateur nagios je n'arrive pas a creer un fichier ds ce repertoire. Mais je vois pas trop d'ou ca peut venir car le répertoire appartient a nagios et les doits sont 777

agriva
05-19-2005, 03:28 PM
bon ben j'ai trouvé : c'est le répertoire include qui n'avait pas les bons droits... :oops:
Merci qd meme de ton aide :lol:

agriva
05-19-2005, 05:13 PM
par contre, lorsque je fais un rrdtool fetch xx.rrd AVERAGE pour tous mes graph_traffic , j'ai que des nan nan nan....
Pourtant le plugin me retourne :
traffic : 1,48kB/s (0.0%) in, 1,13kB/s (0.0%) out
et les graphes biensur sont vides.
Comment ca se fait?

julio
05-19-2005, 05:38 PM
et rrd ? les droits ?

agriva
05-19-2005, 06:07 PM
t'es vraiment un as :wink:

julio
05-19-2005, 06:11 PM
héhé :lol:

agriva
05-20-2005, 09:07 AM
finalement, g tjs un pb : et c'est tres curieux d'ailleurs : mes bases rrd sont TOUTES raffraichies uniquement à certaines heures (ex : 13h, 19, 1h, 7h) . J'obtiens donc des graphes ou il manque la plus part des données (il n'y a que qlq valeurs pour ces heures, entre j'ai des "nan" ).
Comment est possible?
NB : pourtant j'ai bien la totalité de mes actives checks qui s'effectues dan l'heure selon performance info

templuche
05-20-2005, 10:33 AM
Bonjour,

N'est ce pas ta machine qui est surchargée? Est ce que tous les checks se font à temps? Regarde la latence entre les checks prévus et les heures auxquelles s'éxécutent les checks... Regarde aussi la load de la machine.

Cordialement

agriva
05-20-2005, 11:58 AM
bon ben oui apparement c'est ca : j'avais trop chargé la mule.
Pour avr une idée mon serveur :
intel xeon cpu 3,06GHz
2 cartes réseaux
1 G de ram
et la limite est visiblement autour de 43 hotes supervisés et 285 services dont 131 graphés. A savoir que j'effectuent environ 100% des services actifs en 10min en parallélisant au max 5 tests et entrelassant les services vers différentes machines.
Au dela, c'est pas terrible : les graphes ne se génèrent plus correctement.
Merci de ton aide :D

templuche
05-20-2005, 12:35 PM
Bonjour,

Cela me parait peu 43 hotes et 285 services avec un xeon et 1G de RAM... Nagios est le seul service sur cette machine (à part les services liés à Nagios)? Tu as d'autres sites hébergés? Tu utilises le serveur de BdD pour autre chose?

Cordialement.

totojov
05-20-2005, 12:49 PM
Petite question que je met dans ce topic pour évoiter d'en créer un autre.

Pour les check_graph_traffic, la légende, c'est du Bytes ou du bit ???

Merci

agriva
05-20-2005, 01:39 PM
des octets
Et non je n'heberge rien d'autre sur mon serveur : il est dédié à Nagios seulement

totojov
05-20-2005, 01:46 PM
OK merci pour la réponse!

y a t-il moyen de mettre des bits à la place?

templuche
05-20-2005, 02:03 PM
Re,

en parallélisant au max 5 tests
Ha... Dis moi, est ce que la charge de ta machine était importante (supérieure à 7/8 )? Essaye d'augmenter la valeur de ce paramètre, redémarre Nagios, laisse le tournet 1H et vérifie que:
- tes checks sont effectués sans une latence trop importante (5 ou 6 secondes)
- la load de ta machine n'est pas trop importante (le mieux étant de la grapher bien entendu)

Cordialement.

agriva
05-20-2005, 02:19 PM
La charge de ma machine etait importante oui et le nb parallélisé de services n'a pas changé entre tps. Maintenant ca va mieux.
J'ai qd meme Physical memory qui est a 98% et pour le CPU c'est environ 3% la + part du tps avec des pointes a plus de 40%.
l'embétant c'est que qd j'augmentes ce parametre, j'obtiens parfois des retours de plugins critiques.
Quant aux latences, ca va te faire marrer mais j'ai une latence moyenne de 222s !!!
En fait, j'ai paramétré pour que chaque service soit testé ttes les 5 min mais comme il peut y en avr que 5 a la fois (parallélisés) et que le tps moyen de test est de 0,2s , je peux en avoir en 5 min uniquement .... 1500... euh, y a qlqchose qui m'échape...

templuche
05-20-2005, 02:27 PM
Re,

J'ai qd meme Physical memory qui est a 98% et pour le CPU c'est environ 3% la + part du tps avec des pointes a plus de 40%.
Alors, pour la mémoire physique, l'important est de ne pas swapper. Par contre, pour la load tu me fais peur: est ce que tu parles réellement de 3 et de 40% d'utilisation du CPU ou tu parles d'une load machine de 3 à 40? Parce que ce n'est pas du tout la même chose! Dans le 1er cas ce n'est pas grave. Dans le deuxième ça l'est beaucoup plus... Est ce que tu n'aurais pas plusieurs Nagios démarrés en même temps? Pour le savoir fait ce test:
1) tu arrêtes Nagios normalement
2) tu attends 1 minute ou 2
3) tu fais un ps et tu regardes si il y a encore des process Nagios

Si oui, tu peux tous les killer à la main et redémarrer Nagios. Tu auras peut être à effacer le fichier nagios/var/rw/nagios.cmd avant de le redémarrer. Sinon, c'est qu'il y a un problème quelque part...

Tiens nous au courant

agriva
05-20-2005, 02:42 PM
je parle des valeurs obtenues dans la fenetre system monitor de RH9 (CPU used). En arrétant Nagios, la charge du CPU est en moyenne egale a 2,5% et ne depasse jamais 10%.
J'ai bien vérifié qu'un seul nagios tournait.

agriva
05-27-2005, 02:09 PM
Par contre, je viens de m'apercevoir de qlq chose : je n'ai malheureusement plus rien ds les courbes de la rubrique Reporting> trends (idem dans alert histogram) et dans Availability, j'ai quasiment tous les pourcentages qui sont à 0% (sauf time undetermined qui est a 100%).
Poutant tous mes services fonctionnent normalement.
Avez vous une idée d'ou ca pourrait venir? Est ce lié au pb de surcharge de mon serveur?
J'ai également modifié pas mal d'options ces derniers tps (me demandez pas koi exactement ... je ne sais plus trop), ca pourrait venir de là?
est ce qu'il y a un param qui empeche la creation de graphes sous nagios?