View Full Version : [REGLE]Lenteur des checks !!!!!
waltergin
05-31-2006, 09:48 PM
Bonjour tout le monde, J'ai du rajouter un nombre considerable de switchs et de routeurs, juste pour verifier s'ils sont UP ou DOWN.
J'ai pour le moment 232 hotes et 417 services. Des que je redemarre Nagios-Oreon attention le premier check se fait mais avant d'arriver au dernier je dois attendre LONG TIME.
Je fais le test en meme tps que le post et la j'en suis a un peu plus de la moitié des checks effectués et il s'est passé pas loin de 30 min :shock:
De plus j'ai par exemple un warning et y doit rechecker dans la minute suivante mais du coup il le fait pas !!!
J'ai besoin d'avis extérieurs. Merci d'avance
inconnuflo
05-31-2006, 10:13 PM
essaie dans un premier temps de mettre en place l'ordonnecement ainsi tu n'aura plus toutes les requetes ki vont partir simultenement mais on fur et à mesure.
fais un ordonnement du coeur vers les extremites :wink:
waltergin
05-31-2006, 10:20 PM
Oki merci je vais mettre ca en place voir ce que ca donne.
Juste une petite question ya un onglet ordonnancement dans Oreon mais il permet juste de voir des infos on peut rien y configurer ?
inconnuflo
05-31-2006, 10:54 PM
je parle de la fonction "Host Dependencies"
templuche
06-01-2006, 09:21 AM
Heu... non inconnuflo. :shock:
En fait, je pense que tu as un problème de performance. Essaye de diminuer la valeur de la directive "service_reaper_frequency" et augmenter la valeur de max_concurrent_checks. Redémarre Nagios après cela et tiens nous au courant.
waltergin
06-01-2006, 02:37 PM
J'ai passé service_reaper_frequiency de 10 a 5 et max_concurrent_checks de 20 a 40.
Les 40 premiers checks se font bien, mais apres c'assez long je fais le test en meme tps que le post.
Y me reste la moitié des hotes et services a verifier et ca fait deja 10min 30sec que le premier check a été effectué.
templuche
06-01-2006, 02:43 PM
Passe service_reaper_frequency à 1.
waltergin
06-01-2006, 02:45 PM
OKI je test ca , mais ca permet exactement de changer quoi cette variable?
En meme temps c'est ptet normal qui prenne autant de temps vu le nombre d'hotes et de services , non?
Le changement de la variable service_reaper_frequency a 1 ne change pas trop les choses j'ai l'impression des qu'il arrive a peu pres a la moitié des checks au bout de 10 min y pedale dans la choucroute. En fait c'est meme pas la moitié des checks:
HOST: 78 UP 7 DOWN 147 INACCESSIBLE
Services: 169 OK 11CRITIQUE 4 ATTENTION 212 En suspens 21 INCONNU
Au bout de 19 min tous les hotes ont été checkés ainsi que tous les services. C'est mieux qu'avant nais je trouve que ca reste long, non ?
waltergin
06-01-2006, 07:54 PM
OKI en fait maintenant que le parametrage du PIX est terminé et que les hosts sont tous UP l'ensemble des checks se fait en 3-4 min 8)
Merci a Templuche, mais juste une chose elle joue sur quoi la variable service_reaper_frequency ?
Elle augmente la frequence de recuperation des controles de Nagios.
Avant c'etait toutes les 10 secondes que Nagios allait recuperer les donnees issues des checks realises, maintenant c 1.
Templuche tu penses pas que 1 seconde c un peu beaucoup et que dans son cas ca pourrait planter Nagios ? Mais peut etre que les versions 2.x supportent encore mieux la charge...
inconnuflo
06-01-2006, 09:16 PM
Heu... non inconnuflo. :shock:
En fait, je pense que tu as un problème de performance. Essaye de diminuer la valeur de la directive "service_reaper_frequency" et augmenter la valeur de max_concurrent_checks. Redémarre Nagios après cela et tiens nous au courant.
Bien vu, je n'y avais pas pensé, merci :wink:
templuche
06-02-2006, 11:49 AM
Templuche tu penses pas que 1 seconde c un peu beaucoup et que dans son cas ca pourrait planter Nagios ? Mais peut etre que les versions 2.x supportent encore mieux la charge...
Ca marche bien (Nagios 1.x) avec une seconde selon mon expérience. Avec Nagios 2.X, il recommande la valeur 2.
waltergin
06-02-2006, 02:26 PM
Merci Templuche pour ta precision 8)
inconnuflo
06-16-2006, 11:41 AM
Voilà je viens de rajouter cette optimisation dans le wiki:
http://wiki.oreon-project.org/wakka.php?wiki=WorkShopFR#4
dealmeidan
07-27-2006, 09:54 AM
bonjour,
j'ai nagios 2
j'ai modifié mon Service Repear Frequency de 20 à 2
et mon Maximum Concurrent Service Checks de 90 à 120
lorsque je redémarre nagios je met 15 minutes pour récupérer mes 208 check c'est quand meme long
y a t'il encore une autre solution?
merci
templuche
07-27-2006, 10:02 AM
y a t'il encore une autre solution?
RTFM!!! http://nagios.sourceforge.net/docs/2_0/configmain.html#max_service_check_spread
dealmeidan
07-27-2006, 10:22 AM
je te remercie