Vérifier régulièrement la santé et les performances est essentielle, mais lorsqu'un problème technique surgit, il devient nécessaire d'analyser les données en temps réel. Par exemple, si un port d'un commutateur indique une forte utilisation de la bande passante, l'ingénieur réseau devra vérifier les dernières statistiques sur l'utilisation de ce port en particulier afin de savoir si le problème persiste.
La plupart des administrateurs réseau lance des commandes via l'interface en ligne de commande de leurs équipements réseau ou se connecte au bureau à distance de leurs serveurs pour vérifier leurs performances actuelles. OpManager, avec sa fonction de surveillance en temps réel nouvellement introduite, vous rapporte immédiatement les performances du dispositif en temps réel sans avoir à utiliser un autre outil pour y accéder. Au cours des dégradations des performances du réseau, il suffit de lancer les graphiques en temps réel pour connaitre le niveau de santé et de performance d'un équipement.
Trafic sur les interfaces en temps réel
Performances des serveurs en temps réel
Avec les graphiques en temps réel d'OpManager, les administrateurs peuvent obtenir :
Des statistiques en temps réel sur l'utilisation du CPU et de la mémoire d'un équipement.
Des informations en temps réel sur les performances des équipements.
L'utilisation en temps réel de la bande passante sur une interface/un port.
Les graphiques sur les performances en temps réel peuvent également être configurés comme des widgets pour tableau de bord pour permettre aux administrateurs de voir les tendances des performances en direct dès leur connexion sur OpManager.
Quelle est votre première réaction lorsqu'un incident réseau apparait ? Une connexion directe à l'équipement n'est pas une approche recommandée pour démarrer le troubleshooting après une alerte. Autoriser l'accès à tous les périphériques du réseau à chaque membre de l'équipe IT n'est pas non plus l'option la plus adéquat. Cela dit, vous aimeriez que votre équipe soit équipée des outils les plus adaptés pour dépanner rapidement les problèmes de performance du réseau. Un accès instantané aux outils de troubleshooting du réseau permet de résoudre les problèmes plus rapidement et de lancer les actions nécessaires pour résoudre ces problèmes dès que possible.
Voici les outils de surveillance du réseau d'OpManager qui vous aident lors du premier et du second niveau de troubleshooting, en fonction de la nature de la panne.
Ping ICMP
Lorsque vous recevez une alerte pour un "équipement down", la première vérification que vous voudrez peut-être faire et de regarder si vous pouvez accéder à l'appareil. Sur la page de snapshot de l'appareil, dans OpManager, vous pouvez faire un ping et vérifier la réponse. Vous pouvez continuer le troubleshooting en utilisant les autres outils de surveillance du réseau si un ping vers le dispositif échoue ou si le temps de réponse est très élevé.
Traceroute
Lorsque vous faites le troubleshooting d'un équipement qui a déclenché une alerte à l'aide d'un Ping et que l'appareil ne répond pas, vous pouvez faire un Traceroute pour déterminer si le dispositif n'est pas accessible en raison d'une défaillance du path. Faites un Traceroute depuis OpManager vers le dispositif de destination et vérifiez le nombre de sauts vers le dispositif surveillé et repérez l'endroit exact responsable du retard ou de l'interruption. Encore une fois, nous sommes ici au premier niveau de troubleshooting qui est basé sur la réponse de l'équipement surveillé. Vous pouvez utiliser d'autres outils de surveillance pour explorer un problème réseau.
Switch Port Mapper
Cet outil vous permet de voir la connectivité des ports des dispositifs aux commutateurs du réseau, ce qui est nécessaire pour aider à résoudre les problèmes de trafic élevé. Switch Port Mapper est un outil de surveillance du réseau qui vous donne l'adresse MAC, l'adresse IP et les noms DNS des appareils connectés à un commutateur.
Graphiques en temps réel
Lorsqu'il y une utilisation élevée des ressources du système, un contrôle instantané des performances actuelles des ressources permet d'évaluer l'impact de ce pic d'utilisation sur les performances. Une pénurie soudaine et inattendue des ressources peut conduire à des coupures sévères. Supposons que vous recevez une alerte pour dépassement de seuil lié à l'utilisation de la mémoire sur un serveur critique. La première étape serait de déterminer s'il s'agit d'un pic transitoire ou si cela peut durer pendant un certain temps. L'outil de surveillance du réseau en temps réel d'OpManager est très utile dans de tels cas. L'administrateur peut y accéder instantanément et ainsi résoudre le problème rapidement.
Diagnostic des processus à distance
Cet outil de surveillance réseau est spécifique à la surveillance des performances des serveurs. Utilisez cet outil pour connaitre la liste des 10 processus triée par utilisation du CPU ou de la mémoire. Cette option vous permet d'arrêter le processus gênant immédiatement et ainsi d'éviter un crash du serveur.
SNMP MibBrowser
L'outil MibBrowser est un navigateur de bases MIB qui permet de charger et de naviguer dans les MIBs ainsi que d'effectuer toutes les opérations par SNMP. Vous pouvez également afficher et exploiter les données disponibles grâce à l'agent SNMP qui s'exécute sur le périphérique géré. La visionneuse de traps vous permet de visualiser toutes les traps entrantes, même pour les périphériques qui ne sont pas gérés dans OpManager. MibBrowser est un outil complet de surveillance du réseau qui permet de faire du troubleshooting des problèmes par le biais du protocole SNMP.
Visionneuse de Syslogs
La visionneuse de Syslogs d'OpManager vous permet de visualiser les paquets de syslog envoyés par les périphériques au serveur OpManager. Cet outil réseau permet à l'administrateur de savoir si les dispositifs contrôlés envoient correctement les messages vers le serveur de syslogs configuré (le serveur OpManager dans ce cas). Vous pouvez choisir de surveiller des syslogs spécifiques en configurant des règles de surveillance des syslogs et en filtrant les règles qui correspondent à des critères spécifiques.
Telnet/SSH
Établissez une session CLI avec les périphériques Unix pour troubleshooter rapidement. Vous pouvez exécuter des commandes CLI sur l'équipement pour vérifier quelle est la cause de l'utilisation élevée du processeur sur le dispositif et décider de mettre fin à un processus ou à un service pour libérer des ressources. Cet outil permet d'agir immédiatement après certaines alertes à l'aide des commandes CLI.
Connexion au bureau à distance
Comme pour les sessions CLI pour les dispositifs sous Unix, vous pouvez vous authentifier sur les appareils Windows distants depuis OpManager à l'aide de l'outil de Connexion au Bureau à distance et effectuer certaines opérations autorisées sur l'appareil.
Navigateur
Un autre moyen de vérifier si un périphérique est accessible, votre serveur web par exemple, et de voir s'il répond à une requête http/https. Les nouveaux dispositifs réseaux de nouvelle génération possèdent une interface utilisateur pour les connexions telnet. Vous pouvez vous connecter à l'interface utilisateur en utilisant la connexion http/https.
GUI pour SmartPhone
Accédez à OpManager à tout moment et à partir de n'importe où en utilisant la nouvelle interface graphique pour smartphone. Cela vous permet de visualiser votre infrastructure, d'agir sur les alertes, d'explorer la cause d'un problème sans avoir à être physiquement présent dans votre salle de serveur ! Voici une courte vidéo sur les tâches de surveillance du réseau que cet outil peut effectuer.
Pour un responsable informatique, les pannes réseau les plus frustrantes sont celles qui se produisent lorsqu'il n'y est pas préparé et lorsqu'il est loin de son bureau (ex : en déplacement). Informer les équipes rapidement réduit les potentielles coupures du réseau/système. La plupart des entreprises mettent en place un système de redondance des liaisons réseau ainsi que des alertes emails intégrées à un logiciel de surveillance du réseau. Quelques petites et moyennes organisations disposent tout de même d'un serveur de messagerie secondaire. Cependant, ce qui est essentiel, c'est de posséder une option de contournement du problème lorsque le serveur de messagerie, le lien Internet ou le commutateur situé juste après le système de surveillance du réseau, tombe en panne.
Alertes SMS
Les alertes critiques, comme un serveur de base de données qui tombe, une défaillance d'un lien, ou une alerte proactive sur une coupure potentielle, nécessitent une attention immédiate. Il est peu probable que l'équipe IT soit toujours disponible par email pour réceptionner l'alerte. Les notifications par SMS permettent aux ingénieurs de prendre connaissance du problème rapidement.
Vous pouvez connecter un téléphone GSM ou un modem GSM au serveur OpManager afin d'envoyer des alertes par SMS même si votre connexion internet ou le serveur Exchange ne fonctionne pas. Cela vous garantit d'être alerté dans n'importe quelle situation.
Le saviez-vous ?
OpManager supporte à la fois l'envoi d'email et les alertes par SMS.
Modems pris en charge pour les notifications par SMS
Voici la liste des modems pris en charge dans OpManager pour les notifications par SMS.
S No.
Version du Modem
Taux Baud
Fabricant
1
Itegno 3000
115200
Wavecom
2
Itegno WM1080A
115200
Wavecom
3
Wavecom M1306B
Wavecom
4
MultiTech MultiModem MTCBA-G-F1
5
Wavecom Fastrack M1206B
115200
Wavecom
Vous ne trouvez pas un modem en particulier dans cette liste ?
Pas de soucis! Vérifiez si l'appareil que vous avez satisfait la configuration suivante.
Le modem doit avoir une fonctionnalité GSM avec la possibilité d'insérer une carte SIM.
Il doit supporter l'encodage 7bit (par défaut), 8bit et Unicode (UCS2).
OpManager utilise les commandes AT pour envoyer des SMS. Ainsi, le dispositif doit répondre à des commandes AT. [Si nécessaire, testez le en utilisant HyperTerminal]
Si votre modem répond aux critères ci-dessus, OpManager sera compatible avec celui-ci.
Savoir "quel est le problème" avant de mettre à contribution vos techniciens
La gestion des problèmes de réseau est un grand défi lorsque vous avez une petite équipe. La tâche devient même très compliquée si vous avez à gérer un site distant et qu'il faut envoyer un technicien sur place pour finalement constater que le problème était réparable à distance. Tout cela vous fait perdre un temps précieux.
Dans la plupart des cas, le temps nécessaire pour identifier l'origine d'un problème est en fait plus long que le temps nécessaire pour y remédier. Disposer d'un outil de surveillance proactif des problèmes du réseau comme OpManager vous permet d'identifier rapidement la cause d'un problème et de le corriger avant que les utilisateurs ne s'en aperçoivent.
Surveillance des problèmes avec OpManager
Corrélation des alarmes, code couleur pour les alarmes et historique des événements
OpManager effectue un traitement intelligent des événements.
Il met en corrélation les événements du réseau, filtre les événements indésirables et ne présente que les alarmes significatives.
Il utilise des codes couleur pour les alarmes afin que ces dernières soient présentées dans un format convivial.
Les administrateurs peuvent visualiser l'historique des événements associés à une alarme ainsi que supprimer ou effacer manuellement les alarmes.
Notifications des problèmes de réseau
Le mécanisme de notification d'OpManager peut vous avertir par SMS et/ou e-mail chaque fois qu'une alarme se déclenche.
Les administrateurs peuvent également configurer OpManager pour exécuter automatiquement des programmes ou des scripts externes lorsqu'une alarme se déclenche.
Support des traps SNMP et MIB personnalisée
La plupart des périphériques réseau récents sont capables d'envoyer des traps SNMP lorsqu'un incident apparait.
Un bon système de surveillance des problèmes de réseau doit être capable de supporter les traps SNMP et doit fournir des informations significatives pour les administrateurs. OpManager fait exactement cela en étant compatible avec les traps SNMP.
Les opérateurs peuvent également ajouter le support de MIB SNMP personnalisées. OpManager peut extraire des informations utiles qui sont envoyées dans les traps SNMP pour les utiliser comme des variables. (Varbinds SNMP)
Ainsi, si vous avez acheté des équipements de différents fabricants, tout ce que vous devez faire est d'obtenir l'accès à ces MIB spécifiques pour qu'OpManager puisse surveiller ces équipements.
Alertes et seuils
OpManager prend en charge divers mécanismes d'alerte et peut alerter un opérateur lorsqu'un périphérique ou un service tombe en panne.
OpManager peut également être configuré pour avertir les opérateurs lorsqu'un indicateur lié à un service dépasse ou descend en dessous d'une certaine limite fixée.
Les opérateurs peuvent définir des seuils pour un service, une application ou un périphérique et peuvent faire en sorte qu'OpManager les alerte lorsque la règle du seuil est violée.
Traitement des alarmes
Arrêt des alarmes
OpManager permet aux administrateurs de marquer rapidement des alarmes pour lesquelles ils ont déjà pris des mesures, un peu comme le marquage des emails 'comme lu' ou 'non lu'. L'acquittement des alarmes offre la possibilité aux opérateurs de mettre en évidence les nouvelles alarmes et celles qui ont déjà été prises en compte.
Les règles d'escalade des alarmes
OpManager permet aux administrateurs et aux responsables informatiques de mettre en place des règles automatiques d'escalade des alarmes. Par exemple, les responsables informatiques peuvent configurer une règle d'escalade pour obtenir un rapport des alarmes des serveurs qui sont actuellement ouvertes depuis plus d'une heure. Ce rapport peut être envoyé périodiquement au responsable par email.
Besoin d'autres fonctionnalités ? Faites-le nous savoir
Si vous désirez voir s'ajouter des fonctionnalités supplémentaires de surveillance des problèmes de réseau dans OpManager, nous serons heureux de vous écouter.