En tant que System Engineer Expert, vous êtes garant et responsable de fournir le meilleur service aux clients d’un portefeuille d’applications mutualistes et de services qui lui sont dédiés : stabilité, performance et qualité des services.
Vos responsabilités
- Assurer le développement de packs de gestion SCOM (management packs) pour les applications développées en interne (in-house) à l'aide de Visual Studio Authoring Extensions.
- Assurer l’installation, la configuration et la maintenance du pack de gestion ou de l'add-on pour les outils ci-dessous afin qu'ils s'intègrent à la plateforme SCOM :
- DMC (DB2)
- Dynatrace
- Grafana
- JMeter
- EView (iSeries)
- OpenShift
- etc.
- Créer des flux d'intégration avec notre outil de ticketing Jira (produit Atlassian/Atlassian Data Center), afin de convertir automatiquement certaines alertes en tickets automatisés (sans intervention manuelle)
- Créer des dashboards SquaredUp et améliorer les dashboards existantes
- Assurer un transfert de connaissances fréquent aux équipes de production et répondre à leurs questions
Vos tâches et responsabilités secondaires :
- Documenter et tenir la documentation technique à jour sur tous les aspects monitoring d’un nouveau projet, produit ou service
- Avoir une excellente connaissance de l'environnement de travail, ainsi qu’un sens inné de la communication. Être capable de vulgariser certains composants techniques dans un langage ou vocabulaire plus familier pour un client demandeur
- Participer à la relecture de tout manuel ou guide fonctionnel pour un utilisateur d’applications sur tous les aspects monitoring et apporter, le cas échéant, toutes les corrections nécessaires
- Résoudre les problèmes lors d’un incident majeur de production et être capable de répondre aux questions sur tous les aspects de monitoring à l’incident manager ou service manager
- Participer à l’assessment d’un projet lorsqu’un monitoring/alerting/event est demandé par un client dans le cadre d’un projet ; il faut pouvoir répondre au besoin du client en respectant le scope, le timing et toute contrainte budgétaire exigée.
- Organiser et participer à des meetings techniques avec nos clients sur les aspects monitoring/alerting/event en répondant aux besoins de nos clients et en accord avec le niveau de service attendu
- Renseigner son squad lead ou manager sur toutes les récurrences d’incidents détectés et faire prioritiser sa correction ou le changement en collaboration avec le product owner et le squad lead
- Viser l’évolution constante et les améliorations continues sur les aspects event/alerting/monitoring en tirant toutes les leçons possibles après chaque nouvelle livraison ou déploiement de solutions monitorées
- Définir et mettre en pratique toutes les actions d'amélioration sélectionnées et s’assurer du respect des bonnes pratiques de développement et de gestion
- Favoriser l’esprit d’équipe et encourager la production d’idées positives afin d’améliorer la manière de travailler
- Aider la squad et ses collègues à atteindre les plus hauts standards de qualité de service en proposant toutes suggestions d’amélioration