Postée il y a 29 jours
Nous recherchons une personne pour une mission de Ops / Site Reliability Engineer (SRE) afin de compléter l?équipe Operations de la Global Tech & Data Platform. Ton expérience des architectures techniques cloud, de la sécurité, du réseau et des pratiques de CI/CD te permettront :
- de développer des solutions pour concevoir, construire et exploiter des systèmes à grande échelle de manière évolutive, fiable et efficace
- d?intervenir dans les choix d?architecture technique en opérant à l?intersection du développement logiciel, de l'ingénierie des systèmes et de la sécurité
- d?intervenir sur les systèmes critiques pour l?entreprise à la demande du product owner / leader
- de trouver toutes les root causes complexes des problèmes en production et de faire les bons choix pour permettre à notre plateforme de passer à l?échelle sans difficultés
- de guider les équipes produit en respectant les outils et pratiques recommandées
Tu seras co-responsable, avec les équipes produit, de l'amélioration constante de la fiabilité de nos services utilisés quotidiennement par l?ensemble des Business Units.
Les 5 piliers du SRE Tech & Data : le « SPADH »
? Service : fournir un service incroyable, hors du commun
? Passion : être passionné(e), toujours prendre du plaisir
? Ambition : être ambitieux(se), n?avoir aucune limite
? Détermination : être résolu(e), passer par la porte ou par la fenêtre pour atteindre l?objectif
? Humilité : être humble et à l?écoute
Les enjeux
- Participer au maintien durable des niveaux de service de haute disponibilité de la plateforme Tech&Data groupe.
- Maintenir et faire évoluer le haut niveau d?automatisation et de résilience de la plateforme
Les Missions
- Accompagnement des équipes produits sur l'amélioration du run de leur produit (stack ops, metrologie, automatisation, etc.)
- Maintien en condition opérationnelle des outils Ops (Cloud compliance, gestion des SLO, ?)
- Évolution et management de l?infrastructure (Infrastructure As Code)
- Contribution à la création de la CI/CD automatisée
- Suivi de production (capacity planning, gestion des incidents)
- Développement de nouveaux produits et features, automatisation, scaling, documentation
Profil candidat:
Le Profil Recherché
- Profil devops ou sysops
- Connaissance du cloud GCP
- Maîtrise des méthodes d?observabilité: métrologie / alerting, analyse de logs
- Bonne connaissance en développement (langage Python obligatoire, SQL recommandé)
- Expérience Infra as Code (Terraform)
- Expérience avec Kubernetes et/ou Docker
- Bilingue anglais-français professionnel