Postée il y a 5 jours
Notre clientNotre client est un acteur majeur dans son secteur, engagé dans l?innovation et l?exploitation de solutions technologiques avancées, dans le cadre de l?optimisation de sa plateforme GenAI, recherche un Ingénieur Site Reliability Engineer (SRE) pour assurer la performance, la fiabilité et la conformité du service Secure GPT, tout en développant son automatisation et son observabilité.
Votre rôleEn tant qu'Ingénieur SRE, vous aurez la responsabilité d?assurer le bon fonctionnement des opérations API dans un environnement Azure et OpenShift (Kubernetes). Vous serez un acteur clé de l?amélioration continue du service en garantissant performance, sécurité et conformité.
Services attendus (LIRE IMPÉRATIVEMENT CETTE PARTIE) :Garantir la performance, la capacité, la fiabilité, la disponibilité et la qualité de service de la plateforme Secure GPT, tout en assurant la conformité avec les exigences de sécurité et réglementaire ;
Identifier des opportunités d'amélioration et piloter la mise en place d'optimisations, notamment en matière d'automatisation de l'observabilité et d'amélioration du service client ;
Se concentrer sur l?automatisation, la surveillance et l?amélioration continue.
Livrables :
Assurer la fiabilité et la performance de l?infrastructure API au sein de la plateforme Azure GenAI, en mettant l?accent sur le service Secure GPT ;
Gérer les incidents et problèmes de service, assurer leur résolution et communiquer les mises à jour aux parties prenantes ;
Identifier des opportunités d?amélioration des processus et procédures liés aux opérations API et piloter leur mise en ?uvre, en particulier en matière d?automatisation de l?observabilité et d?amélioration du service client ;
Servir de point d'escalade pour les parties prenantes ayant besoin d'assistance sur les opérations API et garantir une expérience utilisateur fluide ;
Résoudre les problèmes liés aux API afin d?assurer une expérience utilisateur optimale ;
Veiller à la conformité avec les exigences de sécurité et réglementaires du service Secure GPT ;
Assister l'équipe Secure GPT dans la prestation d'un service client exceptionnel aux parties prenantes internes.
Profil candidat:
Expertises requises (CLIENT TRÈS EXIGEANT MERCI DE LIRE LES CRITÈRES AVANT DE CANDIDATER)
Expérience en Site Reliability Engineering (SRE), en gestion des opérations ou en gestion de services, avec un focus spécifique sur les opérations API dans un environnement Azure et OpenShift (Kubernetes) (minimum 5 ans) ;
Compétence analytique permettant d'identifier rapidement et avec précision les problèmes et leurs causes profondes ;
Capacité à résoudre les problèmes avec une approche proactive et orientée solutions ;
Capacité d?apprentissage rapide des nouvelles technologies et outils ;
Aptitude à communiquer des informations techniques à des interlocuteurs non techniques ;
Expérience en gestion de projet, avec la capacité à gérer plusieurs priorités et parties prenantes ;
Capacité à mener des initiatives de manière autonome.
Environnement techniques requises : (CLIENT TRÈS EXIGEANT MERCI DE LIRE LES CRITÈRES AVANT DE CANDIDATER)
Expertise dans les opérations, la gestion et la surveillance des API Azure ;
Expérience en développement logiciel (CI/CD, Test Driven Development, etc.) ;
Maîtrise de l?Infrastructure as Code (IaC) et des pratiques DevOps pour les services frontend et backend ;
Connaissance de Terraform et/ou Bicep pour le déploiement automatisé d?infrastructure ;
Connaissance approfondie des concepts de Site Reliability Engineering (SRE) :
SLA, SLO, SLI
Budgets d?erreur
Réduction des tâches répétitives (Toil Reduction)
Automatisation
Gestion des incidents
Surveillance et observabilité
Planification de capacité et prévisions de la demande
Gestion des risques
Collaboration et communication
Expertises appréciées (VOUS FEREZ LA DIFFÉRENCE)
Expérience avec ChatGPT ou d'autres technologies d'IA générative ;
Expérience dans un secteur hautement réglementé ;
Connaissance des exigences en matière de sécurité des données et conformité réglementaire.
Techniques appréciées : (VOUS FEREZ LA DIFFÉRENCE avec des cas précis en missions)
Expérience dans l'intégration d'API LLM ou d'autres systèmes d'IA pertinents ;
Connaissance du standard OpenAPI ;
Maîtrise de langages de script (Bash, PowerShell, etc.) ;
Expérience en développement JavaScript (Node.js, Next.js) ;
Expertise en OpenShift (Kubernetes) pour l?exploitation et la gestion ;
Connaissance approfondie des Applications Azure, des réseaux, de la sécurité IT et des systèmes de production.