OPS Projet SRE H/F - CNAMTS
CDI
Au sein de la DDSI (1100 personnes), la Direction du Développement a pour mission première d’assurer un pilotage unifié et transverse des projets et programmes de l’Assurance Maladie. Elle participe à la mise en place progressive de lignes produit et de développements d’applicatifs « cloud ready ». Le poste est positionné au sein du département développement et intégration de solutions externes (DDISE) qui a pour mission de concevoir et réaliser l’intégration de solutions externes et plus particulièrement sur le programme MES (Mon Espace Santé) et DMP (Dossier Médical Partagé) intégré au programme du numérique en santé. Nos missions sont de concevoir et maintenir les nouveaux services numériques pour les assurés et les professionnels de Santé. Le programme MES a pour vocation de permettre à chacun d’être acteur de sa santé et de prendre le contrôle de ses données de santé. En miroir de cette offre aux usagers, l’Assurance Maladie propose depuis plusieurs années une offre de services aux professionnels de santé dont fait partie le DMP. Intégrer la Direction des Systèmes d'Information de la CNAM, c'est participer à des chantiers d'envergure en matière d'architecture, d'efficience technologique ou de sécurité de l'un des systèmes d'information les plus importants d'Europe. C'est aussi participer à des projets stratégiques, innovants et d'utilité publique aux côtés de collaborateurs engagés et d'experts reconnus. Vos missions : En tant que Site Reliability Engineer (SRE), vous aurez un rôle clé dans la gestion, la surveillance et l’optimisation de nos produits, tout en assurant la meilleure expérience possible pour nos utilisateurs. Vous accompagnerez les feature team du programme, et vos missions seront les suivantes : · Fiabilité des systèmes : Participer à la définition de l’architecture pour garantir la haute disponibilité et la performance des produits. · Automatisation : Contribuer à la mise en place des outils d’automatisation pour réduire les tâches manuelles et améliorer l’efficacité opérationnelle. · Observabilité : accompagner les équipes pour implémenter et superviser les produits, logs et alertes (Tooling, Grafana, ELK, etc.) pour détecter et résoudre les incidents rapidement. · Gestion des incidents : Réagir aux incidents critiques, conduire des postmortems et identifier des actions correctives. · Sécurité et conformité : Intégrer les pratiques de sécurité dans les workflows SRE (audits, gestion des secrets, …). · Collaboration Ops projet : Travailler en étroite collaboration avec les OPS projet et OPS plateforme pour améliorer les pipelines CI/CD et garantir un déploiement sécurisé, fluide et sans coupure de service. · Capacité et scalabilité : Anticiper les besoins en ressources et préparer l’infrastructure pour gérer la croissance des utilisateurs.