Support Engineering Lead – Data & AI Platforms - Stellantis
CDI
Le Responsable Support Engineering (IC) est un leader technique opérationnel chargé d'assurer et d'exécuter le support de Niveau 1 (L1) pour les plateformes Big Data et IA d'entreprise. En plus de la gestion quotidienne des incidents et de leur résolution, ce rôle consiste à concevoir, standardiser et améliorer en continu les processus de support, les outils et les pratiques opérationnelles. Vous serez le référent technique du support L1, en collaboration étroite avec les équipes d'ingénierie plateforme, SRE et produit, afin d'améliorer la fiabilité des plateformes, réduire la charge opérationnelle et offrir une expérience de support de haute qualité aux utilisateurs. Responsabilités principales : Exécution et responsabilité du support L1 • Agir comme premier répondant L1 pour les incidents, alertes et demandes utilisateurs sur les plateformes Big Data et IA • Réaliser la triage initial, l'évaluation d'impact et la priorisation • Résoudre les problèmes connus ou courants via des runbooks, outils ou automatisations • Escalader les incidents complexes aux équipes L2/L3 en fournissant diagnostics, logs et contexte détaillés • Assurer le suivi, la traçabilité et la clôture complète des incidents Gestion des incidents • Piloter la réponse aux incidents au niveau L1 • Garantir une communication claire et rapide durant les incidents • Participer aux analyses post incident et revues de causes racines • Identifier les incidents récurrents et proposer des actions préventives Gestion des processus & outils • Mettre en place et améliorer continuellement les processus de support L1, incluant o Flux d'entrée et triage o Définition des niveaux de sévérité o Chemins d'escalade et passages de relais o SLAs et attentes de réponse • Concevoir, documenter et maintenir les runbooks, SOPs et bases de connaissances • Définir et mettre en œuvre les outils de support tels que : o Systèmes de tickets et gestion d'incidents o Intégrations d'alerting et monitoring o Tableaux de bord de visibilité opérationnelle • Automatiser les tâches répétitives pour réduire l'effort manuel et le MTTR Périmètre technologique Assurer le support L1 pour : • Plateformes Big Data (ex : Spark, Kafka, Airflow, data lakes/warehouses) • Plateformes IA/ML (pipelines d'entraînement, services d'inférence, runtimes GPU) • Runtimes Kubernetes et infrastructures cloud • Pipelines CI/CD et workflows data • Stacks d'observabilité (logs, métriques, traces) Collaboration & influence • Travailler en étroite collaboration avec les équipes d'ingénierie plateforme, SRE et produit pour : o Améliorer l'opérabilité et la maintenabilité des plateformes o Apporter du feedback issu de la production et des incidents utilisateurs o Influencer les roadmaps grâce aux enseignements opérationnels • Être un point de contact de confiance pour les utilisateurs des plateformes • Accompagner et mentoriser les autres ingénieurs support