Plusgrade

Développeur·se fiabilité des sites// Site Reliability Engineer

Plusgrade • CA
Python Hybrid
**English is available below***


Les voyages vont bien au-delà de leur destination ; ils sont tissés de chaque souvenir que l'on crée en chemin. Notre engagement consiste à redéfinir l'avenir du voyage en collaborant avec plus de 250 compagnies aériennes, établissements hôteliers, sociétés de croisières, réseaux ferroviaires pour voyageurs et services financiers, dans le but de créer de nouvelles sources de revenus significatives grâce à des expériences client exceptionnelles. Fondés sur nos valeurs fondamentales d'ambition, d'innovation et de collaboration, nous sommes constamment poussés à repousser les limites, à surpasser les attentes et à exploiter le meilleur de chacun. Nous favorisons une culture qui repose sur la conviction que notre force réside dans notre unité, travaillant ensemble pour bâtir un avenir extraordinaire dans l'univers du voyage. Joignez-vous à nous pour transformer les voyages quotidiens en expériences véritablement extraordinaires. 

À PROPOS DU POSTE:

Plusgrade est à la recherche d’un Ingénieur fiabilité des sites (SRE) pour aider notre équipe à créer des solutions logicielles fiables répondant aux besoins de nos clients.
En tant qu’Ingénieur fiabilité des sites (SRE), tu seras responsable d’améliorer la surveillance et l’observabilité de nos différents systèmes de production ainsi que de l’infrastructure de soutien (AWS et systèmes corporatifs). Tu participeras également à la mise en œuvre de solutions visant à améliorer la disponibilité des systèmes et à garantir le respect de nos accords de niveau de service (SLA).
Pour réussir dans ce rôle, tu devras être un excellent résolveur de problèmes, doté d’une solide compréhension d’un large éventail de technologies logicielles, de concepts de réseautage, d’orchestration de conteneurs et d’outils de surveillance.
Ce poste fait partie de l’équipe Engineering Operations, est basé à Toronto ou Montréal, et relève du Directeur, opérations TI.
Nous croyons fermement qu’il existe de nombreuses opportunités stimulantes dans le domaine des technologies du voyage. Si tu es motivé à nous aider à en relever certains défis, nous aimerions te rencontrer !


CE QUE VOUS FEREZ:
• Améliorer l’alerte et la détection des problèmes au sein des déploiements et de l’infrastructure existants (services, fournisseurs tiers, etc.) afin de garantir que l’équipe des opérations reçoive des alertes rapides et pertinentes.
• Concevoir et maintenir une surveillance active testant nos services de bout en bout.
• Surveiller la latence des applications et créer des rapports pour suivre les temps de réponse par rapport aux objectifs des SLA.
• Concevoir et permettre à l’organisation de créer, améliorer ou utiliser des tableaux de bord accessibles à tous.
• Améliorer la détection des incidents et des erreurs, en assurant le suivi des actions ayant un impact sur la coordination et en favorisant une résolution plus rapide.
• Consolider les différentes solutions de surveillance afin d’améliorer l’efficacité et de réduire les coûts.
• Évaluer en continu les systèmes existants par rapport aux standards de l’industrie et formuler des recommandations d’amélioration.
• Mettre en œuvre les meilleures pratiques de l’industrie en matière de durcissement des systèmes et de gestion de la configuration.
• Améliorer le flux de déploiement et la chaîne CI/CD en renforçant l’observabilité des applications et de l’infrastructure.

VOUS ÊTES UNE PERSONNE AVEC:
• Plus de 5 ans d’expérience technique pertinente.
• Solide compréhension des protocoles réseau de base (HTTP, DNS, TLS, TCP, UDP).
• Expérience avec les déploiements Kubernetes et les définitions de ressources personnalisées (CRD).
• Capacité à dépanner ArgoCD et Argo Rollouts dans un environnement de déploiement canari.
• Bonne connaissance pratique des pare-feux applicatifs Web (WAF) et des réseaux de diffusion de contenu (CDN) tels que Cloudflare.
• Capacité à rassembler différentes sources de données (journaux, métriques, traces) pour identifier les goulots d’étranglement dans les systèmes applicatifs, au sein de notre infrastructure ou entre les services tiers.
• Esprit hautement analytique, capable de voir à la fois la vue d’ensemble et les détails.
• Excellentes compétences interpersonnelles ainsi qu’en communication écrite et orale.
• Expérience pratique dans la conception d’applications infonuagiques sécurisées, fiables, performantes, évolutives et rentables sur AWS.
• Expérience pratique avec des outils de gestion de clusters et des plateformes infonuagiques (telles qu’AWS ECS, AWS EKS, GCP, etc.).
• Capacité à écrire des scripts en Python et à analyser des traces de pile (stack traces).
• Expérience avec des outils de surveillance tels que Splunk, Datadog, New Relic, CloudWatch, Zabbix ou Prometheus.


CE SERAIT UN PLUS:
• Expérience dans la connexion d’applications et de sources de données entre différents fournisseurs.
• Certifications d’architecte AWS.
• Expérience avec Terraform et OpenTelemetry.

NOTRE STACK TECHNOLOGIQUE:
Déploiements : Helm, ArgoCD
Surveillance : Splunk, Datadog, Grafana, CloudWatch
Languages : Python, Bash
CI/CD : GitLab, GitHub, Bitbucket

Cloud : AWS en multi-régions


CE QUE VOUS AIMEREZ CHEZ NOUS:
🏦 REER de contrepartie
🏥 Plans de santé complets
📅 Programme de congés payés flexible
✈️ Allocation d’expérience de voyage
🧘 Crédit annuel pour bien-être
🥗 Événements d'équipe
💻 Allocation pour des fournitures de bureau / transport
🌅 Programme de travail à distance
🍼 Programme de prime de congé parental
🌍 Passeport pour l'aventure


NOTRE PROCESSUS:Plusgrade est un employeur offrant des chances égales et s'engage à fournir un processus de recrutement accessible. Nous accueillons les candidatures de toutes les personnes qualifiées et nous sommes engagés à offrir des opportunités d'emploi égales, quel que soit l'identité ou l'expression de genre, la race, l'origine ethnique, la croyance, le lieu d'origine, l'âge, le sexe, l'état civil, le handicap physique ou mental, l'orientation sexuelle et toute autre catégorie protégée par la loi. Sur demande, nous fournirons un hébergement pour les candidats handicapés.Nous croyons en la diversité et l'inclusivité, c'est pourquoi notre processus d'entrevue est conçu pour offrir une expérience de candidat positive et garantir que chaque candidat est évalué de manière égale.

Toutes les candidatures seront examinées par notre équipe de talents et le ou les candidats retenus passeront par le processus de recrutement suivant:
• Entrevue téléphonique avec le recruteur.se
• Entrevue avec le responsable de l'embauche
• Test pratique à domicile ou exercice de codage à distance (le cas échéant)
• Entrevue en équipeTous les candidats recevront des commentaires, qu'ils réussissent ou non toutes les étapes de notre processus d'entrevue. Toutes vos informations seront confidentielles.