Depuis février 2010
Facebook (Londres, Royaume-Uni)
Site Reliability Operations / Application Operations Engineer
- J'ai débuté dans l'équipe globale SRE de Facebook, garante de l'exploitation, de la disponibilité et des performances du site 24h/24, pour plus de 500M d'utilisateurs/mois et 300M/jour. Parmi mes responsabilités : diagnostic et résolution d'incidents système, réseau et applicatifs, gestion et aiguillage du trafic entre datacenters, développement de scripts de déploiement et d'automatisation des clusters, astreintes pour l'ensemble du site.
- J'ai évolué ensuite vers le rôle d'App Ops Engineer : architecture, implémentation et gestion quotidienne des sous systèmes du site en relation avec les développeurs, support à l'exploitation, amélioration des process, contacts quotidiens et visites fréquentes aux équipes de Palo Alto.
- Linux, memcached, MySQL, cfengine, très nombreuses technologies internes.