Scénario : Perte d’un serveur Active Directory
Introduction
Cette documentation décrit les procédures à suivre et les comportements attendus en cas de perte d’un Active Directory.
L’objectif est de garantir la continuité des services et la disponibilité des ressources en cas de panne ou d’incident. Cette documentation est essentielle pour assurer la résilience et la fiabilité des services d’annuaire et d’authentification.
Rappel
Architecture
- SRVV-ADDS-DC1-01 (Datacenter 1) :
- Serveur Windows Server 2022
- Créateur de la forêt avec le domaine racine
- SRVV-ADDS-DC2-01 (Datacenter 2) :
- Serveur Windows Server 2022
- Contrôleur de domaine supplémentaire dans le domaine existant
- SRVV-ADDS-SITE-RODC :
- Serveur Windows Server 2022 avec un AD en RODC (Read-Only Domain Controller) répliqué via les autres contrôleurs de domaine
- Fournit des services d’authentification en lecture seule pour les utilisateurs locaux
Localisation
Les deux datacenter ne se trouvent pas dans la même région géographique pour éviter la perte totale des ressources qui pourrait être dûe à une coupure de courant générale ou catastrophe naturelle.
Pour assurer une disponibilité totale, nous avons disposé un serveur ADDS en RODC sur chacun des sites physique de l’entreprise.
Grâce à notre configuration, lors de la restauration d’un de nos serveurs ADDS, les données de l’AD sont bien récupérées grâce aux autres serveurs.
I. Perte de l’ADDS sur le datacenter 1
Ce scénario pourrait être causé par une défaillance matérielle, une panne électrique, une cyberattaque, ou des mises à jour défaillantes.
Comportement attendu :
Le serveur ADDS se situant sur le datacenter 2 étant un contrôleur de domaine dans le même domaine, continuera à fournir les services ADDS sans interruption.
Les utilisateurs pourront toujours s’authentifier, accéder aux ressources réseau et les applications continueront à fonctionner correctement. La synchronisation avec les serveurs en RODC continuera de s’effectuer.
Actions à entreprendre :
Vérifier la réplication AD :
- Nous pouvons utiliser des outils comme
repadminet les journaux d’événements pour vérifier que la réplication entre le serveur du datacenter 2 et le serveur en RODC se poursuit correctement.
- Nous pouvons utiliser des outils comme
Restaurer le serveur sur le datacenter 1 :
- Si possible, il faut tenter de redémarrer ou de réparer le serveur. Nous devons vérifier les connexions réseau, l’intégrité matérielle, et les services ADDS.
- En cas d’échec, nous devons préparer un plan de restauration à partir des sauvegardes.
II. Perte de l’ADDS sur le datacenter 2
Cette situation peut résulter d’une panne matérielle, d’une attaque cyberattaque, ou d’un échec de mise à jour.
Comportement attendu :
Le serveur disponible sur le datacenter 1, en tant que créateur de la forêt et domaine racine, continuera à fournir les services ADDS. Les utilisateurs continueront à pouvoir s’authentifier et accéder aux ressources sans interruption. La synchronisation avec les serveurs en RODC continuera de s’effectuer.
Actions à entreprendre :
Restaurer le serveur sur le datacenter 2 :
En premier lieu, nous devons essayer de redémarrer ou réparer le serveur si possible, vérifier les composants matériels et logiciels, et rétablir les services ADDS.
En cas d’échec, nous restaurerons le serveur à partir des sauvegardes.
En premier lieu, nous devons essayer de redémarrer ou réparer le serveur si possible. Vérifier les composants matériels et logiciels, et rétablir les services ADDS.
En cas d’échec, nous restaureront le serveur à partir des sauvegardes.
Mise en place de mesures préventives :
- Analyser la cause de l’incident et mettre en place des mesures pour éviter des incidents similaires à l’avenir.
III. Perte du serveur RODC
Le serveur RODC dans le site local devient indisponible, ce qui peut être dû à une défaillance matérielle, une coupure de courant ou des problèmes de configuration.
Comportement attendu :
Les utilisateurs locaux devront se connecter aux contrôleurs de domaine de datacenter 1 ou 2 pour les services ADDS.
Actions à entreprendre :
Restaurer le RODC :
- Si possible, nous devons redémarrer ou réparer le RODC puis vérifier les composants matériels et assurer que le système d’exploitation et les services ADDS fonctionnent correctement.
- Si possible, nous devons redémarrer ou réparer le RODC. Puis, vérifier les composants matériels et assurer que le système d’exploitation et les services ADDS fonctionnent correctement.
- En cas d’échec, nous devons préparer un plan de restauration à partir des sauvegardes.
Vérifier la réplication AD :
- Utiliser les outils AD pour vérifier l’état de la réplication entre DC1, DC2 et le RODC après la restauration. Nous devons nous assurer que toutes les modifications AD sont correctement répliquées.
IV. Perte des deux serveurs distant
Exemple: la connectivité réseau entre le site local et les datacenters est interrompue, empêchant toute communication entre le site local et les contrôleurs de domaine situés dans les datacenters.
Comportement attendu :
Le RODC dans le site local continuera à fournir des services d’authentification en lecture seule pour les utilisateurs locaux.
Les utilisateurs pourront s’authentifier et accéder aux ressources locales configurées sur le RODC. Les modifications de mot de passe, les ajouts de nouveaux utilisateurs, et d’autres modifications de l’AD ne pourront pas être répliquées tant que la connectivité réseau n’est pas rétablie.
Actions à entreprendre :
Diagnostiquer et réparer le réseau :
- Dans ce cas spécifique, il faudra travailler avec l’équipe réseau pour identifier et résoudre les problèmes de connectivité entre le site local et les datacenters.
Vérifier la cohérence des données :
- Après la restauration de la connectivité, vérifier la réplication AD pour s’assurer que les données sont cohérentes entre le site local et les datacenters.