Installer DRBD sur notre CentOS¶

Avant de rentrer dans le vif du sujet, regardons ce qu’est DRBD.

DRBD (Distributed Replicated Block Device) peut-être comparé à un RAID 1 mais en réseau, c’est à dire que 2 disques, partitions, …, peuvent être repliqué d’un disque à un autre via un réseau ethernet ou fibre.

Cela permet donc d’assurer la disponibilité de vos données en cas de crash complet d’une machine. Ce que ne permet pas de faire un RAID classique. [1]

Préparation des disques¶

Pour chacune de nos machines, nous devons créer un disque dur virtuel. Si vous voulez juste faire un test vous n’avez pas besoin de beaucoup d’espace, sinon c’est à vous de voir.

C’est fait ? Cool, nous pouvons créer une partition sur nos nouveaux disques. Mais tout d’abord, commençons par vérifier les disques présent pour ne pas faire de boulette:

root@CES3-2:~# df -h

Alors de mon coté, il n’y a que sda d’utilisé, donc à priori on peut partir sur sdb que l’on peut trouver dans /dev

root@CES3-2:~# fdisk /dev/sdb
...
Command (m for help): n
Command action
e extend
p primary partition (1-4)
p
Partition number (1-4): 1
First cylinder (1-130, default 1):
Using default value 1
Last cylinder, +cylinder or +size{K,M,G} (1-130, default 130):
Using default value 130
Command (m for help): w
The partition table has been altered!
Calling ioctl() to re-read partition table.
Syncing disks.

Voila, vous pouvez faire la même chose sur le second noeud (CES3-2-slave).

Nous allons maintenant installer les paquets nécessaires pour utiliser DRBD.

Installation et configuration DRBD¶

Note

Ces commandes seront à faire sur les 2 noeuds !

Il va falloir installer au préalable le dépôt « elrepo »:

rpm --import http://elrepo.org/RPM-GPG-KEY-elrepo.org
rpm -Uvh http://elrepo.org/elrepo-release-6-5.el6.elrepo.noarch.rpm

Bien sûr, il faudra changer l’adresse du dépôt en fonction de votre release.

Ensuite, faites un petit:

yum update

Puis:

yum install drbd84-utils kmod-drbd84

Lorsque les paquets sont installés, lancez la commande suivante:

modprobe drbd

Maintenant que les disques et DRBD sont en place nous pouvons configurer la réplication entre les 2 disques.

Nous devons créer un fichier, drbd1.res, dans le dossier /etc/drbd.d/

Avant tout cela, faites un hostname pour récupérer le nom de votre machine. Pour moi, CES3-2.local pour la première, et CES3-2-slave.local pour la seconde.

Puis on se rend dans /etc/drbd.d/ et l’on crée notre fichier drbd1.res

Voici à quoi doit ressembler notre fichier (ATTENTION remplacez avec vos informations):

resource r0 {
    # Taux de transfert 10 M pour 100mbits
    # 100M pour du 1Gbits
    protocol C;
    device /dev/drbd0;
    meta-disk internal;

    startup {
        wfc-timeout 30;
        degr-wfc-timeout 15;
    }
    disk {
        on-io-error detach;
    }
    syncer {
        rate 10M;
    }
    on CES3-2.local {
        disk /dev/sdb1;
        address 192.168.56.120:7788;
    }
    on CES3-2-slave.local {
        disk /dev/sdb1;
        address 192.168.56.121:7788;
    }
}

Ajout de DRBD dans notre cluster¶

Maintenant, nous pouvons ajouter DRBD au cluster. Il faudra bien faire attention de rentrer les bonnes informations, car celui-ci pourra planter si les informations sont erronées.

Tout d’abord, nous allons créer un fichier XML de configuration grace à la commande « CIB »

Sur le noeud 1:

pcs cluster cib drbd_cfg

Nous pouvons maintenant peupler notre fichier sans envoyer la configuration au cluster tout de suite grace à l’option « -f drbd_cfg »

pcs -f drbd_cfg resource create CentreonData ocf:linbit:drbd drbd_resource=r0 op monitor \
interval=60s
pcs -f drbd_cfg resource master CentreonDataClone CentreonData master-max=1 master-node-max=1 \
clone-max=2 clone-node-max=1 notify=true

pcs -f drbd_cfg resource show

La premiere ligne permet de créer notre resource « drbd » (ocf:linbit;drbd) que l’on va appeler CentreonData où nous utiliserons la resource drbd r0 que nous avons créé ultérieurement.

La ligne d’après va permettre de créer un « clone » qui va permettre à la ressource d’être lancer sur les 2 noeuds en même temps tout en spécifiant le nombre de resource maitre possible, …

La derniere ligne permet de vérifier nos informations.

Nous pouvons envoyer la configuration au cluster:

pcs cluster cib-push drbd_cfg

Vous pouvez lancer la commande suivante pour vérifier la configuration:

pcs status

Ajout du Filesystem dans notre cluster¶

Pour que notre DRBD fonctionne, nous devons pouvoir monter le filesystem automatiquement depuis le cluster.

Nous devons dire au cluster où le monter et quand.

Nous allons créer un fichier de configuration XML et l’envoyer lorsque nous aurons ajouter toutes nos informations.

pcs cluster cib fs_cfg
pcs -f fs_cfg resource create CentreonFS Filesystem device="/dev/drbd0" \
directory="/mnt/r0/" fstype="ext4"
pcs -f fs_cfg constraint colocation add CentreonFS with CentreonDataClone INFINITY \
with-rsc-role=Master
pcs -f fs_cfg constraint order promote CentreonDataClone then start CentreonFS
pcs -f fs_cfg constraint order CentreonFS then ClusterCentreon
# On pourrait ajouter aussi mais on l'a pas créé encore:
# pcs -f fs_cfg constraint order CentreonFS the mysql
# pcs -f fs_cfg colocation add mysql with CentreonFS INFINITY

Alors, n’oubliez pas de changer CentreonFS par votre nom de filesystem. Vérifiez bien aussi le chemin et nom de votre disque, pour moi /dev/drbd0 que je veux monter dans /mnt/r0/ qui est formatté au format ext4.

L’option Filesystem que nous voyons lorsque nous créons notre resource CentreonFS équivaut à ocf:heartbeat:Filesystem.

On va pouvoir vérifier notre configuration avec la commande:

pcs -f fs_cfg constraint

et

pcs -f fs_cfg resource show

On est bon ? A priori si vous avez bien suivi toutes les commandes sans erreur.

On va pouvoir pousser:

pcs clustercib-push fs_cfg

Tester notre cluster¶

Je vous conseil à ce stade de bien tester le cluster pour voir si tout fonctionne corectement.

Pour se faire, nous mettrons notre noeud principal en « standby »:

pcs cluster standby CES3-2

pcs status

On vérifie si pas d’erreur lors du basculement signalé par un Failed_actions

Pour nettoyer ce genre d’erreur:

pcs resource cleanup <resource_en_erreur>

Sinon, vous devriez voir toutes vos resources passer sur le noeud secondaire. Ainsi que DRBD qui passe votre noeud secondaire en master et le primaire en Stopped. Pourquoi il est en Stopped ? Bah !! Il est en standby !!

pcs cluster unstandby CES3-2
pcs status

Ha oui ! C’est bon !

Bon tout fonctionne ! Il reste maintenant à peupler notre DRBD.

En cas d’erreur sur notre DRBD¶

Alors voici 2 sites qui vont permettrent de remettre à flot notre synchronisation. Les erreurs peuvent survenir lors d’un crash d’un de nos 2 serveurs, il faut donc vérifier l’état de notre synchro.

Split-Brain

Standalone

Attention, par contre, l’etat « WFConnection » peut survenir lorsque qu’un des 2 noeud est en etat standby, donc il suffit juste de lancer la commande

pcs cluster unstandby <le-noeud>

[1]	Site de Denis Rosenkranz