User Tools

Site Tools


Sidebar

documentation:systemes:gestion_carte_raid_sas_lsi

Reconstruction du RAID sur carte LSI MegaRaid SAS

Introduction

Simple aide mémoire pour reconstruire le RAID sur ma carte LSI.

04:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 1078 (rev 04) 
	Subsystem: LSI Logic / Symbios Logic Device 1013 
	Flags: bus master, fast devsel, latency 0, IRQ 31 
	Memory at fbcc0000 (64-bit, non-prefetchable) [size=256K] 
	I/O ports at d000 [size=256] 
	Memory at fbc80000 (64-bit, non-prefetchable) [size=256K] 
	Expansion ROM at fbc60000 [disabled] [size=128K] 
	Capabilities: [b0] Express Endpoint, MSI 00 
	Capabilities: [c4] Message Signalled Interrupts: Mask- 64bit+ Queue=0/2 Enable- 
	Capabilities: [d4] MSI-X: Enable- Mask- TabSize=4 
	Capabilities: [e0] Power Management version 2 
	Capabilities: [ec] Vital Product Data <?> 
	Capabilities: [100] Power Budgeting <?> 
	Kernel driver in use: megaraid_sas 
	Kernel modules: megaraid_sas

Pendant tout le temps de la reconstruction le serveur sera accessible de la même façon que si la grappe RAID n'était pas dégradée.

Installation

Pour un système sous Debian/Ubuntu nous devons ajouter un dépôt.

$ tail -2 /etc/apt/sources.list
# Megaraid utilities 
deb http://hwraid.le-vert.net/debian lenny main 

$ apt-get update

Le paquet à installer est megacli.

$ apt-get install megacli

On peut également installer 2 paquets pour faire de la supervision de nos grappes RAID.

$ apt-get install megactl megaraid-status

Reconstruction

La première étape consiste a repérer le disque défaillant :

$ megacli -PDlist -a0
[...]
Enclosure Device ID: 252
Slot Number: 4          
Device Id: 3            
[...]
Firmware state: Unconfigured(bad)
[...]
Secured: Unsecured
Locked: Unlocked
Foreign State: Foreign
Foreign Secure: Drive is not secured by a foreign lock key
Device Speed: 6.0Gb/s
Link Speed: 3.0Gb/s
Media Type: Hard Disk Device
[...] 

Dans cet exemple le disque porte l'ID 252 et il est sur slot 4.

Pour localiser physiquement le disque nous pouvons lancer la commande suivante qui activera la led sur la backplane:

MegaCli -PdLocate -start -physdrv\[252:4\]  -aALL

(et stop à la place de start pour l'éteindre).

Il manque un chapitre sur comment le remplacer

La seconde étape consiste à rendre le disque « online » afin de le préparer à la reconstruction.

$ megacli -PDMakeGood -PhysDrv[252:4] -a0
Adapter: 0: EnclId-252 SlotId-4 state changed to Unconfigured-Good.

La troisième étape consiste à scanner/nettoyer la configuration RAID :

$ megacli -CfgForeign -Scan -a0
There are 1 foreign configuration(s) on controller 0.

$ megacli -CfgForeign -Clear -a0
Foreign configuration 0 is cleared on controller 0.

On peut maintenant vérifier que le disque est près à retourner dans notre grappe :

$ megacli -PDList -a0
[...]
Enclosure Device ID: 252
Slot Number: 4          
[...]
Firmware state: Unconfigured(good), Spun Up
Foreign State: None
[...]

Ci dessous nous allons noter un certain nombre d'information afin de replacer le disque au bon endroit dans la grappe :

$ megacli -CfgDsply -a0
[...]
DISK GROUPS: 1
Number of Spans: 1
SPAN: 0           
Span Reference: 0x01
Number of PDs: 4    
Number of VDs: 1    
Number of dedicated Hotspares: 0
Virtual Disk Information:       
Virtual Disk: 0 (Target Id: 1) 
[...]

Physical Disk: 2

Physical Disk: 3
Enclosure Device ID: 252
Slot Number: 5          
Device Id: 4            
[...]

0x01 représente le numéro de l'ID de la grappe (1 ici). Nous l'utiliserons pour l'argument -array
Physical Disk : 2 représente le disque à reconstruire. Nous l'utiliserons pour l'argument -row
L'avant dernière étape consiste à replacer le nouveau disque dans la grappe à l'emplacement vide :

$ megacli -PdReplaceMissing -PhysDrv[252:4] -array1 -row2 -a0
Adapter: 0: Missing PD at Array 1, Row 2 is replaced

Nous pouvons finalement demander la reconstruction de notre grappe :

$ megacli -PDRbld -Start -PhysDrv[252:4] -a0
Started rebuild progress on device(Encl-252 Slot-4)

Pour savoir l'état de la reconstruction :

$ megacli -pdrbld -showprog -physdrv\[252:4\] -aALL

Rebuild Progress on Device at Enclosure 252, Slot 4 Completed 27% in 206 Minutes.

Exit Code: 0x00

Pour contrôler que la reconstruction a bien lieu :

$ megasasctl
a0       MegaRAID SAS 8708EM2     encl:1 ldrv:1  batt:FAULT, unknown charge state 
a0d0      1395GiB RAID 5   1x3  DEGRADED 
a0e252s0    698GiB  a0d0  online  
a0e252s1    698GiB  a0d0  online  
a0e252s2    698GiB  a0d0  rebuild 
Une fois la reconstruction terminée nous avons quelque chose de similaire :
a0       MegaRAID SAS 8708EM2     encl:1 ldrv:1  batt:FAULT, unknown charge state 
a0d0       929GiB RAID 5   1x3  optimal 
a0e252s0    465GiB  a0d0  online  
a0e252s1    465GiB  a0d0  online  
a0e252s2    465GiB  a0d0  online 

Supervision

Pour ma part je suis un fidèle de munin depuis de nombreuses années.

A compléter

Sources

documentation/systemes/gestion_carte_raid_sas_lsi.txt · Last modified: 2017/07/14 19:45 (external edit)