Cerca nel blog

sabato 22 settembre 2012

APD - All Paths Down e PDL - Permanent Device Loss


La rimozione di uno storage device in uso da ESXi e non gestita dall’host, può determinare la condizione All Paths Down (APD), questo può accadere anche in caso di crash del device. Altri scenari possibili per un ADP sono:
  • crash degli switch in fibra che portano allo storage;
  • caduta degli switch Ethernet per un array iSCSI
Nel corso delle diverse release di vSphere, VMware ha apportato miglioramenti significativi per la gestione della condizione APD, si tratta infatti di una situazione complessa in quanto ESXi non è in grado di determinare se si tratta di uno stato permanente o transitorioIl problema peggiore in merito ad APD è l’effetto su hostd, servizio che è responsabile della gestione di molte operazioni in ESXi. Di fatto se un amministratore lanciasse un rescan sulla SAN, hostd attenderebbe indefinitivamente una risposta I/O dal device in stato APD. Hostd ha un numero finito di threads quindi se tutti fossero impegnati nell’attesa di I/O, il servizio non potrebbe giù gestire altri task come: accendere, spegnere o creare VM. Il tipico sintomo di un host ESXi in presenza di ADP è la disconnessione del vCenter in quanto il processo hostd è appeso.
vSphere 5.0 ha introdotto una nuova condizione nota come Permanent Device Loss (PDL), stato che permette all’host ESXi di intraprendere azioni specifiche quando la perdita del device è permanente. ESXi è in grado di “comprendere” la situazione PDL attraverso dei specifici codici SCSI inviati dall’array.
Con vSphere 5.1 è stata migliorata la gestione degli stati APD e PDL in 3 modi:
  • gestire gli stati ADP in situazioni transitorie complesse, ovvero non permette a hostd di rimanere appeso indefinitivamente quando una periferica viene improvvisamente sottratta a ESXi senza che alcun controllo lato host;
  • permettere a vSphere HA di individuare lo stato PDL e quindi permettergli di riavviare le VM sugli altri host nel cluster che non stiano soffrendo dello stato PDL sul datastore;
  • introdurre un criterio per lo stato PDL su quegli array iSCSI che presentano una LUN per ogni target, questi array sono problematici in quanto dopo che una LUN è persa anche il target è perso e di conseguenza l’host ESXi non ha alcun modo di richiedere alcun SCSI sense code.
Per maggiori informazioni è possibile consultare il white paper “What’s New in VMware vSphere 5.1 – Storage”.

Nessun commento: