Page suivantePage précédenteTable des matières

21. Traitement d'erreurs

Les fonctions open, ioctl, write et read peuvent renvoyer des erreurs. Dans ce cas, leur valeur de retour est -1 et la variable globale errno est positionnée au numéro d'erreur (négatif). Les valeurs de errno sont définies dans /usr/include/errno.h. Les valeurs négatives possibles sont les suivantes :

Fonction | Erreur       | Description
=========|==============|==================================================
open     |  ENXIO       | périphérique invalide
 |  EACCES      | l'accès n'est pas en lecture/écriture (O_RDWR)
 |  EBUSY       | le périphérique est accédé en mode non bloquant,
 |              | mais il est occupé actuellement
 |  ERESTARTSYS | erreur interne. Essayez de la rendre reproductible
 |              | et informez-en le canal SCSI (pour les détails sur
 |              | le rapport de bogue, se reporter au SCSI-HOWTO de
 |              | Drew Eckhardts).
ioctl    |  ENXIO       | périphérique invalide
read     |  EAGAIN      | le périphérique bloqué. Essayez plus tard.
 |  ERESTARTSYS | erreur interne. Essayez de la rendre reproductible
 |              | et informez-en le canal SCSI (pour les détails sur
 |              | le rapport de bogue, se reporter au SCSI-HOWTO de
 |              | Drew Eckhardts).
write    |  EIO         | taille trop petite (plus petite que cette de l'en-
 |              | tête générique). Attention : il n'y a actuellement
 |              | aucun contrôle de débordement.
 |  EAGAIN      | le périphérique bloqué. Essayez plus tard.
 |  ENOMEM      | la mémoire nécessaire pour cette requête ne peut
 |              | être allouée. Essayez plus tard sauf si vous depas-
 |              | sez la taille maximale de transfert (cf. ci-dessus).
select   |              | sans description
close    |              | sans description

Pour la lecture et l'écriture, des valeurs de retour positivent indiquent comme d'habitude la quantité d'octets transférés. Cette valeur doit correspondre à celle demandée.

21.1 Décodage de l'état d'erreur

En plus, une information détaillée est fournie par hd_status du noyau et par sense_buffer du périphérique (cf. section ref id="sec-sensebuff" name="Le tampon SCSI">), les deux utilisant la structure d'en-tête générique.

Les différents sens de hd_status peuvent être trouvés dans drivers/scsi/scsi.h. Cet unsigned int est composé de différentes parties :

 lsb  |    ...    |    ...    | msb
=======|===========|===========|============
status | sense key | host code | driver byte

Les macros de drivers/scsi/scsi.h sont disponibles, mais elles ne peuvent malheureusement pas être facilement utilisées à cause d'interdépendances tordues entre fichiers d'en-tête. Il faudrait faire une passe sur ces fichiers pour clarifier les choses.

 Macro          | Description
=======================|=================================================
status_byte(hd_status) | Etat du périphérique. cf. section Codes d'etat
msg_byte(hd_status)    | du péripherique. cf. section buffer SCSI
host_byte(hd_status)   | du noyau. cf. section codes hôte
driver_byte(hd_status) | du noyau. cf. section codes intermédiaires

21.2 Codes d'état

Les codes d'état de périphérique qui suivent (issus de drivers/scsi/scsi.h) sont disponibles :

Valeur | Symbole
=======|=====================
0x00   | GOOD
0x01   | CHECK_CONDITION
0x02   | CONDITION_GOOD
0x04   | BUSY
0x08   | INTERMEDIATE_GOOD
0x0a   | INTERMEDIATE_C_GOOD
0x0c   | RESERVATION_CONFLICT

On constate que ces valeurs symboliques ont subi un décalage droit. Lorsque l'état indique CHECK_CONDITION, les données du buffer SCSI sont valides (contrôlez en particulier le code d'état additionnel et le qualificateur de code d'état additionnel).

Les valeurs qui suivent concernent les spécifications SCSI-2 :

 Table 27 : Code de l'octet d'état
+=================================-==============================+
|      Bits de l'octet d'état     |  Etat                        |
|  7   6   5   4   3   2   1   0  |                              |
|---------------------------------+------------------------------|
|  R   R   0   0   0   0   0   R  |  GOOD                        |
|  R   R   0   0   0   0   1   R  |  CHECK CONDITION             |
|  R   R   0   0   0   1   0   R  |  CONDITION MET               |
|  R   R   0   0   1   0   0   R  |  BUSY                        |
|  R   R   0   1   0   0   0   R  |  INTERMEDIATE                |
|  R   R   0   1   0   1   0   R  |  INTERMEDIATE-CONDITION MET  |
|  R   R   0   1   1   0   0   R  |  RESERVATION CONFLICT        |
|  R   R   1   0   0   0   1   R  |  COMMAND TERMINATED          |
|  R   R   1   0   1   0   0   R  |  QUEUE FULL                  |
|                                 |                              |
|       Tous autres codes         |  Réservé                     |
|----------------------------------------------------------------|
|       R = Bit réservé                                          |
+================================================================+

La définition des codes de l'octet d'état sont données ci-dessous :

GOOD.

Cet état indique que la cible a correctement exécuté la commande.

CHECK CONDITION.

Cet état indique qu'une condition de contention s'est produite (cf. 6.6).

CONDITION MET.

Cet état, ou INTERMEDIATE-CONDITION MET est renvoyé lorsque les conditions de l'opération demandée sont satisfaites (cf. commandes SEARCH DATA et PRE-FETCH).

BUSY.

Cet état indique que la cible est occupée. Il peut être renvoyé lorsque la cible ne peut accepter de commande depuis un initiateur inacceptable par ailleurs (i.e. conflit d'absence de réservation). L'action de reprise recommandée est une nouvelle tentative ultérieure.

INTERMEDIATE.

Cet état, ou INTERMEDIATE-CONDITION MET doit être renvoyée après chaque commande réussie d'une série de commandes liées (sauf pour la dernière), sauf si celle-ci se termine par un CHECK CONDITION, RESERVATION CONFLICT, ou COMMAND TERMINATED. Si ni INTERMEDIATE ni INTERMEDIATE-CONDITION MET n'est renvoyé, la série de commandes se termine, ainsi que le processus d'entrées/sorties.

INTERMEDIATE-CONDITION MET.

Cet état est la combinaison de CONDITION MET et de INTERMEDIATE.

RESERVATION CONFLICT.

Cet état doit être renvoyé lorsqu'un initiateur tente d'accéder à une unité logique ou à un extension à l'intérieur d'une unité logique réservée avec un type de réservation en conflit pour un autre périphérique SCSI (cf. commandes RESERVE et RESERVE UNIT). L'action de reprise recommandée est une nouvelle tentative ultérieure.

COMMAND TERMINATED.

Cet état doit être renvoyé lorsque la cible termine le processus d'entrées/sorties après réception d'un message TERMINATE I/O PROCESS (cf. 5.6.22). Cet état indique aussi qu'une condition de contention s'est produite (cf. 6.6).

QUEUE FULL.

Cet état doit être implémenté si la file d'attente marquée (tagged queuing) l'est aussi. Il est renvoyé lors de la réception d'un message SIMPLE QUEUE TAG, ORDERED QUEUE TAG, ou HEAD OF QUEUE TAG et que la file de commandes est pleine. Le processus d'entrée/sortie n'est alors pas placé dans la file de commandes.

21.3 Clefs du buffer SCSI

Les clefs résultantes peuvent être rapatriées à l'aide de la macro msg_byte (cf. section Décodage de l'état d'erreur). Les symboles du noyau qui suivent sont prédéfinis dans drivers/scsi/scsi.h :

Valeur | Symbole
=======|================
0x00   | NO_SENSE
0x01   | RECOVERED_ERROR
0x02   | NOT_READY
0x03   | MEDIUM_ERROR
0x04   | HARDWARE_ERROR
0x05   | ILLEGAL_REQUEST
0x06   | UNIT_ATTENTION
0x07   | DATA_PROTECT
0x08   | BLANK_CHECK
0x0a   | COPY_ABORTED
0x0b   | ABORTED_COMMAND
0x0d   | VOLUME_OVERFLOW
0x0e   | MISCOMPARE

Une liste extraite de la doc SCSI-2 suit (issue de la section 7.2.14.3) :

 Table 69: Description des clefs (0h-7h) du buffer SCSI
+========-====================================================================+
|  Clef  |  Description                                                       |
|--------+--------------------------------------------------------------------|
|   0h   |  NO SENSE.  Indique qu'aucune information spécifique n'est         |
|        |  disponible pour l'unité logique désignée. C'est le cas pour les   |
|        |  commandes réussies ou celles dont l'état est CHECK CONDITION ou   |
|        |  COMMAND TERMINATED à cause de l'un des bits filemark, EOM ou ILI. |
|--------+--------------------------------------------------------------------|
|   1h   |  RECOVERED ERROR.  Indique que la réussite de la dernière commande |
|        |  fut conditionnée par une action de réparation effectuée par la    |
|        |  cible. Les octets additionnels peuvent fournir des détails, ainsi |
|        |  que le champ information. Lorsque plusieurs erreurs réparées se   |
|        |  produisent durant une commande, le choix de celle indiquée        |
|        |  (première, dernière, plus sévère, etc.) dépend du périphérique.   |
|--------+--------------------------------------------------------------------|
|   2h   |  NOT READY.  Indique que l'unité logique est inaccessible. Une     |
|        |  intervention manuelle peut être nécessaire.                       |
|--------+--------------------------------------------------------------------|
|   3h   |  MEDIUM ERROR.  Indique la fin d'une commande sur une erreur non-  |
|        |  récupérable, causée probablement par un défaut du support ou une  |
|        |  erreur de données. Cette clef peut aussi être renvoyée si la      |
|        |  cible ne peut faire la distinction entre un défaut du support et  |
|        |  un défaut spécifique du matériel (clef 4h).                       |
|--------+--------------------------------------------------------------------|
|   4h   |  HARDWARE ERROR.  Indique que la cible a détecté une erreur maté-  |
|        |  rielle irrécupérable (défaut du contrôleur, du périphérique, er-  |
|        |  reur de parité, etc.) lors de l'exécution de la commande ou d'un  |
|        |  auto-test.                                                        |
|--------+--------------------------------------------------------------------|
|   5h   |  ILLEGAL REQUEST.  Indique qu'un paramètre illégal a été détecté   |
|        |  dans le bloc de description de commande ou dans les paramètres    |
|        |  additionnels (pour certaines commandes : FORMAT UNIT, SEARCH DATA,|
|        |  etc.). Si la cible détecte un paramètre incorrect, il doit termi- |
|        |  ner celle-ci sans modifier le contenu du support. Si le paramètre |
|        |  incorrect se trouve dans les paramètres additionnels, la cible    |
|        |  peut avoir déjà modifié le support. Cette clef est aussi renvoyée |
|        |  lors de la réception d'un message IDENTIFY invalide (5.6.7).      |
|--------+--------------------------------------------------------------------|
|   6h   |  UNIT ATTENTION.  Indique que le support amovible a pu être changé |
|        |  ou que la cible a été réinitialisée. Cf. 6.9 pour d'autres infor- |
|        |  mation sur cette condition.                                       |
|--------+--------------------------------------------------------------------|
|   7h   |  DATA PROTECT.  Indique qu'une commande de lecture ou d'écriture a |
|        |  été tentée sur un bloc protégé contre cette opération. Celle-ci   |
|        |  n'est pas effectuée.                                              |
+=============================================================================+
 Table 70: Description des clefs (8h-Fh) du buffer SCSI
+========-====================================================================+
|  Clef  |  Description                                                       |
|--------+--------------------------------------------------------------------|
|   8h   |  BLANK CHECK.  Indique qu'un périphérique à écriture unique ou     |
|        |  séquentiel a trouvé un support vierge ou une indication de fin de |
|        |  données de formatage lors de la lecture, ou qu'un support non     |
|        |  vierge à écriture seule a été trouvé pendant l'écriture.          |
|--------+--------------------------------------------------------------------|
|   9h   |  Vendor Specific.  Cette clef est disponible pour indiquer des     |
|        |  cas particuliers spécifiques du constructeur.                     |
|--------+--------------------------------------------------------------------|
|   Ah   |  COPY ABORTED.  Indique qu'une commande COPY, COMPARE ou COPY AND  |
|        |  VERIFY a echoué à cause d'une condition d'erreur sur le périphé-  |
|        |  rique source, destination ou les deux (cf. 7.2.3.2 pour plus de   |
|        |  détails).                                                         |
|--------+--------------------------------------------------------------------|
|   Bh   |  ABORTED COMMAND.  Indique que la cible a abandonné la commande.   |
|        |  L'initiateur peut éventuellement corriger le problème par une     |
|        |  nouvelle tentative.                                               |
|--------+--------------------------------------------------------------------|
|   Ch   |  EQUAL.  Indique qu'une commande SEARCH DATA a satisfait une con-  |
|        |  dition d'égalité.                                                 |
|--------+--------------------------------------------------------------------|
|   Dh   |  VOLUME OVERFLOW.  Indique qu'un périphérique à mémoire-tampon a   |
|        |  atteint la fin de partition et que des données non écrites sur le |
|        |  support peuvent rester dans le tampon. Une (ou plusieurs) commande|
|        |  RECOVER BUFFER DATA peut être tentée pour lire les données non    |
|        |  écrites depuis le tampon.                                         |
|--------+--------------------------------------------------------------------|
|   Eh   |  MISCOMPARE.  Indique que les données source ne correspondent pas  |
|        |  à celles lues sur le support.                                     |
|--------+--------------------------------------------------------------------|
|   Fh   |  RESERVE.                                                          |
+=============================================================================+

21.4 Codes hôte

Les codes hôtes qui suivent sont définis au niveau de drivers/scsi/scsi.h. Ils sont positionnés par le pilote du noyau et doivent être utilisés avec la macro host_byte (cf. section Décodage de l'état d'erreur) :

Valeur | Symbole        | Description
=======|================|========================================
0x00   | DID_OK         | Pas d'erreur
0x01   | DID_NO_CONNECT | Connexion impossible avant le timeout
0x02   | DID_BUS_BUSY   | BUS occupé durant la période de timeout
0x03   | DID_TIME_OUT   | Timeout atteint pour une autre raison
0x04   | DID_BAD_TARGET | Mauvaise cible
0x05   | DID_ABORT      | Arrêt effectué pour une autre raison
0x06   | DID_PARITY     | Erreur de parité
0x07   | DID_ERROR      | Erreur interne
0x08   | DID_RESET      | Réinitialisé par quelqu'un
0x09   | DID_BAD_INTR   | Interruption inattendue reçue

21.5 Codes du pilote

Le pilote de niveau intermédiaire catégorise l'état renvoyé par le pilote de bas niveau en fonction du buffer SCSI du périphérique. Il suggère certaines actions pouvant être tentées comme un réessai, un abandon ou un changement de topographie. La routine scsi_done de scsi.c effectue un travail très différencié fondé sur host_byte(), status_byte(), msg_byte() et la suggestion précédente. Ensuite, il positionne l'octet du pilote afin d'indiquer ce qui a été réalisé. L'octet du pilote est en deux parties : l'état du pilote et la suggestion. Chaque moitié est composée des valeurs suivantes (de scsi.h) combinées par un OR :

Valeur | Symbole        | Description ou état du pilote
=======|================|========================================
0x00   | DRIVER_OK      | pas d'erreur
0x01   | DRIVER_BUSY    | inutilisé
0x02   | DRIVER_SOFT    | inutilisé
0x03   | DRIVER_MEDIA   | inutilisé
0x04   | DRIVER_ERROR   | erreur interne du pilote
0x05   | DRIVER_INVALID | terminé (DID_BAD_TARGET ou DID_ABORT)
0x06   | DRIVER_TIMEOUT | terminé avec timeout
0x07   | DRIVER_HARD    | terminé avec une erreur fatale
0x08   | DRIVER_SENSE   | buffer SCSI disponible pour informations

Valeur | Symbole        | Description de la suggestion
=======|================|========================================
0x10   | SUGGEST_RETRY  | réessayer la requête SCSI
0x20   | SUGGEST_ABORT  | abandonner la requête
0x30   | SUGGEST_REMAP  | remape le bloc (non encore implementé)
0x40   | SUGGEST_DIE    | laisser le noyau tomber en "panic"
0x80   | SUGGEST_SENSE  | lire le buffer SCSI du périphérique
0xff   | SUGGEST_IS_OK  | rien à faire


Page suivantePage précédenteTable des matières