L'étape DATA

Une étape DATA est un programme de syntaxe :

DATA lib.table ;
[instructions] ;
RUN ;

qui manipule les données de la table de nom table située dans la librairie lib. Si aucune librairie n'est spécifiée, la table est dans la librairie par défaut : work.

Le fonctionnement d'un tel programme s'effectue par le biais du vecteur de travail. L'étape DATA travaille ligne par ligne.

Explicitons le principe de l'étape DATA à l'aide de l'instruction de recopie de tables : SET.

Soit le programme suivant :

DATA a ;
 SET b ;
RUN;

DATA a : Une table a est créée.
SET b : La première ligne de la table b est placée dans le vecteur de travail.
RUN : Marque la fin du programme et son exécution. C'est à ce moment (et pas avant) que le contenu du vecteur de travail est enregistré dans la table a, ligne 1.
Puis, tant qu'il reste des observations dans la table b, l'opération est répétée.

On n'insiste jamais assez sur l'importance des points virgule. Ils indiquent à SAS la fin d'une instruction.
Admettons que dans l'exemple ci-dessus on omette le premier ;
Alors SAS comprend qu'il doit créer trois tables nommées a, set et b !


La logique "ligne par ligne" de l'étape DATA

Tableau récapitulatif des opérateurs

Recopie d'une table - Sélection de variables et d'observations

Les attributs des variables

Fusion et concaténation de tables

Boucles DO et conditions IF

Les fonctions SAS

Calculs de variables

Arrays (tableaux de variables)

Gestion des erreurs et arrêt conditionnel d'une étape DATA

Etape DATA sans création de table