Une étape DATA est un programme de syntaxe :
qui manipule les données de la table de nom table située dans la librairie lib. Si aucune librairie n'est spécifiée, la table est dans la librairie par défaut : work.
Le fonctionnement d'un tel programme s'effectue par le biais du vecteur de travail. L'étape DATA travaille ligne par ligne.
Explicitons le principe de l'étape DATA à l'aide de l'instruction de recopie de tables : SET.
Soit le programme suivant :
DATA a : Une table a est créée.
SET b : La première ligne de la table b est placée dans le vecteur de travail.
RUN : Marque la fin du programme et son exécution. C'est à ce moment (et pas avant) que le contenu du vecteur de travail est enregistré dans la table a, ligne 1.
Puis, tant qu'il reste des observations dans la table b, l'opération est répétée.
On n'insiste jamais assez sur l'importance des points virgule.
Ils indiquent à SAS la fin d'une instruction.
Admettons que dans l'exemple ci-dessus on omette le premier ;
Alors SAS comprend qu'il doit créer trois tables nommées a, set et b !