Graphiques pour variables qualitatives avec la PROC GCHART

La procédure PROC GCHART permet de réaliser des graphiques tels que des histogrammes ou des camemberts, ou encore des diagrammes en blocs ou en étoiles, comme ceux réalisés par la PROC CHART mais en plus joli. Elle peut aussi réaliser des graphiques en 3D. Notons que l'idéal reste encore, lorsqu'on dispose d'une version assez récente de SAS, d'utiliser l'outil Graph 'n Go situé dans le menu Solutions - Reporting.

PROC GCHART data= <options> ;
  HBAR variables </options> ;
  VBAR variables </options> ;
  BLOCK variables </options> ;
  STAR variables </options> ;
  PIE variables </options> ;
  HBAR3D variables </options> ;
  VBAR3D variables </options> ;
  PIE3D variables </options> ;
  < BY variables ; >

Les instructions :

Les cinq premières instructions proposées ne sont pas toutes obligatoires. Il en faut juste au moins une. Elles servent à définir la liste des variables qualitatives sur lesquelles on souhaite faire des graphiques, ainsi que le type de graphique souhaité.

L'instruction HBAR réalise des histogrammes horizontaux, un par variable spécifiée. L'instruction VBAR réalise des histogrammes verticaux.
L'instruction BLOCK réalise des diagrammes par blocs et l'instruction STAR des diagrammes en étoiles.
Enfin, l'instruction PIE réalise des diagrammes circulaires (camemberts).
Les trois autres instructions parlent d'elles mêmes.

L'instruction BY a la même utilité que dans les autres procédures.

On peut aussi utiliser les instructions WHERE, LABEL et FORMAT.

Les options :

Mentionnons juste l'option GOUT= qui permet d'indiquer un catalogue dans lequel sauvegarder les graphiques.

Quelques options des instructions HBAR / HBAR3D / VBAR / VBAR3D :

L'option ascending (resp. descending) permet d'ordonner les bâtons dans l'ordre croissant (resp. décroissant) de leur taille.

L'option nozero permet de ne pas éditer les bâtons correspondant à une occurrence nulle de la modalité. Cela peut servir notamment en présence d'une instruction BY, lorsque les sous-groupes formés sont hétérogènes.

L'option subgroup= permet de faire des sous-groupes au sein d'un même histogramme.

L'option midpoints= permet de définir les valeurs qui doivent être au centre des blocs. Cela sert si la variable est numérique.

L'option outside= place des statistiques au-dessus des barres (seulement dans le cas d'un histogramme vertical).

outside=freq
la fréquence
outside=cfreq
la fréquence cumulée
outside=percent
le pourcentage
outside=cpercent
le pourcentage cumulé
outside=sum
la somme
outside=mean
la moyenne

L'option type= permet de préciser l'ordonnée du graphique. Par défaut, il s'agit de la fréquence. Mais on peut préférer la fréquence cumulée, le pourcentage ou le pourcentage cumulé. On peut également choisir de calculer la somme ou la moyenne d'une variable relatives aux différentes modalités envisagées. On ajoute alors une option sumvar= .
Par exemple, le graphique que l'on souhaite obtenir doit représenter le salaire moyen par catégorie socio-professionnelle : alors on écrit :

VBAR csp / sumvar=salaire type=mean ;

Il existe aussi de nombreuses options de mise en forme qu'on ne détaille pas ici.

Quelques options des instructions PIE / PIE3D :

L'option explode=nom_modalité permet de faire ressortir une part du camembert pour la mettre en valeur.

L'option other=p permet de regrouper les modalités dont le pourcentage est inférieur à p dans une catégorie autres.

On peut encore utiliser l'option subgroup. Il est alors possible d'utiliser l'option legend qui crée des légendes (afin de ne pas surcharger le diagramme).

Les options midpoints= , a-/de-scending, type= et sumvar= sont encore valables, et il y a là encore de nombreuses options relatives à la mise en forme.

Exemples :

proc gchart data=malib.bidon ;
 hbar distribution / sumvar=va type=mean ;
 pie zone / explode='IF' ;
run ;
diagramme en bâtons avec option sumvar diagramme circulaire avec option explode
proc gchart data=malib.bidon ;
 vbar distribution / ascending outside=percent ;
 pie zone / subgroup=distribution legend ;
run ;
diagramme en bâtons avec options ascending et outside diagramme circulaire avec options subgroup et legend