L'analyse des correspondances | |||
Page 4 sur 8 | Table des matières | Précédent | Suivant . |
|||
4. Fonctionnement de
l'analyse II |
|||
A. |
Dimensionnalité du problème . |
||
Nous observons un nuage qui represente un tableaux de
chiffres rectangulaire dont la somme en ligne (ou en colonne) est de 1 (pourcentages!). Ce
nuage de points est donc contenu dans une espace de dimension card(I)-1 ou card(J)-1,
celui des deux qui est le plus petit. Pour la suite de l'expose nous considererons que
I<J et donc que le probleme est de dimension card(I)-1. Dans notre exemple, la table
fait 8x12 et est donc contenue apres sa transformation en pourcent dans un espace à 7
dimensions. . |
|||
B. |
Principe géométrique . |
||
Fondamentalement, l'idee de
l'analyse factorielle et ici de l'analyse des correspondances, est que le nuage de points
que l'on veut decrire ne s'etend pas dans toutes les directions egalement, mais qu'au
contraire qu'il est deforme (car il y des affinites entre lignes et colonnes). On va donc
definir un nouveau systeme de repere orthogonal plus "economique". Plus précisement il s'agit de trouver pour un nuage de points N(I) (chaque point est determine par ses card(J) coordonees sur J, ou son profil sur J) la representation qui, dans une dimension aussi petite que possible soit aussi fidele que possible. Si nous voulons obtenir un graphique sur papier le probleme peut se formuler ainsi: determiner le sous espace L de dimension 2 passant par le centre de gravite du nuage (soit son profil moyen) qui maximise l'inertie de N(I) parallelement à L. Mais les programmes ne se contentent pas de deux dimension et nous donnent les card(I)-1 dimensions du problemes. Il nous faut pour cela etre plus general. . |
|||
C. |
Axes factoriels . |
||
Si l'on dénote par ![]() ![]() ![]() ![]() ![]() ![]() ![]() .
. A chaque axe est associee une valeur propre (ou eigenvalue) dont la somme vaut l'inertie du nuage (on l'appelle aussi trace d'une matrice detaillee dans l'appendice). Chaque valeur propre vaut au maximum 1. On voit immediatement que si N(I) n'avait qu'un point, il n'y aurait pas d'axes, si N(I) avait deux points, un seul axe; avec trois points nous aurions au plus deux axes perpendiculaires et pour n points au maximum card(J)-1 axes. . |
|||
D. |
Symétrie des deux analyses . |
||
Nous n'avons parle jusqu'alors que de l'analyse d'un des
côtes du tableau, les lignes, ou les colonnes sans preciser. Soit on projette les
points-lignes dans l'espace des communes à 11 dimensions, soit on projette les
points-colonnes dans l'espace des formations à 7 dimensions. Nous obtiendrons donc deux
representation de deux nuages. Mais ces representations sont-elles differentes?En fait,
les deux analyses sont symetriques, et de trois manieres : .
Les statisticiens ont donc decides de confondre les deux
systemes d'axes factoriels issus des deux analyses et de representer les points sur le
meme graphe. L'algorithme represente les points (voir plus bas comment) dans l'espace
engendre par les k premiers axes factoriels. La distance entre les points sera,
representee dans l'espace Euclidien de la feuille, une distance de En plus des graphiques, les logiciels nous fournisse de quoi repondre aux questions du scientifique telles que : Quelle part de l'inertie totale les k premiers axes decrivent-ils? Quelle part de la variation d'un point donne est rendue par tel graphique? Quels sont les contribution des points à la construction du systeme d'axe? . |
|||
L'analyse
des correspondances
La homepage de François Micheloud