Aller au contenu

Help Please Sur Les Statistiques


Invité titi91

Messages recommandés

Posté(e)

Coucou tt le monde!

G un ptit probl sur les statistiques. :(

J'aimerais savoir comment on calcule la variance et la covariance et à quoi ça sert .

Jvous remerci davance B)

Posté(e)

bonjour,

Lorsque tu étudies une série de données, tu as à ta disposition plusieurs outils.

la moyenne te donnera la valeur autour de laquelle sont ces données.

la moyenne est un paramètre de position.

(ce n'est pas un scoop!)

mais cela ne suffit pas puisque tu peux très bien considérer 2 séries stat qui ont la même moyenne mais qui sont différentes.

ex:

2,3,10,17,18 et 7,8,10,12,13

ont la même moyenne mais ne sont pas réparties de la même manière : une est dispersée l'autre pas.

On peut alors aller plus loin dans la description.

voici donc un autre paramètre à calculer qui va te donner un indice supplémentaire sur la série : la variance.

une fois la moyenne calculée, on cherche à savoir de combien (en moyenne) les valeurs s'écartent de cette moyenne m.

on appelle ça l'écart moyen et il vaut:

e(X)=somme(m-x_i;i=1..n)/n

cependant comme on préfère les nombres positifs, on va plutôt calculer la moyenne des carrés des écarts : la variance.

la variance est un paramètre de dispersion.

dans tout cours tu pourras trouver:

si X est un caractère qui prend des valeurs x_i, la variance de X est le nombre:

V(X)=somme((m-x_i)²;i=1..n)/n

on montre que:

V(X) est aussi la moyenne des carrés moins le carré de la moyenne

V(X)=somme(x_i²;i=1..n)/n-m²

remarque: la racine carrée de V(X) s'appelle l'écart type : sx=:sqrt:V(X)

ce qui est bien avec l'écart type c'est qu'il s'exprime dans la même unité que X contrairement à V(X) dont les unités sont au carré.

Lorsque tu as une série stat double (bidimentionnelle) (X,Y) prenant des valeurs (x_i,y_i), tu peux calculer les moyennes (mx et my) et variances pour chaque série X et Y.

Il y a un plus encore ici : la covariance.

C'est un paramètre de dispersion entre X et Y.

Il permet de savoir si X et Y sont liées ou indépendantes.

cov(X,Y)=somme((mx-x_i)(my-y_i);i=1..n)/n

on montre que:

la covariance est la moyenne du produit moins le produit des moyennes

cov(X,Y)=somme(n_i.y_i;i=1..n)/n-mx.my

on sait que:

si X et Y sont indépendantes alors cov(X,Y)=0.

la réciproque est fausse!

un plus: la coefficient de corrélation linéaire r.

on peut introduire le nombre

r=cov(X,Y)/[sx.sy] où sx et sy sont les écarts types de X et Y

-1<=r<=1

lorsque r=+/-1 alors les variables X et Y sont fortement corrélées : il existe alors une liaison linéaire entre les séries.

voilà!

Archivé

Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.

×
×
  • Créer...
spam filtering
spam filtering