MA 461: cours de statistiques descriptives avec Excel

COURS DE STATISTIQUE DESCRIPTIVE AVEC EXCEL

 

 

Filière : Technologies de l’Information et de la Communication

 

Niveau : 4

 


Introduction générale

 

 

Chapitre1 : Tableaux et graphes

 

I.1 Tableaux

I.1.1 Tableaux de fréquences à un caractère ( cas discret et cas continu)

I.1.2 Tableaux de fréquences cumulées

I.1.3 Tableaux de fréquence à deux caractères (cas où les deux variables sont discrètes, cas où l’une des deux variable est continue, cas où les deux variables sont continues)

I.1.4 Règles générales relatives à la présentation des tableaux

 

I.2 Représentations graphiques

I.2.1 Cas des graphiques cartésiens

I.2.1.1 Caractère discontinu. Diagramme en bâton

I.2.2.2 Caractère continu. Histogramme, polygone cumulatif (cas croissant, cas décroissant)

I.2.2 Cas des graphiques non cartésiens

I.2.2.1 diagramme en secteur

            I.2.2.2 Coordonnées polaires

            I.2.2.3 Coordonnées logarithmiques

 

Chapitre2: analyse d’une distribution de fréquences

 

II.1.Paramètres de position

            Les moyennes (arithmétique, géométrique, harmonique) la médiane, la médiale

 

II.2 Paramètres de dispersion

            La variance, l’écart type, l’écart moyen arithmétique, l’étendue, le coefficient de variation, l’intervalle interquartile, l’indice de concentration.

 

Chapitre 3 : ajustement linéaire, corrélation et indépendance des facteurs

            III.1 Coefficient de corrélation entre deux variables

            III.2 Mise en évidence graphique de l’existence d’une corrélation entre deux variables

            III.3 Mesure de la corrélation. Coefficient de dépendance

            III.4 Mesure de la corrélation. Coefficient de corrélation linéaire

            III.5 Le modèle de régression linéaire et la méthode des moindres carrés ordinaires

III.6  Analyse de l’indépendance entre deux caractères qualitatifs

 

Chapitre 4: indices et taux de croissance

IV.1 Définition et notion d’un indice simple (ou indice élémentaire)

IV.2 Indices synthétiques cou composés

IV.3 Réversibilité d’un indice

IV.4 Transférabilité d’un indice

 

Chapitre 5 : séries chronologiques

            V.1 Définition. Composante d’une série chronologique

            V.2 Analyse d’une série chronologique

            V.3 Recherche de la tendance ou Trend

            V.4 Etude de l’influence saisonnière

            V.5 Essai de prévision

            V.6 Comparaison de séries chronologiques

            V.7 Covariation de deux séries chronologiques

 

 

Bibliographie

           

Walder Masiéri, Statistique et Calcul des probabilités, DALLOZ , 2001


 

Introduction générale et mise en place des concepts.

 

Définition de la Statistique (Walder Masiéri)

 

On appelle «Statistiques» (au pluriel), des collections de chiffres souvent présentées sous forme de tableaux ou de graphiques, et qui regroupent toutes les informations effectuées sur des faits nombreux et relatifs à un même phénomène.

«La Statistique» au singulier est l’ensemble des procédés ou des méthodes qui auraient pour but l’étude mathématique des statistiques.

 

La statistique descriptive est un ensemble de méthodes permettant de dégager les caractéristiques ou la répartition d’une collection d’objet en fonction de critères d’études déterminés. Il s’agit  de  classer les données, les décrire, "les faire parler

Les données sont résumées à l'aide de paramètres, synthétisées au moyen de tableaux et de graphiques. Dans cette étape, on se limite à l'espace de ses données.

Cependant, on peut aussi, à partir d’un échantillon statistique, prévoir les caractéristiques de l’ensemble de la population : c’est la statistique inférentielle qui dépasse le cadre de ce cours.

 

L’objectif de ce cours est de :

Doter les apprenants des outils théoriques, et pratiques sur Excel, ainsi qu’un langages précis pour conduire les analyses statistiques de base à partir d’un jeux de données brut ou présenté sous forme de tableaux.

 

Notions de bases

 

La population: collection d’objets ou de personnes étudiés.

 

Exemple 1: On se donne pour objectif de connaître la taille moyenne de étudiants de l’ENS La population sera constituée par l’ensemble des étudiants de l’ENS.

 

Individu statistique: un objet ou  une personne sur lesquels porte l’étude

 

Caractère: les caractères sont les critères étudiés.

            Dans l’exemple 1 le caractère est la taille

 

Caractère quantitatif : caractère qui prend des valeurs numériques (exemple : la taille)

 

Caractère continu: caractère quantitatif  qui peut prendre toutes les valeurs numériques d’un intervalle déterminé.

 

Caractère discret: caractère quantitatif qui ne peut prendre que des valeurs isolées dans un intervalle.

 

Exemple: le nombre

de pièces dans une habitation ne peut prendre que les valeurs  entières.

 

 

Echantillon: partie de la population sur laquelle porte l’étude

 

Effectif ou fréquence absolue associée à une valeur d’un caractère: le nombre de fois où cette valeur du caractère est observée

 

Fréquence relative associée à une valeur de caractère: rapport de la fréquence absolue correspondant à cette valeur du caractère  sur le nombre d’individus de la population

 

Distribution statistique associée à un caractère: l’ensemble des couples constitués par les valeurs des caractères et les fréquences absolue ou relatives correspondantes. Supposons en effet que l’on on étudie sur une population P de taille N donnée un caractère X. On fait l’hypothèse que la collecte des données a produit les valeurs distinctes suivantes de X. x1, x2, .xr. On suppose que chaque xi a été observé ni fois. La distribution statistique est dont l’ensemble {(xi,ni), i=1,…..r} ( on a forcément r < N)

 

Modalité d’un caractère: différentes valeurs que peut prendre ce caractère.

 

La démarche statistique.

            Elle comprend cinq (06)  phases.

  • La définition des objectifs de l’étude: que désire on étudier?
  • Une phase matérielle où il s’agit de rassembler les données. La collecte des données peut se faire à partir d’un questionnaire d’enquête papier où sont consignés l’ensemble des caractères d’intérêts. Avec le développement des TIC, on dispose désormais de questionnaires électroniques. Dans ce cas la phase de collecte des données et la phase suivante de saisie sont liées.
  • Une phase de saisie des données. À ce niveau on peut être amené à concevoir une base de données doublée d’une interfaçe pour faciliter la saisie des données. Les programmes suivants sont très souvent utilisés: ACCESS, CSPRO, EPI info (orienté originellement pour des études épidémiologiques). Dans une moindre mesure excel peut être utilisé.
  • Une phase de vérification des données. En effet, la saisie des données est très souvent entachée d’erreurs. S’assurer de la conformité entre les données collectées et celles qui sont saisies permet de garantir la qualité des statistiques produites.
  • Une phase descriptive qui consiste à réduire les données en un nombre limité de paramètres susceptibles de décrire la série statistique. À ce niveau on a généralement recours à un logiciel de traitement statistique. Exemple : Excel, SPSS, STATA, SAS, R etc.
  • Une phase inductive qui dépasse le cadre de ce cours. Si on travaille sur un échantillon qui permet de déduire les résultats obtenus sur l’échantillon des conclusions  relatives à l’ensemble de la population. Ces conclusions devront tenir compte de la marge d’erreur due au fait que les données sont partielles. C’est la statistique inductive

 


 

CHAPITRE 1: TABLEAUX ET GRAPHIQUES

 

Avertissement : les données utilisées sont des données simulées, sauf avis contraire

 

I.1. Tableaux

 

I.1.1 Tableau de fréquences à un caractère

 

a) Le tableau le plus simple

 

Le tableau de fréquences à un caractère est la représentation d’une distribution statistique. Il établit la correspondance entre deux séries : les valeurs du caractère, et les effectifs correspondants, ou les fréquences relatives correspondantes.

 

Exemple 1: On étudie la distribution d’une population de 200 personnes selon le sexe. On s’intéresse aux effectifs absolue

 

Sexe

Hommes

Femmes

Total

Effectifs/fréquences

Absolues

160

40

200

 

Exemple 2: On étudie la distribution d’une population de 200 personnes par sexe. On s’intéresse aux effectifs relatifs.

 

Sexe

Hommes

Femmes

Total

Fréquences relatives

0,8

0,2

1

 

 

b) Le tableau des effectifs ou des fréquences cumulées.

            Un tableau de fréquences à un caractère peut être présenté sous une forme dite cumulée. Le cumul peut se faire de deux manières suivantes : cumul par valeur inférieur, cumul par valeur supérieur. Pour calculer le tableau des fréquences cumulées croissantes, on associe à chaque modalité xi, le nombre d’individus qui ont pris une modalité inférieure à xi. Pour calculer le tableau des fréquences cumulées décroissantes, on associe à chaque modalité xi, le nombre d’individus qui ont pris une modalité  supérieure ou égale à xi

 

Exemple 3: Fréquences cumulées croissantes et décroissantes

            On s’intéresse à l’âge des individus (personnes) d’une population de 200 personnes. Le tableau de fréquences à un caractère correspondant est le suivant. On s’intéresse au tableau des fréquences cumulées.

 

Tableau présentant la distribution des individus par âge

 

Age

18

19

20

21

22

23

24

25

26

27

28

29

Total

Fréquence absolue

12

15

30

20

30

12

10

18

25

20

5

3

200

 

 

 

 

 

 

 

Tableau présentant les fréquences absolues cumulées croissantes

 

Age

18

19

20

21

22

23

24

25

//

27/10/2009
0 Poster un commentaire

A découvrir aussi


Inscrivez-vous au blog

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 13 autres membres