MA 461: cours de statistiques descriptives avec Excel
COURS DE STATISTIQUE DESCRIPTIVE AVEC EXCEL
Filière : Technologies de l’Information et de la Communication
Niveau : 4
Introduction générale
Chapitre1 : Tableaux et graphes
I.1 Tableaux
I.1.1 Tableaux de fréquences à un caractère ( cas discret et cas continu)
I.1.2 Tableaux de fréquences cumulées
I.1.3 Tableaux de fréquence à deux caractères (cas où les deux variables sont discrètes, cas où l’une des deux variable est continue, cas où les deux variables sont continues)
I.1.4 Règles générales relatives à la présentation des tableaux
I.2 Représentations graphiques
I.2.1 Cas des graphiques cartésiens
I.2.1.1 Caractère discontinu. Diagramme en bâton
I.2.2.2 Caractère continu. Histogramme, polygone cumulatif (cas croissant, cas décroissant)
I.2.2 Cas des graphiques non cartésiens
I.2.2.1 diagramme en secteur
I.2.2.2 Coordonnées polaires
I.2.2.3 Coordonnées logarithmiques
Chapitre2: analyse d’une distribution de fréquences
II.1.Paramètres de position
Les moyennes (arithmétique, géométrique, harmonique) la médiane, la médiale
II.2 Paramètres de dispersion
La variance, l’écart type, l’écart moyen arithmétique, l’étendue, le coefficient de variation, l’intervalle interquartile, l’indice de concentration.
Chapitre 3 : ajustement linéaire, corrélation et indépendance des facteurs
III.1 Coefficient de corrélation entre deux variables
III.2 Mise en évidence graphique de l’existence d’une corrélation entre deux variables
III.3 Mesure de la corrélation. Coefficient de dépendance
III.4 Mesure de la corrélation. Coefficient de corrélation linéaire
III.5 Le modèle de régression linéaire et la méthode des moindres carrés ordinaires
III.6 Analyse de l’indépendance entre deux caractères qualitatifs
Chapitre 4: indices et taux de croissance
IV.1 Définition et notion d’un indice simple (ou indice élémentaire)
IV.2 Indices synthétiques cou composés
IV.3 Réversibilité d’un indice
IV.4 Transférabilité d’un indice
Chapitre 5 : séries chronologiques
V.1 Définition. Composante d’une série chronologique
V.2 Analyse d’une série chronologique
V.3 Recherche de la tendance ou Trend
V.4 Etude de l’influence saisonnière
V.5 Essai de prévision
V.6 Comparaison de séries chronologiques
V.7 Covariation de deux séries chronologiques
Bibliographie
Walder Masiéri, Statistique et Calcul des probabilités, DALLOZ , 2001
Introduction générale et mise en place des concepts.
Définition de la Statistique (Walder Masiéri)
On appelle «Statistiques» (au pluriel), des collections de chiffres souvent présentées sous forme de tableaux ou de graphiques, et qui regroupent toutes les informations effectuées sur des faits nombreux et relatifs à un même phénomène.
«La Statistique» au singulier est l’ensemble des procédés ou des méthodes qui auraient pour but l’étude mathématique des statistiques.
La statistique descriptive est un ensemble de méthodes permettant de dégager les caractéristiques ou la répartition d’une collection d’objet en fonction de critères d’études déterminés. Il s’agit de classer les données, les décrire, "les faire parler
Les données sont résumées à l'aide de paramètres, synthétisées au moyen de tableaux et de graphiques. Dans cette étape, on se limite à l'espace de ses données.
Cependant, on peut aussi, à partir d’un échantillon statistique, prévoir les caractéristiques de l’ensemble de la population : c’est la statistique inférentielle qui dépasse le cadre de ce cours.
L’objectif de ce cours est de :
Doter les apprenants des outils théoriques, et pratiques sur Excel, ainsi qu’un langages précis pour conduire les analyses statistiques de base à partir d’un jeux de données brut ou présenté sous forme de tableaux.
Notions de bases
La population: collection d’objets ou de personnes étudiés.
Exemple 1: On se donne pour objectif de connaître la taille moyenne de étudiants de l’ENS La population sera constituée par l’ensemble des étudiants de l’ENS.
Individu statistique: un objet ou une personne sur lesquels porte l’étude
Caractère: les caractères sont les critères étudiés.
Dans l’exemple 1 le caractère est la taille
Caractère quantitatif : caractère qui prend des valeurs numériques (exemple : la taille)
Caractère continu: caractère quantitatif qui peut prendre toutes les valeurs numériques d’un intervalle déterminé.
Caractère discret: caractère quantitatif qui ne peut prendre que des valeurs isolées dans un intervalle.
Exemple: le nombre
de pièces dans une habitation ne peut prendre que les valeurs entières.
Echantillon: partie de la population sur laquelle porte l’étude
Effectif ou fréquence absolue associée à une valeur d’un caractère: le nombre de fois où cette valeur du caractère est observée
Fréquence relative associée à une valeur de caractère: rapport de la fréquence absolue correspondant à cette valeur du caractère sur le nombre d’individus de la population
Distribution statistique associée à un caractère: l’ensemble des couples constitués par les valeurs des caractères et les fréquences absolue ou relatives correspondantes. Supposons en effet que l’on on étudie sur une population P de taille N donnée un caractère X. On fait l’hypothèse que la collecte des données a produit les valeurs distinctes suivantes de X. x1, x2, .xr. On suppose que chaque xi a été observé ni fois. La distribution statistique est dont l’ensemble {(xi,ni), i=1,…..r} ( on a forcément r < N)
Modalité d’un caractère: différentes valeurs que peut prendre ce caractère.
La démarche statistique.
Elle comprend cinq (06) phases.
- La définition des objectifs de l’étude: que désire on étudier?
- Une phase matérielle où il s’agit de rassembler les données. La collecte des données peut se faire à partir d’un questionnaire d’enquête papier où sont consignés l’ensemble des caractères d’intérêts. Avec le développement des TIC, on dispose désormais de questionnaires électroniques. Dans ce cas la phase de collecte des données et la phase suivante de saisie sont liées.
- Une phase de saisie des données. À ce niveau on peut être amené à concevoir une base de données doublée d’une interfaçe pour faciliter la saisie des données. Les programmes suivants sont très souvent utilisés: ACCESS, CSPRO, EPI info (orienté originellement pour des études épidémiologiques). Dans une moindre mesure excel peut être utilisé.
- Une phase de vérification des données. En effet, la saisie des données est très souvent entachée d’erreurs. S’assurer de la conformité entre les données collectées et celles qui sont saisies permet de garantir la qualité des statistiques produites.
- Une phase descriptive qui consiste à réduire les données en un nombre limité de paramètres susceptibles de décrire la série statistique. À ce niveau on a généralement recours à un logiciel de traitement statistique. Exemple : Excel, SPSS, STATA, SAS, R etc.
- Une phase inductive qui dépasse le cadre de ce cours. Si on travaille sur un échantillon qui permet de déduire les résultats obtenus sur l’échantillon des conclusions relatives à l’ensemble de la population. Ces conclusions devront tenir compte de la marge d’erreur due au fait que les données sont partielles. C’est la statistique inductive
CHAPITRE 1: TABLEAUX ET GRAPHIQUES
Avertissement : les données utilisées sont des données simulées, sauf avis contraire
I.1. Tableaux
I.1.1 Tableau de fréquences à un caractère
a) Le tableau le plus simple
Le tableau de fréquences à un caractère est la représentation d’une distribution statistique. Il établit la correspondance entre deux séries : les valeurs du caractère, et les effectifs correspondants, ou les fréquences relatives correspondantes.
Exemple 1: On étudie la distribution d’une population de 200 personnes selon le sexe. On s’intéresse aux effectifs absolue
Sexe |
Hommes |
Femmes |
Total |
Effectifs/fréquences Absolues |
160 |
40 |
200 |
Exemple 2: On étudie la distribution d’une population de 200 personnes par sexe. On s’intéresse aux effectifs relatifs.
Sexe |
Hommes |
Femmes |
Total |
Fréquences relatives |
0,8 |
0,2 |
1 |
b) Le tableau des effectifs ou des fréquences cumulées.
Un tableau de fréquences à un caractère peut être présenté sous une forme dite cumulée. Le cumul peut se faire de deux manières suivantes : cumul par valeur inférieur, cumul par valeur supérieur. Pour calculer le tableau des fréquences cumulées croissantes, on associe à chaque modalité xi, le nombre d’individus qui ont pris une modalité inférieure à xi. Pour calculer le tableau des fréquences cumulées décroissantes, on associe à chaque modalité xi, le nombre d’individus qui ont pris une modalité supérieure ou égale à xi
Exemple 3: Fréquences cumulées croissantes et décroissantes
On s’intéresse à l’âge des individus (personnes) d’une population de 200 personnes. Le tableau de fréquences à un caractère correspondant est le suivant. On s’intéresse au tableau des fréquences cumulées.
Tableau présentant la distribution des individus par âge
Age |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
Total |
Fréquence absolue |
12 |
15 |
30 |
20 |
30 |
12 |
10 |
18 |
25 |
20 |
5 |
3 |
200 |
Tableau présentant les fréquences absolues cumulées croissantes
Age |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
//
A découvrir aussi
Retour aux articles de la catégorie les cours -
⨯
Inscrivez-vous au blogSoyez prévenu par email des prochaines mises à jour Rejoignez les 13 autres membres |