Intervalles |
1. autour de l’estimateur alors permet de savoir la représentativité de L’erreur type 2. intervalle de confiance autour h0 pour tests statistiques |
3.29 = 0.001 |
1. Petit échantillon : ok car très rare (20 particip alors 0.02) Mais si grand chantillon va falloir que j'augmente 3.29 selon N on choisit un score Z |
Impact test T |
Si N diminue , puissance diminue Si on ramène une val extreme à 3.29 , on augmente la puissance stat (car diminue l'écart-type) - On rejette H0 plus facilement |
Inspection graphique des scores extrêmes : Histogramme et boite à moustache |
Bas de la boite: 1er quartile Haut de la boîte : 3e quartile Moustache du bas = Minimum (excluant valeurs aberrantes/extrêmes) Moustache du haut = Maximum (excluant valeurs aberrantes/extrêmes) Cercle (°) = Donnée aberrante (distance minimum de 1.5 boîtes de la médiane) Astérisque (*) : val extreme (distance minimum de 3 boîtes de la médiane) |
Scores Z dans un distribution normale |
Dans une distribution normale, on s’attend à avoir : A. 0.1% des données dont 𝑧 >3.29 B.1.0% des données dont 𝑧 > 2.58 C. 5.0% des données dont 𝑧 > 1.96 |
Comment gérer les données extrêmes ? |
1. Supprimer la donnée 2. Suprimer le participant 3. Remplacer par une valeur qui correspond à 3.29 (score z) |
Puissance statistique |
Probabilité de rejeter H0 si Ho est fausse |
Comment les données extrêmes influencent l'erreur type (et tests statistique)s |
1. Surestimer l'erreur type 2. Erreur type = bruit , donc diminue la puissance du test statistique (rejet H0 plus difficile) |
Plus mon test t est fort... |
plus c’est fort , plus jepeux rejetter facilement PLUS T EST PUISSANT PLUS C’EST FACILE DE DÉPASSER LA VALEUR CRITIQUE |
2.39 < 2.78 ⇒ On ne rejette pas H0 𝑐𝑎𝑟 𝑜𝑛 𝑎𝑢𝑟𝑎𝑖𝑡 𝑢𝑛𝑒 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡é 𝑠𝑢𝑝é𝑟𝑖𝑒𝑢𝑟𝑒 à 5% 𝑑𝑒𝑠𝑒𝑡𝑟𝑜𝑚𝑝𝑒𝑟𝑠𝑖𝐻0 𝑒𝑠𝑡𝑣𝑟𝑎𝑖𝑒. |
Données manquantes |
Éliminer de l’échantillon les sujets ayant des données manquantes. 2 Éliminer d’une analyse les sujets ayant des données manquantes. 3 Remplacer les données manquantes par la moyenne de l’échantillon. |
Qu'est-ce qui se passe si je remplace une donnée manquante par la moy |
1. ADiminue ecart-type, SE diminue, score du test augmente |
Postulats de base |
1. Additivité et linéarité |
2. Normalité : importance pour estimation des paramètres |
SI la distribution des fréquences dans l’échantillon est normale, ALORS la somme des carrés de l’erreur (SC) permettra d’estimer les valeurs des paramètres de manière optimale |
2.1 : Normalité (Asymétrie et aplatissement) |
Asymétrie : Si asymétrie = 0 => parfaitement symétrique Ø Si asymétrie < 0 => asymétrie négative (queue plus longue à gauche) Ø Si asymétrie > 0 => asymétrie positive (queue plus longue à droite) Si kurtosis = 0 => aplatissement normal (mésokurtique) Si kurtosis < 0 => aplatissement négatif (platykurtique) => variance élevée Si kurtosis > 0 => aplatissement positif (leptokurtique) => variance faible |
2.4 : Normalité ( test de normalité) H0 : Asymétrie = 0, Kurtosis = 0 |
Problèmes: SI la taille de l’échantillon est faible, ALORS le test est rarement assez puissant pour détecter la non-normalité. SI la taille de l’échantillon est très grande, ALORS le test est trop sensible et rejette l’hypothèse nulle (la normalité) trop facilement. Ø Or, le théorème central limite suggère de toute façon qu’avec un grand échantillon, la distribution d’échantillonnage, elle, est normale. En général, on n’utilise donc pas ces tests (ex. Test de Kolmogorov-Smirnov). |
Prob avec hétésceda |
Biaise estimation de l'erreur type |
Created By
Metadata
Comments
No comments yet. Add yours below!
Add a Comment
Related Cheat Sheets