Cheatography https://cheatography.com

Download This Cheat Sheet (PDF)

Comments
Rating: ()

Examen 1 Cheat Sheet by mbr

Cours 1

Paramètres, Estimation de paramètres, Erreur type, Intervalle de confiance et test staitisuqes	Modèle = prédiction de la donnée composé de paramètres (ex :b0) - caractériser la population
Estimer des paramètres
1. Erreur totale	On fait la différence entre la vrai valeure et celle qu'on estime (y-ychap) prob : valeurs + et - s'annulent
2. Somme des carrés (SC)	Donne la valeur la plus représentative de l'échantillon la valeur de b0 qui minime SC = moyenne
3. Carré moyen (donne la représentativité face à l'échantillon)	Carré moyen est l'équivalent de la variance ( s carré) Écart type = racine de la variance (donc =s) deg de lib = N - # de paramètres
Erreur-type (SE)
représentativité de notre estimateur face à la population	+ N augmente , + écart-type surestime l'erreur type Variablité dans la distribution normale Mais la variabili dans la distribution d'échantillonnage
Intervalle de confiance
Distribution de probabilité	Distribution de probabilité totale Distribution d'échantillonnage = distribution des probablités d'obtenir tous les échantillons possibles (Obtenir toutes les moyennes possibles)
À quoi ressemble une distribution d'échantillonnage	Théorie des erreurs 1. # de causes = très grand 2. chq cause peut réussi ou échouer 3.probabilité de succès ou échec n'est pas êtres (0 ou1)
À quoi sert SE	Nous savons maintenant que si la distribution d’échantillonnage est distribuée normalement, alors connaître l’erreur type nous permet de cibler un intervalle de valeurs à l’intérieur duquel 95% des moyennes d’échantillons se trouveront Aussi, si on ne connaît pas la valeur réelle de la moyenne de la population, on sait alors néanmoins que si l’on tirait une infinité d’échantillons, 95 % de ces échantillons nous permettraient de calculer un intervalle de confiance incluant la valeur réelle de la moyenne de la population
Test d'hypothèse
Pour contrer à l'erreur d'échantillonnage on fait stats inférentielles (inductives)	Test stats inférentielles qui sont dites ''inductives''
induction vs deduction	Induction : on part des observations pour déterminer c’est quoi la loi générale Déduction : partir d'une loi générale pour déduire ce que je vais observer
Erreur de type 1	Rejetter H0 alors qu'elle est vraie.
pourquoi onf ait un test bilatéral et non unilatéral si on peut pas s’appuyer sur littérature :	unilatéral a droite et a gauche : l’erreur s’additionne et on fini avec une erreur à 10% (zone de rejet) au lieu de 5% (bilatéral est plus conservateur)

Cours 3

Intervalles	1. autour de l’estimateur alors permet de savoir la représentativité de L’erreur type 2. intervalle de confiance autour h0 pour tests statistiques
3.29 = 0.001	1. Petit échantillon : ok car très rare (20 particip alors 0.02) Mais si grand chantillon va falloir que j'augmente 3.29 selon N on choisit un score Z
Impact test T	Si N diminue , puissance diminue Si on ramène une val extreme à 3.29 , on augmente la puissance stat (car diminue l'écart-type) - On rejette H0 plus facilement
Inspection graphique des scores extrêmes : Histogramme et boite à moustache	Bas de la boite: 1er quartile Haut de la boîte : 3e quartile Moustache du bas = Minimum (excluant valeurs aberrantes/extrêmes) Moustache du haut = Maximum (excluant valeurs aberrantes/extrêmes) Cercle (°) = Donnée aberrante (distance minimum de 1.5 boîtes de la médiane) Astérisque (*) : val extreme (distance minimum de 3 boîtes de la médiane)
Scores Z dans un distribution normale	Dans une distribution normale, on s’attend à avoir : A. 0.1% des données dont 𝑧 >3.29 B.1.0% des données dont 𝑧 > 2.58 C. 5.0% des données dont 𝑧 > 1.96
Comment gérer les données extrêmes ?	1. Supprimer la donnée 2. Suprimer le participant 3. Remplacer par une valeur qui correspond à 3.29 (score z)
Puissance statistique	Probabilité de rejeter H0 si Ho est fausse
Comment les données extrêmes influencent l'erreur type (et tests statistique)s	1. Surestimer l'erreur type 2. Erreur type = bruit , donc diminue la puissance du test statistique (rejet H0 plus difficile)
Plus mon test t est fort...	plus c’est fort , plus jepeux rejetter facilement PLUS T EST PUISSANT PLUS C’EST FACILE DE DÉPASSER LA VALEUR CRITIQUE
2.39 < 2.78 ⇒ On ne rejette pas H0 𝑐𝑎𝑟 𝑜𝑛 𝑎𝑢𝑟𝑎𝑖𝑡 𝑢𝑛𝑒 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡é 𝑠𝑢𝑝é𝑟𝑖𝑒𝑢𝑟𝑒 à 5% 𝑑𝑒𝑠𝑒𝑡𝑟𝑜𝑚𝑝𝑒𝑟𝑠𝑖𝐻0 𝑒𝑠𝑡𝑣𝑟𝑎𝑖𝑒.
Données manquantes	Éliminer de l’échantillon les sujets ayant des données manquantes. 2 Éliminer d’une analyse les sujets ayant des données manquantes. 3 Remplacer les données manquantes par la moyenne de l’échantillon.
Qu'est-ce qui se passe si je remplace une donnée manquante par la moy	1. ADiminue ecart-type, SE diminue, score du test augmente
Postulats de base
1. Additivité et linéarité
2. Normalité : importance pour estimation des paramètres	SI la distribution des fréquences dans l’échantillon est normale, ALORS la somme des carrés de l’erreur (SC) permettra d’estimer les valeurs des paramètres de manière optimale
2.1 : Normalité (Asymétrie et aplatissement)	Asymétrie : Si asymétrie = 0 => parfaitement symétrique Ø Si asymétrie < 0 => asymétrie négative (queue plus longue à gauche) Ø Si asymétrie > 0 => asymétrie positive (queue plus longue à droite) Si kurtosis = 0 => aplatissement normal (mésokurtique) Si kurtosis < 0 => aplatissement négatif (platykurtique) => variance élevée Si kurtosis > 0 => aplatissement positif (leptokurtique) => variance faible
2.4 : Normalité ( test de normalité) H0 : Asymétrie = 0, Kurtosis = 0	Problèmes: SI la taille de l’échantillon est faible, ALORS le test est rarement assez puissant pour détecter la non-normalité. SI la taille de l’échantillon est très grande, ALORS le test est trop sensible et rejette l’hypothèse nulle (la normalité) trop facilement. Ø Or, le théorème central limite suggère de toute façon qu’avec un grand échantillon, la distribution d’échantillonnage, elle, est normale. En général, on n’utilise donc pas ces tests (ex. Test de Kolmogorov-Smirnov).
Prob avec hétésceda	Biaise estimation de l'erreur type

Download the Examen 1 Cheat Sheet

3 Pages

PDF (recommended)

PDF (3 pages)

Alternative Downloads

Created By

mbr

Metadata

Languages: français (French)

Published: 15th February, 2020

Comments

No comments yet. Add yours below!

Add a Comment

Related Cheat Sheets

Introduction to Regression in R Cheat Sheet

Latest Cheat Sheet

2 Pages

(0)

Old British and Medieval Literature Cheat Sheet

A summary of Old British Literature

10 Jul 25

english, literature, lit

Random Cheat Sheet

4 Pages

(0)

C++ Graph Theory Sample Cheat Sheet

Some sample graph theory code that can be used

21 Aug 19, updated 27 Dec 19

About Cheatography

Cheatography is a collection of 6766 cheat sheets and quick references in 25 languages for everything from food to business!

Behind the Scenes

If you have any problems, or just want to say hi, you can find us right here:

Recent Cheat Sheet Activity

Charles Duarte updated UV Cheatsheet.
5 hours 43 mins ago

karlaxcr published Old British and Medieval Literature.
2 days 13 hours ago

Tamaranth updated Minecraft Item IDs.
5 days 22 hours ago

Elf Fatmawati updated Git.
1 week 2 days ago

Awfki updated Syslog.
1 week 3 days ago

© 2011 - 2025 Cheatography.com | CC License | Terms | Privacy

Latest Cheat Sheets RSS Feed