Future City Lab: Statistiques du quartier

Statistiques du chi carré

Interdisciplinaire

Mots clés: hypothèse nulle, biais, signification statistique, chi carré, valeur p, sciences sociales
Vignette
Source : www.flickr.com/franciscodaum

Objectifs

Les étudiants vont

  • Dériver et utiliser des tests du chi carré  

  • Expliquer l'utilisation de ce test dans le contexte de la démographie de New York 

  • Comparer et opposer les sciences sociales à la soi-disant «science dure» 

  • Considérez dans quelle mesure les statistiques sont utiles dans l'étude des humains 

Matériaux

  • Un sac de 30 perles (ou quilles) par paire d'élèves. Il devrait y avoir cinq couleurs différentes. 

  • Documents à distribuer (deux documents d'activités pour les élèves, une fiche technique et une clé pour l'enseignant)

  • Calculatrices 

Normes: 

  • CCSS.ELA-LITERACY.RST.9-10.7 : Traduire des informations quantitatives ou techniques exprimées en mots dans un texte sous forme visuelle (par exemple, un tableau ou un graphique) et traduire des informations exprimées visuellement ou mathématiquement (par exemple, dans une équation) en mots. 

  • CCSS.MATH.CONTENU.HSS.MD.A.4: Développer une distribution de probabilité pour une variable aléatoire définie pour un espace d'échantillonnage dans lequel les probabilités sont attribuées empiriquement; trouver la valeur attendue.  

Questions d'orientation

  1. Comment pouvez-vous tester si un groupe est distribué de façon aléatoire? 

  2. Quelles sont les principales différences entre les «sciences dures» et les «sciences sociales» et quelles sont les limites des données dans chacune? 

  3. Comment pouvons-nous utiliser les statistiques d'aujourd'hui pour nous aider à comprendre le passé? 

    Procédures

    Les tableaux chi carré sont des outils pour aider les scientifiques à comprendre si les données sont significativement différentes d'un résultat aléatoire - en d'autres termes, s'il y a un facteur externe en jeu qui doit être expliqué. Ils sont souvent illustrés en classe à l'aide d'objets inanimés ou d'acteurs non humains (billes, résultats génétiques). Cette leçon examine si les méthodes statistiques comme les chi-carrés peuvent être utiles pour évaluer le comportement humain et si elles peuvent être un outil à considérer dans la classe d'histoire. Un tutoriel utile pour le professeur non-scientifique peut être trouvé ici: http://www.ling.upenn.edu/~clight/chisquared.htm . 

    Dans la première partie de la leçon, les élèves dérivent des valeurs du chi carré en testant la distribution des billes. Ensuite, les élèves sont confrontés à un problème plus difficile: les différents groupes ethniques de New York sont-ils répartis au hasard? Les élèves peuvent le déterminer à l'aide de calculatrices. (Tous les quartiers de New York qui leur seront attribués ont des valeurs de chi-carré significativement élevées.) L'enseignant dirigera ensuite les élèves à travers une discussion sur la question de savoir si ces types d'outils peuvent être significatifs pour analyser le comportement humain, et une discussion sur le différences entre les sciences sociales et les «sciences dures» plus généralement. Enfin, la leçon se termine par une discussion sur l'utilité de ces outils pour analyser l'histoire et pointe vers des ressources qui explorent les facteurs historiques qui influencent les raisons pour lesquelles les habitants de New York sont regroupés de manière non aléatoire. 

    Téléchargez la feuille de travail de l'activité des statistiques de quartier

    Téléchargez le document démographique sur les statistiques du quartier

    Téléchargez le tableau de données des statistiques du quartier

    Téléchargez la clé de l'enseignant des statistiques du quartier

  1. Crochet
  2. Faites une déclaration farfelue aux élèves, par exemple: «Les gens qui portent des chemises boutonnées peuvent sauter plus haut que ceux qui portent des t-shirts.» Trouvez un élève en désaccord avec vous. Demandez à la classe: Qui a le fardeau de la preuve? Que devrions-nous supposer sans preuve? Pourquoi? Demandez aux élèves de partager leurs réponses. 

    Expliquez que le but de toutes les expériences est de tester hypothèse nulle. Les hypothèses sont des explications vérifiables des phénomènes. L'hypothèse nulle est l'hypothèse qui explique toute différence résultant du hasard / hasard. Tant que des preuves suffisantes ne sont pas découvertes, nous ne pouvons pas adopter de nouvelles hypothèses (alternatives).  

    L'hypothèse alternative spécifique proposée par l'enseignant (Halt) était: Les différences entre les hauteurs de saut des personnes peuvent être prédites par le type de chemise qu'elles portent. 

    L'hypothèse nulle (H0) pour l'exemple de t-shirt serait: Les différences entre les hauteurs de saut des personnes ne sont pas liées à la chemise qu'elles portent. 

    Comment pouvons-nous savoir ce qui est correct? C'est là qu'intervient l'analyse du chi carré. 

  3. Pratiques
  4. Expliquez aux élèves que vous avez rempli chaque sac de 30 perles de cinq couleurs différentes. Leur travail consiste à déterminer si vous l'avez fait au hasard ou avec un biais. Vérifier les élèves: Quelle explication est l'hypothèse nulle? (Réponse: L'hypothèse nulle est qu'ils ont été distribués au hasard, sans biais.) 

    Demandez: si l'hypothèse nulle (aucun biais) est vraie, à quoi vous attendez-vous de la distribution des billes? (Réponse: avec 30 perles et 5 couleurs, je m'attendrais à ce qu'il y en ait 6 de chaque.)  

    Comment un scientifique / statisticien pourrait-il déterminer à quelle distance les chiffres réels (observés) sont éloignés des chiffres attendus? Laissez aux élèves le temps de réfléchir à des solutions mathématiques potentielles. Ils devraient pouvoir trouver la soustraction comme moyen de mesurer la différence. 

    L'équation du chi carré est: 

    x2 = [SOMME] (o - e)/ e

    o = observé (ce serait le nombre réel de chaque catégorie) 

    e = attendu (c'est le montant prédit par hasard) 

    La différence représente la distance entre chaque valeur et la prédiction du H0

    Les différences sont au carré pour éliminer les nombres négatifs. Ils sont ensuite divisés par la valeur attendue. C'est comme prendre une moyenne. 

    Les valeurs résultantes sont toutes additionnées (désignées par la somme, ou sigma sur le document). Plus les différences sont importantes, plus la valeur du chi carré est grande. Notez qu'il n'y a pas de considération de la taille de l'échantillon ici, donc un échantillon plus grand signifiera en général une plus grande valeur chi-carré. 

    Expliquer: Le chi carré est une valeur qui mesure la distance entre l'observé et l'attendu. S'il est suffisamment éloigné, nous pouvons rejeter l'hypothèse nulle. En d'autres termes, nous pouvons dire dans ce cas que vous, l'enseignant, n'avez pas agi au hasard. Au lieu de cela, pour une raison quelconque, vous avez choisi les perles à donner à chaque groupe et avez donc agi avec partialité. Naturellement, ce test ne permet pas de déterminer d'où vient ce biais. Demandez aux élèves de proposer leurs propres hypothèses alternatives. Les exemples peuvent inclure: 

    1.) L'enseignant préfère utiliser une certaine perle de couleur plutôt que d'autres perles de couleur. 

    2.) Le choix de l'enseignant était aléatoire, mais la source originale de perles n'avait pas le même nombre de chaque couleur.  

    Demandez aux élèves de suivre les instructions du document pour tester leur propre sac. Le devra calculer les degrés de liberté (nombre de couleurs - 1) et apprendre à utiliser le graphique des valeurs p. Tous les tableaux et graphiques sont fournis sur la feuille de calcul.  

  5. Résumé
  6. Les élèves partagent les résultats en groupe, décident en groupe s'il y avait un biais dans la distribution des perles. 

  7. Appliquer
  8. Les étudiants reçoivent des données démographiques réelles des quartiers de New York du ministère de l'Éducation. La première tâche est de déterminer ce qu'est l'hypothèse nulle: si le recensement américain nous dit que 29% des New-Yorkais s'identifient comme hispaniques, que serait l'hypothèse nulle sur la population de personnes dans un quartier donné de la ville? (Réponse: nous nous attendons à ce que 29% des habitants de chaque quartier soient d'origine hispanique.) 

    Les élèves choisissent un quartier à partir du document de données fourni à tester. Étant donné que le chi carré ne fonctionne bien qu'avec des échantillons plus petits, ils ne doivent pas utiliser les données brutes. Ils peuvent utiliser les pourcentages comme échantillon, comme si chaque quartier ne comptait que 100 habitants. Ce travail peut être fait sur le polycopié avec des calculatrices. 

  9. Analyser les données
  10. Demandez aux élèves de partager leurs résultats. Pourquoi chaque quartier avait-il une valeur chi-carré significative? Qu'est-ce que cela signifie, statistiquement? (Chaque quartier a une valeur chi-carré significative. Cela signifie que nous pouvons rejeter l'hypothèse nulle selon laquelle les gens sont répartis de manière aléatoire.) 

    Renforcer: les données montrent que les populations ne sont pas réparties au hasard dans ces quartiers de New York - mais les données ne peuvent pas non plus nous dire pourquoi. L'analyse du chi carré nous permet simplement de savoir qu'un biais d'une certaine forme est en jeu et que la différence entre les résultats réels et les résultats attendus est statistiquement significative. Dans ce scénario, déterminer why c'est peut-être le cas traditionnellement du domaine des sciences sociales - pas des statistiques. 

  11. Discussion: la nature des sciences sociales
  12. Utilisez ces questions pour guider une discussion approfondie et / ou une activité d'écriture sur les applications potentielles des compétences que les élèves viennent d'apprendre. 

    Expliquez aux élèves que les chi-carrés sont traditionnellement utilisés avec des populations qui n'exercent pas de choix (comme dans le cas des perles ou des quilles dans la première activité). L'analyse du comportement humain a généralement été le domaine des soi-disant «sciences sociales» (par exemple, la psychologie, l'économie, la sociologie, les sciences politiques et l'histoire).  

    Demander: Qu'ont en commun les «sciences dures» et les «sciences sociales»?  

    Demander: Quels défis sont propres aux sciences sociales? Pourquoi est-il plus difficile de tirer des conclusions d'une étude sur les humains que celle des plantes ou même des animaux modèles comme les souris? Est-il utile de quantifier le comportement humain? Quelle utilisation potentielle sont les données démographiques? Quelles sont les limites des études statistiques comme celle-ci? 

    Demander: Pourquoi est-il logique que nous puissions rejeter l'hypothèse nulle dans tous les quartiers que nous avons analysés? (Attendez-vous à des réponses du type: les gens choisissent où ils vivent, ou les gens sont limités par ce qu'ils peuvent se permettre.)  

    Sur le thème des choix des immigrés: Pourquoi des groupes de personnes pourraient-ils choisir de vivre près les uns des autres? 

    Au sujet d'autres facteurs externes: Quels autres facteurs pourraient limiter le choix des immigrants en fonction de leur lieu de résidence? 

  13. Discussion: Introduction aux facteurs historiques
  14. Tout au long de l'histoire de New York, certains groupes de personnes ont été contraints ou contraints de vivre dans certaines zones - ou, à tout le moins, ont été empêchés de vivre dans les parties les plus «souhaitables» de la ville. Au milieu du 20e siècle, redlining - dans laquelle les Afro-Américains se sont vu refuser des hypothèques dans les quartiers traditionnellement noirs - a empêché de nombreux Afro-Américains de posséder des maisons (et donc de rejoindre la classe moyenne), et a aidé à concentrer les Afro-Américains dans certaines sections de la ville. D'un autre côté, de nombreux Afro-Américains se sont installés dans des quartiers traditionnellement noirs comme Harlem, qui servaient d'espace sûr au milieu de la violence de Jim Crow America et permettaient la liberté de création, de pensée et de discours qui a fomenté la Renaissance de Harlem.  

    Avec la force de l'histoire en jeu et les multiples facteurs et contextes historiques qui influencent les choix (ou le manque de choix) des acteurs humains, pouvons-nous utiliser l'analyse statistique comme un outil significatif dans l'histoire? Si vous rédigiez un article d'histoire, envisageriez-vous d'inclure une analyse du chi carré pour soutenir votre argument? 

Ressources additionnelles 

Utilisez ce site Web pour vous renseigner sur l'histoire de la redlining: comment les politiques des années 1940 ont entraîné une ségrégation de facto dans les villes: https://dsl.richmond.edu/panorama/redlining/ 

Pour une histoire complète de la redlining, voir Richard Rothstein La couleur de la loi: une histoire oubliée de la façon dont notre gouvernement a séparé l'Amérique (Liveright, 2017). 

Fieldtrips: ce contenu est inspiré de la Ville mondiale, 1898-2012 ainsi que  Laboratoire de la future ville galeries dans l'exposition phare du Musée, New York à son noyau. Si possible, pensez à emmener vos élèves en excursion! Visite http://mcny.org/education/field-trips pour en savoir plus. 

Remerciements

Cette série de plans de cours pour New York à son noyau a été développé en collaboration avec un groupe de discussion composé d'enseignants des écoles publiques de la ville de New York : Joy Canning, Max Chomet, Vassili Frantzis, JoAnn Gensert Ph.D., Jessica Lam, Patty Ng et Patricia Schultz.

Ce projet a été rendu possible en partie par le Institut des services des musées et des bibliothèques.

Les opinions, constatations, conclusions ou recommandations exprimées dans ces leçons ne représentent pas nécessairement celles de l'Institut des services des musées et bibliothèques.