lundi 2 décembre 2013

Carroyage INSEE : des données infra-IRIS propres ?

Dans un précédent billet, je me lamentais sur le flou de la politique de distribution des données infra Iris dites "carroyées" de l'INSEE.

Et bien, il fallait juste être patient !

L'INSEE vient de publier sa copie corrigée avec une nouvelle méthodologie de floutage/lissage des données micro locale afin de respecter le sacro-saint secret statistique, si important en France.

La méthode de l'INSEE ne semble pas abordable pour le premier venu. C'est de l'Open Data qui manque un peu d'ouverture...  

En partant du découpage carroyé original (200m), l'INSEE a appliqué une technique astucieuse pour construire des zonages/sectorisations en respectant des des minimas statistiques (ici de population) pour chaque découpage. L'INSEE regroupe les "petits" carreaux (200m) en "grands" carreaux de taille variable, ce qui permet d'agréger les données censitaires et fiscales et respecter ainsi le secret statistique. Par ailleurs, L'INSEE a très fortement lissé les variables (par écrêtage des plus hauts et plus bas déciles)  les plus intéressantes : revenus et taux de propriétaires. Je crains donc que la plus-value de précision de micro-localisation par rapport à l’IRIS apportée par ces nouvelles données soit faible. Enfin l'INSEE laisse aux utilisateurs le soin de faire une série de traitements cartographiques et statistiques complémentaires pour la production de cartes et pour rendre ces données  compatibles avec les bases de données Iris…
Bref du travail en perspective. Mais nous faisons un métier technique, parfois complexe et nous sommes là pour décrypter. La suite dans un prochain numéro, lorsque nous aurons trouvé le temps de passer quelques heures sur ce jeu de données.

Une version déjà bien aboutie d'une carte interactive de ces données carroyées a été mise en ligne par Etienne Come:
 Lien d'accès à la carte interactive des données carroyées
 Lien d'accès à la carte interactive des données carroyées

Un grand Merci au vénérable Institut pour cette publication que nous attendions.

Le déclin de la criminalité dans les pays développés


Un article de la revue « Sciences Humaine » (n°253, Novembre 2013) relayant lui-même des articles de « The Economist » (The Curious Case of the Fall in Crime et Where have all the burglars gone? , juillet 2013) a attiré mon attention en cette période de poujadisme sécuritaire. Les faits divers d’atteintes aux biens et personnes remplissent les journaux et les conversations de comptoir : Marseille encore et toujours, telle histoire familiale sordide d’une mère qui assassine ses 4 enfants, les casses de la côte d’Azur ou encore le métro à Paris… En revanche, les études sérieuses sur la criminalité ne font pas la une des médias. C’est l’une des hérésies du milieu journalistique, très bêtement piloté par la logique de l’audience court terme.

Une tendance de fond

Or les tendances de fond sur la criminalité lourde d’atteinte aux personnes (Homicides, coups et blessures) et aux biens (Vols de voiture, cambriolage) sont très nettes : l’ensemble des ratios de criminalité par habitant sont en chute très significative et ininterrompue depuis 1990 dans l’ensemble des pays occidentaux dits « développés » : l’Amérique du Nord et Angleterre, toute l’Europe du Nord et de l’Ouest, ce qui inclut la France.  Dans certains pays les homicides ont chuté de 70% ; à New York, la criminalité a été divisée par quatre. Au global la criminalité a baissé d’un tiers avec un trend plus ancien aux Etats Unis (1990) et plus tardif en France (2001).








Il n’y a pas d’explication monolithique du déclin de la criminalité

La tendance est lourde et très largement partagée par les criminologues. En revanche, il n’y a pas  d’accord sur le rôle des facteurs d’explication : politique répressive plus ou moins efficace, progrès très sensibles de la police et de ses méthodes d’investigation et de prévention, facteur démographique favorable du fait du vieillissement des populations occidentales, fin de la distribution de drogues très criminogènes (Crack)  compensée par une croissance des toximanies peut-être moins criminogènes, les alarmes de voiture et caméras de surveillance privées et publiques...
Aucun de ces facteurs ne monopolise l’explication de la chute de la criminalité : les pays d’Europe du Nord et le Canada n’ont pas augmenté la répression et pourtant la criminalité a baissé comme ailleurs.  A Londres et dans beaucoup de villes américaines, la population a plutôt rajeunie et pourtant la criminalité a chuté.
Certains chercheurs ont même avancé une hypothèse saugrenue : les lois de libéralisation de l'avortement seraient à l'origine du déclin de la criminalité, en évitant la vie a des enfants non souhaités qui auraient eu de grandes chances de devenir délinquant s'ils avaient vécus... Mais le raisonnement ne tient pas car l'avortement existait avant sa dépénalisation et la temporalité de la dépénalisation de l'avortement ne coïncide pas avec celle du déclin de la criminalité. 


Le processus de civilisation

Pour ma part, je pense que cette chute de long terme de la criminalité est l’une des manifestations du processus de civilisation (Norbert Elias, "Sur le processus de civilisation" 1° édition en 1939).  Dans des sociétés pacifiées, sous emprise sans cesse montante de l’idéologie et de la démocratisation de la connaissance, avec allongement et l’alternance des périodes d’éducation/formation, la tertiarisation généralisée, des architectures pour des modes de de vie plus doux, les incitations au crime se font plus rares.
Autre coïncidence : 1990 c’est la naissance de l’Internet pour tous, 1995 Google et aujourd’hui les réseaux et jeux sociaux. Lorsque les jeunes générations consacrent des heures a des activités sociales, ludiques ou éducatives sur Internet, elles ne traînent pas désœuvrés dans la « jungle » urbaine. Quelque actes délictueux sur Internet valent bien  des milliers d’homicides en moins.
Utopiste, idéaliste debout ! Le processus de civilisation est en marche.


Le retard français sur l’ouverture des données de criminalité

Certes, la criminalité est en déclin, mais tous les problèmes ne sont pas résolus et, la police le sais bien, il faut connaître le crime "d" l'intérieur" pour l’éradiquer. Sur ce sujet, les données publiques française sont lacunaires, elles manquent vraiment de transparence et de précision. La collecte est en place, les statistiques de criminologie sont issues des « mains courantes » des  commissariats de police.
Mais prétextant la confidentialité, la dissémination de ces données de criminologie locale est très pauvre en France. Le ministère de l’intérieur publie des chiffres départementaux très macro. Or, pour bien comprendre et agir sur la criminalité, la géolocalisation précise de  l’ensemble des actes délictueux est la condition nécessaire. La densité de crime est très hétérogène sur le territoire. Il existe des points chauds de forte concentration des crimes. On doit identifier les contours de ces zones sensibles pour toutes les actions préventives et curatives.
Dans les pays Anglo-Saxon les cartes de "HotSpot" de criminologie sont diffusées au grand public. Les services de police disposent depuis de nombreuses années de bases de données d’actes délictueux finement localisés et des capacités de cartographie analytique pour des investigations et un ratissage plus efficace du territoire. L’observation des corrélations géographiques fines entre les caractéristiques socio-économiques d’une micro-zone et  son niveau de criminalité permet de mieux comprendre pourquoi la criminalité agit à tel ou tel endroit et pourquoi elle décline.
Dans les pays anglo-saxon, les micro-données et la cartographie statistique de la criminalité sont largement diffusés. En France, nous souhaitons l’ouverture d’une version anonyme et géo-localisable du fichier des mains courantes.   Que fait l’Open Data sur le sujet ?


dimanche 1 décembre 2013

La réussite des élèves au brevet des collèges français : l'étonnante domination du secteur privé

Avant propos

Ce billet s’adresse aux parents d’élèves en classe de CM2 (7°) ainsi qu’à tous les parents  de collégien(ne)s. Mais il pourra aussi bien sur intéresser le corps enseignant du 1° cycle des collèges et interpeller les responsables d’académies ou nationaux de l’Education Nationale.
Le choix d’un collège est moins anecdotique qu’on peut le penser.  L’école est une machine à classer les élèves et cette logique du classement est à l’œuvre dès l’entrée en 6°. Mieux vaut être bien informé sur ce point. Personnellement, je n’étais pas bien informé lorsque mes enfants sont entrés au collège, il y a quelques années.  Je n’aurai sans doute pas fait les mêmes choix si j’avais lu ou écrit ce billet à cette époque !  
Si vous souhaitez voir les performances des collèges de votre académie, ville ou quartier :  Allez faire un tour vers la carte de la réussite des collèges.



Si vous souhaitez en savoir plus sur les sources et méthodes de calculs adoptées en support  de cet article, je vous renvoie vers un premier topo sur le sujet des collèges.



Trois collégiens sur quatre passent leurs brevet avec un collège public



Le secteur public regroupe 71% de l’ensemble des 8 426 collèges de France métropolitaine. Ce secteur a présenté 76% de la cohorte de 720 000 collégiens de 3° au brevet des collèges en 2012. La scolarisation en public est donc la règle pour les collégiens français. Mais le secteur privé n’est pas marginal. Il a lui même présenté plus de 170 000 collégiens candidats au brevet. La comparaison des performances de réussite entre les candidats du privé et ceux du public mérite un détour.


Les collèges d’excellence : domination du privé

La liste des 30 premiers collèges français comprend exclusivement des collèges privés. Les premiers collèges publics arrivent très tardivement dans le classement : les loges à Saint Germain en Laye (Yvelines) est classé 32°, le collège international de Valbonne dans les  Alpes Maritimes est  43°, Pierre de Fermat à Toulouse figure en 55° position.

Top 30 des collèges selon leur réussite au Brevet : 100% issu du secteur privé

Cliquez ici pour voir le tableau de l'ensemble des collèges


Les collèges « cancres » : des très petits collèges des deux secteurs ou des grands collèges publics

En bas de la liste des collèges aux performances très médiocres, on trouve cependant de nombreux petits collèges présentant moins de 30 élèves très souvent issus du secteur privé avec de mauvais résultats.
En revanche pour les 3262 « grands » collèges présentant plus de 100 éléves au Brevet,  le bas du classement des collèges français est quasi exclusivement composé de collèges publics.
Par « discrétion », on ne nommera ni ne listera directement aucun de ces collèges « cancres ». J’ai cependant développé une application de consultation de la base de données des collèges qui vous permet de vous faire votre idée : lien vers le dataViz de la réussite des collèges.


D’importants écarts de performance inter académie entre les deux secteurs

En France métropolitaine, les deux académies de Paris et Rennes ouvrent la marche avec de bons indicateurs de réussite tandis que Rouen et Reims ferment le classement.

Indice brut de réussite des collèges par académie et carte par département
Accès aux données interactives



Mais ce classement assez resserré masque d’importantes distorsions privé/public selon les académies.
Le graphique suivant positionne chaque académie sur le plan du taux d’admis (X) et du taux mentions parmi les admis (Y) avec la décomposition des deux secteurs privés et publics.



 Lien vers les données interactives
Accès aux données interactives 

Les points du secteur privé des académies (matérialisés par un carré) figurent très majoritairement en haut et à droite de leur homologue du public (matérialisés par un cercle). Les académies de Paris, Créteil, Versailles, Nice sont emblématiques de cette domination du privé.
Les collèges du secteur privé parisien tirent l’académie vers le haut. Le secteur public parisien est en revanche plutôt mal classé, très éloigné du secteur privé. La distance entre la réussite des collèges privés et public est maximale sur cette académie. A Rennes, les deux secteurs sont beaucoup plus homogènes et présentent tous les deux de bonnes performances. 

Zoomons maintenant ces résultats à l’échelle départementale. Pour le secteur public, tous les départements Bretons (île et Vilaine, Morbihan, Finistère, Cote d’Armor et même … la Loire Atlantique) partagent le haut du classement avec  la Haute-Garonne. Paris et tous les départements de la région île de France sont assez mal classés sur le secteur public.  Les 117 collèges publics du Val d’Oise et les 124 collèges publiques de la Seine Saint Denis sont respectivement classés avant dernier et dernier des collèges publics avec des indices de réussite très faibles de 0,6 (vs 1 pour la moyenne France).
Pour le privé, ce sont les départements d’Île de France, Bretons et d’Alsace qui sont aux premiers rangs. Notons que les 33 collèges privés de Seine Saint-Denis et les 29 collèges privés du Val d’Oise figurent dans le haut du classement et connaissent de très bons indices de réussite (respectivement 1.4 et 1.5). Dès lors les écarts de réussite privé/public sont maximums dans les départements d’Île de France, en Alsace, ainsi que dans les zones à forte densité urbaine du Var et des Alpes maritimes, à Lyon et dans le Nord.

Géographie départementale des écarts de réussite au collège 
entre le secteur public et le secteur privé
Accès à la carte en version interactive

Cependant, pour plus de la moitié des départements les moins peuplés et sans grande métropole, le collège public dépasse ou fait jeu égal avec le collège privé. La Haute-Garonne avec Toulouse est le seul département à dominante urbaine avec un secteur public plus performant que le privé. La domination du privé n’est donc pas uniforme sur le territoire. La dichotomie entre des ghettos scolaires riches, sélectifs et performants pour le privé, et des ghettos déshérités et avec un fort taux d’échec pour le public est l’apanage des très grandes agglomérations avec un point haut à Paris et sa banlieue.  Ce constat assez désolant d’un premier cycle à deux vitesses avec fort déséquilibre privé/public dans les plus grandes agglomérations est le reflet de la situation du collège aujourd'hui. Mais on peut penser qu’il y a eu une accentuation de la divergence Privé/Public au collège au tournant du millénaire. Les précédentes générations de collégiens et de parents collégiens ont vécu sans doute des situations plus atténuées. Cette hypothèse est à éclaircir avec des données historiques auxquelles nous n’avons malheureusement pas accès.    


Les plus grands collèges sont plus performants : de nombreux trop petits collèges pourraient fusionner !

En collège public comme en privé, le taux de réussite et le taux de mention croit avec la taille des collèges. On constate ces variations de performances dans toutes les académies. Le taux de mentions des petits collèges  présentant moins de 50 candidats au brevet  (53%) est 13 points en dessous du national (66%).

Taux de réussite et de mentions parmi les admis par secteur et 
selon le nombre de candidats au DNB
Accès aux données interactives
Pour les 2617 plus petits collèges (moins de 50 présents soit 2 classes de 3° et moins) également répartis entre les deux secteurs, le privé ne fait guère mieux que le public. 
Il n’est pas étonnant de compter le plus d’admis avec mention au sein des 802 « gros » collèges (150 à 200 candidats) et des 199 « très gros » collèges.  Les collèges les plus performants sont aussi les plus demandés (par les parents d'élèves et les enseignants) et on y ouvre donc plus de classes. S’il n’est pas certain qu’il soit rationnel et possible de développer des "usines" à collégiens, un travail de rationalisation mérite d’être engagé pour fusionner de nombreux trop petits collèges et adapter la sectorisation associée en renvoyant ces élèves vers de plus grands établissements. Une importante capacité d’accueil engendre des économies d’échelles sur les coûts des infrastructures et des gains de cohésion/stimulation pédagogique avec un corps professoral plus important.


Le privé, plus souvent dans les zones aisées, mais ce n'est pas systématique.

Les déterminants sociaux de la réussite scolaire sont bien connus et très prégnants. Les Filles réussissent mieux que les garçons, les enfants des milieux intellectuels, aisées et/ou sensibilisé à la question scolaire (enfants d’enseignants) ou encore les enfants précoces réussissent mieux leurs examens que les autres. Le brevet des collèges n’échappe pas à la logique déterministe de la réussite scolaire. Sur ce point, je renvoie vers les tableaux du ministère de l’éducation nationale à propos de la réussite au diplôme national du brevet : sexe, âge et origine sociale. On pense avec quelques bon arguments que la performance insolente du secteur privé au brevet est liée pour tout ou partie à une composition sociale des collégiens du privé très distincte de celle du public.






Les collèges privés ont la liberté de choix de leurs élèves, c'est moins le cas pour les collèges publics du fait de règles de sectorisation géographique. Le ministère de l'éducation ne diffuse malheureusement pas d'informations sur la composition du public des élèves de chaque collège. Nous ne pouvons donc pas distinguer pour chaque collège la réussite liée à la composition sociale des élèves et la réussite liée à une pédagogie et une gestion efficace du corps enseignant.  Les écarts de réussite entre collèges sont la conséquence :
  •      des effets de ségrégation sociale à l'entrée des collèges (ségrégation spatiale du fait de la carte scolaire, stratégie parentale de localisation sur un bon secteur scolaire, politique de sélection de certains collèges privés…) ;
  •       des choix et règles d'affectation des enseignants vers les collèges ;
  •       de la politique pédagogique de chaque collège.

Avec les « moyens du bord », j’essaye donc de contrôler statistiquement les déterminants sociaux de la réussite au brevet afin de tester l’hypothèse d’un apport qualitatif managérial du privé par rapport au secteur public. J’ai ventilé les indices de réussite de chaque collège en fonction des caractéristiques sociales de leur localisation. J’ai choisi le niveau de revenu fiscal moyen des ménages du quartier (Iris) comme indicateur proxy de synthèse de l’environnement et de la composition sociale du public collège.







Sans surprise pour le public comme pour le privé, les collèges des beaux quartiers performent mieux que ceux des zones défavorisés. L’implantation du privé est aussi plus tournée vers les beaux quartiers : 39% des collèges sont privés dans les zones avec un revenu moyen par ménage de + de 50000 € (versus 29% au national). Mais la réussite du secteur privé est constamment supérieure à celle du public, quelque-soit la tranche de revenu. De façon surprenante, les écarts de réussite entre les secteurs privés et public sont plus forts aux deux tranches extrêmes des bas et des hauts revenus. Peut-on donc affirmer que le secteur privé forme mieux les élèves au brevet que le secteur public ? Ce serait hâtif à partir des données parcellaires que nous exploitons ici. Il existe cependant un sérieux faisceau d’indices pour pousser des études complémentaire à éprouver cette hypothèse.
         

Répartition  des indicateurs de réussite au brevet par secteur privé/public
et selon le revenu moyen des ménages du quartier du collège
Toutes les statistiques de mesure de performances collectives ou individuelles sont sujettes à caution, discussion, remise en cause, etc. Tout un chacun accepte un classement s’il figure en haut de la liste et le conteste si ce n’est pas le cas. J'ai bien conscience qu'il n'y a pas de vérité absolue sur ce type sujet. De multiples facteurs qualitatifs ou lié à l'histoire et la géographie scolaire locale méritent d'être intégrés dans l'évaluation d'un établissement scolaire. Le professionnel de la statistique compose avec les sources dont il dispose. En l'occurrence les sources publiques sur le fonctionnement des collèges sont relativement pauvres et peu transparentes. Les pouvoirs publics craignent peut être que la publication des inégalités territoriales au collège accroissent les phénomènes d'auto sélection et de "ghettoïsation" du territoire : ghettos de riches avec les bons collèges et ghettos pauvres scolairement déshérités. Mais la politique de l’autruche est-elle tenable sur le long terme de la politique d’éducation ?