samedi 23 janvier 2016

Les disparités de la couverture de la population par les équipements locaux

DataViz de la Base Permanente des Equipement avec les cartes « en étoiles »

La base permanente des équipements (BPE de l’INSEE) mesure le niveau d'équipement et de services rendus par un territoire à la population. Cette base permet de connaître la présence ou l'absence d'un équipement, la densité d'un équipement, ou un indicateur de disponibilité d'un équipement du point de vue des habitants. La base permanente d'équipements comporte un large éventail d'équipements et de services rendus à la population. Le champ recouvre les domaines des services, marchands ou non, des commerces, de la santé et de l'action sociale, de l'enseignement et du tourisme.

1/ Les divers indices d’équipement d’une zone construisent une étoile

Dans un précédent Post, Jean-Jacques Jesua propose une méthode de représentation « en étoile » de données localisées d’équipement de points. La représentation des données de la Base Permanente des Equipements est compliquée et j’ai pensé que cette méthode des analyses thématiques en étoile est une bonne approche « dataviz » de ce sujet. L’idée est de repérer les inégalités de niveau d’équipements entre régions et/ou entités géographiques comparables. J’ai choisis d’évaluer le niveau d’équipement avec le nombre d’équipements pour 10 000 habitants. J’ai normalisé cet indice par attribution d’une note de 1 à 10 afin de faciliter la lecture des comparaisons géographiques. J’aurais pu utiliser le nombre total ou la densité au km2 d’équipements mais ces métriques sont très liées aux différences de densités urbaines, elles-mêmes déjà bien connues et sans réelle valeur ajoutée. L’offre de services d’équipements par habitant est un assez bon indicateur de leur accessibilité et donc d’une forme d’attractivité territoriale engendrée par cette commodité.     

La carte interactive que je propose représente le niveau d'équipement pour quatre types d'entités géographiques : régions, départements, bassins de vie et communes de France (Carte accessible ici). On distingue aussi 4 grandes catégories d'équipements : équipements généraux, de loisirs, pour la santé et les services de proximité. Chacune des catégories comprend elle-même 6 à 8 sous-catégories. La carte matérialise le niveau d'équipement de chaque entité géographique par une "étoile" avec 6 ou 8 branches colorées selon la sous-catégorie d'équipement. La taille et/ou la section des branches des étoiles est proportionnelle  au ratio d’équipement (ou fixe).


2/ Illustrations de quelques disparités régionales d’équipements :

Niveau d’équipement général des régions françaises.  
Branches proportionnelles au ratio d’équipement pour 10000 ha




En dehors des équipements de santé (branche bleue) et de proximité (branche rouge), l’étoile de l’île de France rayonne bien faiblement. Il y a peu de postes de police, de bureaux de poste, de grandes surfaces alimentaires ou d’école par habitant en île de France par rapport aux autres régions. Est-ce à dire que les classes y sont plus remplies, que l’on attend plus aux caisses des supermarchés ou au guichet de la poste ou encore que les forces de l’ordre sont invisibles ? Certainement non, il nous manque l’information sur la taille et capacité d’accueil de chaque équipement. Il est fort probable que le nombre de guichets d’un bureau de poste parisien est plus important que celui d’un bureau de province. La capacité d’accueil de chaque point d’équipement est une information importante mais malheureusement lacunaire de notre source BPE.
On note aussi que lorsque la couverture de la population par les équipements de proximité est plutôt faible (trait rouge court), l’équipement des grandes surfaces alimentaire est plutôt élevé (trait vert long)

Niveau d’équipement de proximité des régions françaises.  
Branches proportionnelles au ratio d’équipement pour 10000 ha

Idem mais en variante de représentation : branche fixe, épaisseur de la branche proportionnelle au ratio d’équipement pour 10000 ha



Avec la carte interactive, chacun choisit le mode « d’étoilage » qui lui convient. Mais dans les deux cas de branches fixe ou variable, on constate l’attraction du soleil avec des équipements de proximité de toute nature toujours plus denses dans le Sud et un rayonnement maximal en Corse. A contrario, il y a un déficit relatif d’équipements très marqué dans le Nord-Pas de Calais Picardie.


Niveau d’équipement Santé des régions françaises.  
Branches proportionnelles au ratio d’équipement pour 10000 ha





On compte10,3 médecins spécialistes en Provence Cote d’Azur pour 10000 ha versus 4,8 dans le Nord. Dans le domaine très réglementé des pharmacies, on compte 4,5 pharmacies pour 10000 ha en Corse (où il faut alimenter de nombreux résidents secondaires) versus 3,1 dans l’Est.

Niveau d’équipement Loisirs des régions françaises.  
Branches proportionnelles au ratio d’équipement pour 10000 ha

















Il y a une forme compensation entre les équipements sportifs et les équipements culturels ou touristiques. Les régions bien dotées en équipements culturels et touristiques le sont en général moins en équipements sportifs et vice versa. Zoomons maintenant dans la région Ile de France avec un fort tropisme vers la culture (Branche violette).

Niveau d’équipement Loisirs des départements d’île de France.  



Paris intramuros se distingue par un double tropisme culture et tourisme (branche verte).


Niveau d’équipement Loisirs des arrondissements parisiens.  

 







Pour les loisirs, Paris marche sur ses deux pattes Culture et Tourisme sans alternative et avec une très forte accentuation du phénomène au centre de Paris. On compte par exemple 6,1 théâtres ou cinémas pour 10 000 habitants dans le 2° arrondissement versus 0,4 dans le 19° et 20°. Il est vrai que la zone d’attraction culturelle et touristique du centre de Paris draine des flux de fréquentation qui proviennent en très grande majorité hors de sa zone résidentielle.   


3/ Mode d’emploi de la carte interactive

La consultation géographique est consultable en "drill down" emboité : cliquez sur une étoile région de la carte et vous obtenez une carte détaillée de l'équipement des départements de la région. Cliquez alors sur une étoile département et vous obtenez le détail de ses bassins de vie. Enfin cliquez sur une étoile matérialisant un bassin de vie et vous obtenez le détail de ses communes équipées. Vous pouvez aussi vous déplacer d'un niveau à l'autre à l'aide des 4 onglets cartes.
Vous pouvez vous déplacer zoomer et dé-zoomer sur la carte comme sur Google Map (menu au coin haut gauche). Vous pouvez aussi recentrer/réinitialiser la carte en cliquant sur l'icône "maison" de ce menu: ceci est utile lorsque vous êtes sur un niveau de zoom qui ne correspond pas aux données sélectionnées.
Pour les cartes des départements, des bassins de vie et des communes, vous pouvez aussi sélectionner d'autres zones (sélection géographique marquée en rouge en haut à droite).

Le niveau d’équipement d’une zone est décrit à l’aide du nombre d’équipements présents pour 10 000 habitants, ce qui permet les comparaisons territoriales. Trois indicateurs de niveau d'équipement sont calculés pour chaque zone et chaque sous-catégorie : le nb brut d'équipements, le nombre d'équipements pour 10 000 /habitants et une note de 1 à 10 qui matérialise le classement de la commune au sein de l'ensemble des communes équipées de France métropolitaine. Ces indicateurs s'affichent en info-bulle lorsque vous pointez le curseur au-dessus d'une étoile.

En bas à droite de l'écran, un menu permet de régler la dimension des étoiles :
- La taille des branches peut être fixe ou proportionnelle au nombre d'équipements pour 10000 /habitants ;
- La section des branches peut être fixe ou proportionnelle au nombre d'équipements pour 10 000 /habitants ;
- Un curseur permet d'allonger/rétrécir la taille des branches. Ceci est utile pour certains niveaux de zoom. La taille des branches est paramétrée pour un affichage optimal. Cependant, lorsque l'on zoom dans les régions très denses (ile de France), il peut être utile de rétrécir la taille des branches.

Une entité géographique non étoilée ne possède pas d'équipement ; c'est le cas de nombreuses petites communes. Une commune avec un faible nombre de branches ne possède pas un équipement diversifié. Une commune avec beaucoup de longues branches (ou épaisses si vous avez choisi d'afficher les sections variables) est bien équipée. Une entité géographique matérialisée par une étoile de forme déséquilibrée possède un équipement hétérogène avec des spécialisations et des "trous" d'équipements.


4/ How to : comment j'ai réalisé cette carte interactive en étoile ? (§ Spécial GEEK avec indications rapides)

Attention ce n’est pas immédiat, ce type de représentation n’est pas un standard d’analyse thématique cartographique, j’ai donc consacré quelques heures à monter cette carte…

Les fichiers de comptages iris commune extraits de la Base Permanente des Equipements sont téléchargeables ici et sont extraits de l’inventaire communal 2014 de l'INSEE.

Mon tableau de base comprend pour chacune des 36 600 communes françaises en ligne les 165 postes qu’équipement en colonne de la BPE. Un prétraitement (réalisé avec SAS) des données communales de la BPE sélectionne et regroupe les 165 postes en 4 catégories d’équipements et les 6 ou 8 sous catégories. Je transpose mon tableau initial pour obtenir un tableau de lignes commune* catégorie * sous-catégorie  avec en colonne le nombre d’équipements, le ratio d’équipement et le rang de la commune normalisé par une note sur 10. Ce tableau est agrégé 4 fois pour les 4 niveaux géographiques : communes, bassins de vie, départements, régions.

J’ai choisi le logiciel Tableau Software pour l’édition des données sous forme de carte interactive. Ce logiciel est puissant pour une construire des cartes de points avec des fonctionnalités de « Business Intelligence »  (choix, sélection, drill down…). Le tracé d’une branche d’une « étoile » est similaire à celui d’un flux du point de départ centre de la zone, au point d’arrivée extrémité de la branche.
    
Pour gérer ces pseudo-flux avec Tableau Software, j’ai suivi les conseils de cet article. J’ai donc dupliqué chaque ligne de mon tableau pour avoir un point de départ et un point d’arrivée pour chaque flux et créer une variable d'ordre du tracé du trait (0/1) pour définir le point de départ (la commune) et le point d’arrivée (l’extrémité de la branche) du flux.  On peut faire le calcul en amont des coordonnées des points d’arrivée des branches des étoiles (cf. post ici). J’ai cependant préféré faire le même calcul mais sous la forme d’un champ dynamique dans Tableau Software. Cela permet de paramétrer la taille des branches de l’étoile (fixes ou variables) et d’ajuster la taille de l’étoile en fonction du niveau de zoom de l’utilisateur pour éviter de surcharger la carte.   

Voici la tête du fichier que j’ai chargé sous tableau : indicateurs d’équipement en jaune, identifiant et n° ordre sont nécessaires pour tracer un trait (flux) de point à point, les coordonnées géographiques long/lat (EPSG 4326) du centre de l’étoile    


Sous Tableau : la carte principale est construite à l’aide du calcul dynamique des coordonnées des extrémités des branches de chaque étoile (X1C, Y1C) et en détaillant le tableau avec l’identifiant et le n° d’ordre



Pour finir, je rappel et renvoi vers les deux éléments clefs de ce post :
La carte interactive en support dans ce post
Et plus de détails sur le principe des cartes de points étoilés (méthode de Jean Jacques Jesua, La Poste), consulter son excellent article ici.

samedi 16 janvier 2016

Le fichier SIRENE gratuit (open data)

Après l'ouverture de la base des adresses françaises (Base AdresseNationale), la secrétaire d'Etat au numérique Axelle Lemaire passe à la vitesse supérieure pour l'ouverture des données publiques : le fichier SIRENE sera mis en licence open data au 1/1/2017.

C'est une nouvelle petite révolution pour les professionnels des données qui demandaient cette ouverture depuis de nombreuses années. Une mesure très intelligente qui va simplifier l'accès et la distribution de ces informations essentielles. Le SIRENE comprend la fiche d'identité de tous les établissements d'entreprises françaises (n=10 millions) : identifiant de l'établissement (code SIRET), dénomination sociale, adresse, activité détaillée (code NAF), date de création, catégorie juridique (SA, SARL...), effectif...

L'INSEE gère SIRENE et perd 10 millions d’euros de droits annuels du fait de l'ouverture. De nombreux distributeurs de fichiers B2B vont devoir revoir leur modèle d'activité. Il s’agit cependant d’une très bonne avancée pour la connaissance détaillée du tissu d’activité et la fluidification de l’exploitation des informations sur les entreprises va entrainer la création/consolidation de startup et alléger les coûts d’achats de données des nombreux utilisateurs de SIRENE. Ces gains seront réemployés par les acteurs des données pour créer des services et informations à réelle valeur ajoutée. Mon avis est que l’Etat n’a pas vocation à tirer profit des informations brutes que leur confient les citoyens et les entreprises.  

C'est aussi un vrai soulagement pour tous ceux qui ont bataillé pour comprendre les subtilités des licences et droits de rediffusion à verser à l'INSEE  pour l'usage de ces informations publiques (Adieu l’infâme potion des licences R2a et R2b!). De fait le système de distribution de l’INSEE était complexe, injuste et inefficace.

L’annonce ne précise pas encore les détails des modalités de la licence : Open data pur ou modèle  « Freemium »? C’est un point à suivre avec attention. Par ailleurs, les greffes des tribunaux de commerce collectent les données comptables et financières (chiffre d’affaires, bilans, résultats…) sur les plus grandes entreprises françaises (800 000 sont concernées). Ils suivent aussi tous les évènements essentiels quant à la santé des entreprises (changements de statuts, redressements judiciaires, faillites…). Ces informations ne font pas partie de SIRENE et sont essentielles pour le suivi de la vie économique. 

Ces données ont aussi été ouvertes en 2015 par :

  • la Direction de l'Information Légale et Administrative (DILA). Elles sont téléchargeables sur le site ftp://echanges.dila.gouv.fr/. On y trouve en particulier un historique long de toutes les annonces commerciales (BODACC ) et des sociétés cotées (BALO)...
  • Infogreffe : téléchargeable sur https://datainfogreffe.fr/page/home/. On y trouve un historique long des créations et radiations d’entreprises, des chiffres clefs des sociétés ayant une obligation de publier leurs comptes, etc …. 

Voila donc de quoi enrichir le Sirene bientôt libre à moindre frais et mordre ainsi sur les activités de quelques spécialistes (Société.com, dun&bradstreet, BDV…).


Les prochains fichiers sur ma liste de l’Open Data sont ceux des transactions immobilières (rente des notaires de France ), le fichier des cartes grises (rente de l’association des 3A), les fichiers fonciers MAJIC du cadastre (IGN/DGI, déjà partiellement ouvert), la base de détail des permis de construire (SITADEL)… Il y a encore du pain sur la planche pour le mouvement de l’Open Data, nous sommes cependant dans la bonne direction.