vendredi 14 août 2015

Adresse et géocodage : révolution en France

Pour les spécialistes de l'adresse française une annonce n'est pas passé inaperçue au printemps 2015 : la Base d'Adresses Nationale (BAN) a enfin vu le jour.

La BANO, premier projet de centralisation d'adresses d'Open Street Map France, à vécu et mute en BAN. Fruit d'un accouchement plutôt long et douloureux, la BAN est un projet désormais industriel qui référence et géolocalise l'ensemble des adresses de France. Je renvoie vers un article sur la gestation de la BAN et l'on peut aussi voir la vidéo de présentation de la BAN par le ministre chargé de la Réforme de l’Etat, les DGs de La Poste et de l'IGN.

Le projet est complexe car il mixe les compétences et les référentiels d'organismes publics qui n'ont pas l'habitude de travailler ensemble : l'IGN, la  DGI, La Poste et bien sûr OSM France. Portés par la dynamique de l'open data, l'IGN et La Poste ont laché du lest sur l'ouverture de données cadastrales géolocalisées tout en tentant de préserver leurs revenus de redevance de données. Techniquement, le projet est géré par l'association OSM France et je crois qu'on peut lui faire confiance pour développer le contenu et les usages de la BAN sur la longue durée. Le site adresse.data.gouv.fr centralise toutes les ressources du projet :

http://adresse.data.gouv.fr/


La BAN est téléchargeable ici en format JSON et voici le descriptif de son contenu qui comprend en particulier l'identifiant Point adresse (IGN), son adresse normalisée et les coordonnées planaires. Il n’y a cependant pas les identifiants du fichier HexaPoste (Héxacle et hexavia) et il manque aussi le code censitaire géographique des quartier Iris (Ilots Regroupés pour l'Information Statistique). Des améliorations pour de prochaines versions ? 


Le projet comprend un géocodeur avec un interface. Une API de géocodage est proposée en public : http://adresse.data.gouv.fr/api/ où l’on peut faire du géocodage batch avec un fichier d’entrée plafonné à 32 MO. Nous avons passé des fichiers de  plusieurs dizaines de miliers d'adresses sans problèmes. Il ne faut cependant pas abuser sous peine de blacklistage de votre IP. Pour les très gros volumes, le logiciel et le code sont fournis en open source pour un système Linux. L'implantation est cependant assez complexe et réservée aux développeurs motivés...   
La technologie de géocoding interactif, l’auto complétion, est bluffante …, j’ai fait quelques tests, cela semble très précis (cf http://adresse.data.gouv.fr/map/). L' API d'autocomplétion est facilement intégrable dans les applications de webmapping (librairies OpenLayer et Leaflet).


La licence est libre en repartage, mais pas pour les utilisations commerciales. Ceci signifie que tout acteur qui souhaite revendre des produits constitués à partir de la BAN doit verser des redevances à l'IGN et à La Poste (en fait MédiaPost qui gère le fichier hexaposte). Comme les bases sont téléchargeables librement, il va falloir veiller à éviter les abus …

Cet environnement est à éprouver à l’usage, mais les premiers tests que j'ai réalisés confirment qu'il s'agit d'un projet très sérieux : les bases sont améliorables mais déjà très complètes et les API d'accès et de recherche d'adresses très performantes. Il s'agit donc d'une petite révolution franco française bienvenue dans le domaine de la géolocalisation …