dimanche 8 avril 2012

Le carroyage avec QGIS et le plugin QMarxan, c'est facile!

Article en français 

Gridding Paris with OpenStreetMap data
"Gridding for the dummies" ;) with Quantum GIS and QMarxan: In this article, I explain the purpose of gridding, why it is such an efficient way to analyse data within a large community of actors. Actually, gridding can be considered as a transcription of the raster format to the vector one where one tile <=> one cell. Thanks to QMarxan, gridding with QGIS is really simple:  you don't need any knowledge in PostGIS, GRASS and R to do it. That's what we'll see: in the end of the post, I detail how to constitute some gridded data through a case study aiming to process a building density analysis on the city of Paris. The article is in French, but the printscreens will be helpful for the understanding. 

All the material used in this article is free: Quantum GIS, OpenStreetMap for the buildings and INSEE (equivalent of US Census) for the population data.


Maillage / Carroyage

Guide du CERTU sur les traitements en carroyage

Le CERTU (Centre d'Etudes sur les Réseaux, les Transports, l'Urbanisme et les Constructions) a publié l'année dernière un guide en téléchargement gratuit appelé Traitements géomatiques par carreaux pour l'observation des territoires qui décrit, par le biais de cas d'étude, tout le potentiel que permet la constitution de données carroyées.

Le carroyage est un mode de représentation des données vecteur par carreau. Il s'effectue en croisant d'un côté une grille (soit rectangulaire, soit hexagonale en nid d'abeilles) avec des données métier. La précision avec laquelle s'effectuera l'analyse sera alors relative au pas choisi pour la grille. Ce pas diffère selon l'échelle d'analyse.

Densité d'habitants selon l'INSEE

On peut d'ores et déjà disposer de données carroyées sur Internet. C'est le cas des données INSEE sur le nombre d'habitants disponible en téléchargement avec un pas de 1 kilomètre sur la France entière et 200 mètres sur chaque région. Le Muséum National d'Histoire Naturelle propose, lui, une grille-type pour effectuer un calcul, par carreau de 5 ou 10km, du nombre d'espèces d'un certain type de plantes ou d'animaux. Inspire propose aussi des grilles-types.

En quoi ce mode de visualisation est-il si intéressant?


Potentiel du carroyage

- Le format vecteur est généralement choisi comme base de traitements car les utilisateurs du SIG sont plus familiers de l'exploitation de ce format. Pourtant, parfois, les calculs sur raster sont plus appropriés. Le carroyage permet de transcrire au format vectoriel des méthodes rasters. L'augmentation de la taille d'un carreau s'apparente à une augmentation de la résolution (rééchantillonnage). Il est tout à fait possible d'effectuer des dénombrements, de calculer des moyennes, des écarts-types au niveau de chaque carreau, ce qui s'apparente aux calculs focaux utilisés sur les rasters.

- La transformation de données fines, précises sous la forme de carreaux permet de vulgariser la donnée, de la simplifier, en sorte. Les mailles obtenues peuvent être confrontées à la fois à un niveau spatial: un carreau par rapport à ses voisins (par ex. étude de clusters), de même que dans le temps: état d'un carreau dans un état antérieur et dans un état actuel (par ex. étude de l'évolution de la population). C'est un mode de visualisation efficace qui "élimine le bruit" et découpe le territoire en unités égales et comparables.



- Une troisième raison qui en fait un support intéressant est la possibilité d'associer plusieurs dimensions aux carreaux, comme autant de colonnes et d'attributs. On pourra alors adjoindre à chaque carreau des valeurs issues de différents domaines: environnement, transport, habitat, et de différents types: quantitative, qualitative, ordinale. On pourra faire apparaître différentes thématiques sur les choroplèthes au gré des besoins. Cette multi-dimensionnalité est difficile à atteindre avec les rasters dans la mesure où les pixels ne peuvent être associés qu'à un nombre limité de valeurs, de plus, positives. Sous R, des objets appelés SpatialGridDataFrame et SpatialPixelsDataFrame permettent d'associer à chaque pixel de nombreux attributs, comme les formats vecteur, mais R est un outil complexe qui nécessite un certain temps de prise en main.

- Cette multi-dimensionnalité montre bien que le carroyage peut être un support d'analyse partagé entre des thématiciens de différents métiers. Des urbanistes, des botanistes peuvent se servir d'une même grille comme support pour leurs calculs puis confronter leurs analyses.

En définitive, l'accessibilité, la simplification, la multi-dimensionnalité font du carroyage un support intéressant pour des analyses et des représentations de données partagées.


Carroyage sous QGIS

Sous Quantum GIS, le carroyage est à la portée de tout géomaticien. On peut en réaliser sans utiliser ni PostgreSQL, GRASS, ni R même si je ne saurais que vous conseiller de vous investir dans l'apprentissage de ces derniers.

Nativement, on peut l'exécuter par le biais de la fonction "Création de Grille" puis "Points dans un Polygone" pour des cartes de densité.


Cependant, l'année dernière, un plugin est apparu sur le dépôt d'extension appelé QMarxan qui permet d'aller plus loin. Il s'agit d'un plugin QGIS d'interfaçage avec le logiciel Marxan. 


Voici la définition que l'on trouve sur le site des parcs du Canada quant au logiciel Marxan:
"Marxan a été mis au point par des chercheurs de l'Université de Queensland pour faciliter le rezonage du parc marin de la Grande Barrière et a par la suite été utilisé un peu partout dans le monde dans le cadre de projets de planification d'aires marines. Au moyen d'un algorithme d'optimisation, ce programme sélectionne des séries de secteurs qui permettent d'atteindre des objectifs de conservation tout en réduisant au minimum les incidences socio-économiques sur les utilisateurs des milieux marins et des collectivités côtières. Les données qui y sont entrées peuvent comporter un large éventail d'éléments/de valeurs liés aux aspects écologiques, socio-économiques, culturels et à l'expérience du visiteur, y compris les espèces, les habitats, les activités récréatives et les sites culturels."

Dans cet article, nous n'exploiterons pas tout le potentiel du plugin. Nous verrons sa fonctionnalité principale, celle permettant de réaliser une grille et d'effectuer des calculs par carreau. Nous ne couvrirons pas l'exploitation des résultats sous Marxan.


Le bâti en Île-de-France

Le cas d'étude sera celui de l'analyse du bâti à Paris avec la constitution d'un carroyage décrivant la densité du bâti en terme de nombre et de surface de bâtiments. Puis, nous exploiterons le carroyage de l'INSEE afin de coupler les données concernant le bâti avec la population.

Téléchargement des données

Dans un premier temps, téléchargeons les limites administratives de la ville de Paris:
http://export.openstreetmap.fr/contours-administratifs/export-communes/

Puis les données du bâti à partir du site GeoFabrik:
http://download.geofabrik.de/osm/europe/france/ile-de-france.shp.zip

Effectuons une extraction des donnés sur la ville de Paris par le biais de l'extension "Requête Spatiale". Le temps de traitement est très long!..


Par la suite, les données bâtiments buildings seront transformées en Lambert 2 Etendu afin de les coupler par la suite (fin du tutoriel) avec les données INSEE qui sont dans ce système de projection. La couche transformée se nomme buildings_LA2E.

Dans un premier temps, il faut installer l'extension QMarxan depuis les dépôts-tiers.


Réalisation d'une grille en nid d'abeilles

Une fois le plugin installé, lançons le module de génération de grille




J'aime bien les grilles en nid d'abeilles qui sont assez esthétiques. Réalisons-en une. Nous choisirons un pas de 200 mètres comme pour l'INSEE.

Création d'une grille hexagonale sur la base du fichier de bâti

Voici le résultat du carroyage. Notre grille est pour l'instant vide de données statistiques sur le bâti.

Bâti + grille en nid d'abeilles


Calcul de la surface, du nombre de bâtiments et de la surface moyenne par carreau

Effectuons le calcul de la surface de bâti par carreau.




Le résultat est intégré à la grille:



Afin d'avoir une bonne visualisation de l'ensemble, nous avons extrait les nids d'abeille comportant une surface supérieure à 0:




Surface de bâti en 10 classes selon la méthode de Jenks

Pour avoir le nombre de bâtiments par carreau, on doit tout d'abord générer une couche de points. Nous l'appellerons buildings_ct



Centroïdes des bâtiments superposés sur la surface bâtie




Le nombre de bâtiments par carreau peut être indicatif d'un type de bâti: collectif, résidentiel, etc...

Nous pouvons calculer la surface moyenne de bâti par carreau: surface/(nombre de bâtiments)

Utilisation de la calculatrice de champ

Voici différentes choroplèthes obtenues en superposant le résultat du carroyage avec les données OpenStreetMap grâce au plugin OpenLayers de QGIS.

Nombre de bâtiments, surface de bâti et surface moyenne sur couches OpenStreetMap Paris

Couplage données nombre d'habitants et bâti sur la base d'une grille pré-existante
On peut aussi lancer les calculs en se basant sur une grille autre, par exemple celle de l'INSEE, et ensuite coupler les données habitants et bâti.

Les zones d'activité pourraient ainsi apparaître comme des zones de bâti comprenant peu d'habitants.

Téléchargeons le carroyage de l'INSEE qui se trouve en Lambert 2 Etendu. Il contient les estimations du nombre d'habitants. Un préalable, comme au départ, est de ne prendre que les carreaux situés sur Paris.


Associons ces données du bâti avec ces données de population en utilisant le carroyage existant:


 Le résultat est alors intégré dans la grille de l'INSEE:

ajout de la colonne area_built au carroyage de l'INSEE

Ouvrons le fichier dbf issu du carroyage sous OpenOffice, enregitrons-le au format ods et réalisons un graphique bivarié avec en abcisse la surface de bâtiments et en ordonnée le nombre d'habitants.


fichier ods obtenu à partir du dbf
Nous pouvons voir quelle relation existe entre le nombre d'habitants et la surface de bâti, ainsi qu'identifier des carreaux qui échappent à la tendance principale.
Identification d'un point échappant à la "tendance"

Remarque: A vrai dire, il est difficile de dégager une quelconque tendance à partir de ce graphique car dans le cas du bâti, la surface moyenne ne suffit pas à prédire le nombre d'habitants. Il faut aussi intégrer la hauteur du bâtiment ou son nombre d'étages. Cela dit, le but de cet exemple est de montrer comment le carroyage permet de confronter deux (voire plus) variables de manière efficace par le biais d'une analyse bivariée (ou multi-variée).



 Nota Bene: dans la première version de QMarxan, l'utilisation de grilles rectangulaires génère des erreurs. Aussi la dernière version a-t-elle été utilisée pour l'intégration des informations du bâti dans le carroyage de l'INSEE.


Pour ceux qui souhaitent aller plus loin dans le carroyage, je vous conseille d'utiliser R avec la librairie sp. La fonction over( ) permet de croiser dans n'importe quel ordre des données vectorielles et rasters ainsi que d'effectuer une infinité de calculs à l'intérieur de chaque carreau, ceci grâce à une fonction personnelle fn: over(x, y, returnList = FALSE, fn = NULL, ...). On peut alors envisager de calculer l'écart-type ou même l'indice écologique de diversité de Shannon. Absolument tout est possible!
Plus d'infos sur les méthodes d'agrégation spatiale avec R ici: http://cran.r-project.org/web/packages/sp/vignettes/over.pdf




7 commentaires:

  1. Bonjour,
    merci pour cet article intéressant. Juste une petite remarque : le lien vers le doc du CERTU ne fonctionne pas.
    Cyril

    RépondreSupprimer
  2. Bonjour,
    En effet, on ne semble plus le trouver sur le site du CERTU. Si quelqu'un a le lien!..

    RépondreSupprimer
  3. Bonjour,
    Le document est disponible en téléchargement sur le site du CERTU à cette adresse :
    http://www.certu-catalogue.fr/traitements-geomatiques-par-carreaux-pour-l-observation-des-territoires.html

    RépondreSupprimer
  4. Bonjour,

    Je vous remercie pour le lien. Je viens de mettre à jour l'article en conséquence.

    RépondreSupprimer
  5. Bonjour,
    Merci pour ces informations.
    Ce post date de 2012, mais je tente quand même, je bataille depuis plusieurs jours avec les données de l'INSEE et je n'ai pas trouvé le moyen de convertir (x_laea, y_laea) en (longitude, latitude). Même en regardant le site http://twcc.fr/ et en sélectionnant la bonne projection, le résultat est incohérent.
    Existe-t-il une fonction mathématique me permettant de passer des données de l'INSEE à des coordonnées géographiques que je pourrais facilement utiliser sur du Leaflet par exemple ?
    Merci d'avance pour tout conseil.

    RépondreSupprimer
  6. Bonjour,
    Tu n'as pas besoin de convertir, cliques juste sur "update from canevas".

    RépondreSupprimer
  7. Est-ce que le logiciel R est gratuit?

    RépondreSupprimer