Les 4 avantages d’utiliser les géodatabases

La plupart des intervenants du milieu forestier qui utilisent la géomatique sont déjà familiers avec le format shapefile. Toutefois, plusieurs d’entre eux auraient avantage à utiliser les géodatabases dans leurs tâches quotidiennes.

Plusieurs façons de stocker et structurer nos données géospatiales existent. Les deux principales approches sont de les stocker sous forme de fichiers de formes, comme un shapefile (SHP), ou une géodatabase.

Une base de données spatiales est une base de données reliée à des objets référencés géographiquement. Il s’agit donc d’un contenant qui stocke dans une seule structure plusieurs jeux de données géospatiaux.

Bien que le shapefile soit encore très utilisé, la base de données spatiale s’est imposée depuis plusieurs années comme une méthode plus efficace d’organisation de données qui offre plusieurs avantages.

Cet article concerne spécifiquement la géodatabase fichier (File Geodatabase) qui est un format spécifique à esri (logiciel ArcGIS). Il existe néanmoins d’autres bases de données spatiales, comme Oracle Spatial, Microsoft SQL Server, PostGIS (PostgreSQL) et SQLite, qui sont gratuits.

 

Qu’est-ce qu’un Shapefile (SHP) et une Géodatabase (GDB)?

Une géodatabase fichier peut contenir plusieurs couches de jeux de données. Ces couches sont des classes d’entités (feature classes). Au sein d’une classe d’entités d’une géodatabase ou d’un shapefile, on retrouve des données qui possèdent une même représentation géographique, généralement sous forme de points, de lignes ou de polygones (surfaces). La classe d’entité possède donc une représentation spatiale commune, ainsi qu’un ensemble d’attributs stockés sous forme de table attributaire.

Voici quelques exemples de couche de données que l’on retrouve couramment dans le domaine de la foresterie :

  • (Point) Camps forestiers / Parcelles d’inventaire
  • (Ligne) Tronçons de route / Ruisseaux
  • (Polygone) Blocs de traitement / Lacs / Milieux humides
La plupart des intervenants du milieu forestier qui utilisent la géomatique sont déjà familiers avec le format shapefile. Toutefois, plusieurs d’entre eux auraient avantage à utiliser les géodatabases dans leurs tâches quotidiennes.

Trois différents types d’entités vectorielles Point (placettes d’échantillonnage), ligne (chemin, ruisseau et topographie), polygone (Lacs)

 

Utilisez-vous les fichiers de couches (layer files) de manière optimale?

 

AVANTAGES

Fonctionnalités propres à la géodatabase fichier

Plusieurs fonctionnalités uniques à la géodatabase peuvent être utilisées lorsque nos jeux de données sont organisés au sein de base de données spatiales. On peut notamment créer des sous-types,  au sein d’un type d’entité qui ont des comportements et des attributs particuliers.

Une autre fonctionnalité intéressante des géodatabases est la possibilité de créer des domaines attributaires. Ceux-ci nous permettent de déterminer une plage de valeurs possibles pour un champ dans la table attributaire. La présence de domaines de valeur permet d’assurer l’intégrité des données.

Domaine de valeurs

Domaine de valeurs pour le champ DRAINAGE

 

Toujours selon cet objectif, il est également possible d’utiliser les outils relatifs à la topologie afin de déceler toutes erreurs au niveau des relations spatiales entre les entités. En utilisant des règles d’intégrité topologique, on peut s’assurer entre autres qu’il n’y a aucune erreur de superposition et de connectivité entre des éléments.

 

Une meilleure gestion des données 

Dans la GDB, toutes les couches sont stockées dans une seule structure ce qui simplifie grandement la gestion de données. Lorsque l’on travaille avec des couches sous forme de SHP, chacune d’elles est constituée de 4 à 6 fichiers, qui se doivent d’être conservés dans le même document. Lorsque partagé à un autre utilisateur, le seul oubli d’un des fichiers peut empêcher l’ouverture de la couche.

Les données stockées dans une géodatabase occupent environ le tiers de l’espace qu’elles nécessiteraient si elles étaient stockées sous forme de SHP. Les classes d’entités d’une GDB ont une capacité de stockage de 1 To chacune, contre une limite de 2 Go pour le shapefile. La GDB qui elle contient les classes d’entités, n’a pas de limite en tant que telle, sauf celle du disque dans lequel elle se trouve.
À noter qu’il est également possible de référencer des données de type matriciel (raster) dans une géodatabase (mosaic dataset), ce qui n’est pas le cas du shapefile qui ne supporte que des données de types vectoriels (c.-à-d. des polygones, lignes, et points).

 

Rapidité

La base de données utilisée dans un SHP (base de données Dbase) est plus lourde et entraîne une lenteur lorsqu’on effectue des requêtes dans les tables ou via la carte. Au sein d’une géodatabase, les performances sont au contraire optimisées et les requêtes sont plus rapides, même si le jeu de données est très volumineux. Cela est dû à sa structure de données possédant des index spatiaux et attributaires.

 

Compression

Il est possible de compresser les données vectorielles d’une géodatabase afin que celle-ci occupe moins d’espace, et ce, sans aucune perte d’information ou de performance. Cela est fait par le réencodage des données dans chaque champ vers un format plus compact. La vitesse de certaines opérations peut en être grandement accélérée.

Par contre, le fichier devient en lecture seule, et il n’est alors plus possible de le modifier. Si une mise à jour est nécessaire, il faudra décompresser le fichier préalablement. Il est donc recommandé de compresser seulement des jeux de données finaux.

 

Désavantage

La géodatabase est un format de données propriétaire à Esri, et donc il n’est en théorie pas possible d’accéder aux données si on ne possède pas un logiciel payant de cette compagnie (comme ArcGIS Desktop ou ArcGIS Pro).

Heureusement, il existe un plugin permettant d’ouvrir ces fichiers dans le logiciel gratuit QGIS. Un avantage d’utiliser des shapefiles réside dans le fait que son utilisation peut être plus accessible pour des débutants, surtout dans le cas où l’on n’utilise pas d’outils complexes.

 

CONCLUSION

Il n’est désormais plus à prouver que l’utilisation de la géodatabase surpasse de loin le shapefile, tant du point de vue de la performance que des nombreux avantages offerts par ces fonctionnalités additionnelles.

Dans un contexte où les jeux de données sont de plus en plus volumineux, l’utilisation de la GDB par les forestiers et forestières est un incontournable pour gérer, stocker, visualiser et analyser ces données efficacement.

Depuis quelques années, on constate notamment que les différents paliers gouvernementaux diffusent davantage de données ouvertes qui peuvent être téléchargées gratuitement. Les jeux de données écoforestières couvrant l’ensemble de la province peuvent être bien utiles à tout travail relié au domaine de la foresterie.

 

Pour en savoir plus sur les données gratuites du MFFP

 

Si vous désirez en savoir davantage sur les manières dont la géomatique peut faciliter votre travail, consultez la section géomatique forestière

 

Références

  1. ESRI (s.d.). Types de géodatabases. ArcGIS Help. En ligne
  2. ESRI (s.d.). Présentation d’une géodatabase. ArcGIS Help. En ligne
  3. Happ, Jena (2015). Shapefiles vs. Geodatabases. Data and Visualization Services Blog, Duke University Libraries. En ligne

Autres articles

Plus de contenu sur ce sujet...

Vous aimez ce que LBprofor vous présente ?

Suivez-nous sur Facebook.