Gérer et formater les données brutes
Lorsque notre client la Fondation Rivières nous a approché en 2020 pour réaliser une cartographie interactive des problématiques de déversement (surverses) des eaux usées dans les différentes municipalités du Québec, il aurait été difficile d’être plus loin de la coupe aux lèvres. Un travail exhaustif de recensement des données déversement pour les années 2011 à 2016 avait été réalisé par une équipe d’étudiants en journalisme de l’UQAM. Des données complémentaires provenant du portail de l’eau du Ministère de l’Environnement et de la Lutte contre les changements climatiques (MDDELCC), avaient également été récupérées pour les années 2017 à 2019 mais un travail d’uniformisation et de structuration des données restait à faire afin de rendre les données utilisables.

La première étape de ce mandat à donc consisté à modéliser une base de donnée relationnelle qui permettrait de garantir une structuration uniforme et optimisée des données. Une première itération de la base de données a été réalisé sur le système de gestion de base de données (SGDB) MySQL, mais pour des raisons de performance ainsi que dans le but d’avoir accès à davantage de fonctionnalités spatiales, nous avons rapidement transférer vers PostgreSQL/Postgis.
Dans le processus de structuration des données, l’une des problématiques majeures à laquelle nous nous sommes rapidement butté a été l’imprécision du positionnement des unités de traitements. En effet, dans le but de lier chaque station d’épuration à la municipalité qu’elle desservait, nous avons procédé à une analyse d’intersection entre les données de positionnement des stations d’épuration (points) et les données des territoires municipaux (polygones). Or le positionnement des stations d’épurations faisant référence à l’exutoire de celles-ci, plusieurs des stations se retrouvaient dans la mauvaise municipalité ou dans un territoire non-organisé aquatique. Une validation manuelle a donc du être réalisé pour valider la liaison des données.

L’analyse des données
Une fois les données structurées, nous avons pu commencer à analyser celles-ci afin de tracer un portrait sommaire de la situation des déversements d’eaux usées au Québec. Toute bonne analyse de données nécessite, en premier lieu, la formulation des bonnes questions. À cette étape, nous avons tiré profit de l’expertise de notre client Fondation Rivières. En effet, bien que l’analyse de données soient notre expertise, c’est le client qui possède la compréhension du domaine dans lequel il évolue.
Ainsi, nous avons travaillé à développer un indicateur de l’intensité des déversements dans le but d’obtenir la meilleure approximation possible du volume d’eaux usées déversé dans l’environnement. En effet, n’aillant pas accès au volume réel, nous avons du travailler avec les données disponibles pour calculer un volume approximatif. Nous avons donc analysé l’évolution du nombre de surverse par années, la durée des surverses par années et l’intensité des surverses par années.
Création de l’interface de consultation des données sur le web
Une fois l’analyse des données effectuées, nous avons procédé à la création des maquettes fils de fer (Wireframe) en collaboration avec Thibault Landel Designer UX/UI. L’objectif a cette étape étant de présenter l’information de le plus simplement possible afin de permettre à citoyen lambda de consulter cette carte sans que celui-ci aient besoin d’être un expert dans le domaine. Pour se faire. nous avons créé une carte interactive et avons créé des graphiques de lignes brisées ainsi que des graphiques à barre pouvant être consulté en cliquant sur l’entité spatiale d’une municipalité.

Résultats
Grâce à cette cartographie interactive, notre client à pu non seulement prendre connaissance de l’état de la situation, mais à également pu communiquer cette problématique au publique de façon simple et concise et ainsi mobiliser les acteurs du milieu afin d’entreprendre un chantier de réduction des déversements d’eau usée dans les diverses municipalité.