Incertitude épistémique : des données aux modèles en géomatique

Porteurs

Mireille Batton-Hubert (LIMOS, CNRS UMR 6158, Saint-Etienne)
Eric Desjardin (CReSTIC, EA 3804, Reims)
François Pinet (IRSTEA, Clermont-Ferrand)

Contexte, problématique, rationalité, enjeux

Cette AP est née de la nécessité de mener une réflexion sur la représentation et l’usage de l’incertitude épistémique des données en géomatique. En effet, un grand nombre de données utilisées en géomatique de l’analyse à la modélisation et à la décision sont entachées d’imperfections (imprécision, incomplétude et ambiguïté). L’incertitude épistémique provient du manque de connaissances complètes sur le phénomène considéré à laquelle sont associées différents types d’incertitude, présents dans les sources d’information, et notamment les données spatio-temporelles. La maitrise de cette dimension nouvelle à prendre en compte dans la donnée géographique nécessite de nouvelles perceptions de cette dimension dans la donnée, l’information et la connaissance associées : ce qui se traduit par une nouvelle perception de l’objet géographique et de sa sémantique. De nouveaux outils intégrés ou interfacés à des bases de données adaptées et évolutives apparaissent permettant une manipulation, un usage et une valorisation de l’Information géographique associée. Il existe un certain nombre de spécifications de référence (Devillers, et al, 2010) et de travaux en cours (Wenzhong Shi, 2011) concernant :

  • l’imprécision et l’incertitude, traitant de sa définition et sémantique jusqu’à son formalisme mathématique en particulier pour la donnée géographique ;
  • une formalisation de sa représentation ensembliste, et sa perception au niveau de l’objet géographique associé à un mode de représentation dans les bases de données spatiales (BDDR, entrepôt de données) ;
  • du raisonnement et des traitements des données imparfaites exploitant des logiques modales, topologique ou ensembliste ;
  • enfin le requêtage et la fouille de données aboutissent à la restitution et la visualisation de l’exploitation de cette nouvelle composante de l’Information géographique.

A delà de nombreux points de recherche amont sur ces quatre aspects fondamentaux, un point stratégique concerne la faisabilité du transfert de techniques/formalismes de représentation et d’outils de raisonnement associés vers des domaines applicatifs des SIG (transport, urbanisme, énergie, territoire…). En effet, il reste un pas important à faire entre les formalismes et méthodes sous-jacente (mathématiques et informatiques) et l’applicabilité et la généricité notamment dans l’analyse spatiale thématique, et ainsi identifier notamment la pertinence de la prise en compte de cette nouvelle dimension dans un certain nombre de type de problématiques.

Verrous scientifiques, objectifs de l’AP

La prise en compte de cette nouvelle dimension dans l’information géographique impose de reconsidérer :

  • l’intégration de cette dimension dans la représentation, le stockage et le requête dans les bases de données spatiales et temporelles et notamment leur devenir dans un souci de gestion grande dimension et du big data et de la transition du tout numérique avec la dimension temporelle et de la notion de smart grid ;
  • l’analyse et la modélisation de l’incertitude lors de la propagation de connaissances et de la fusion d’information compte tenu des travaux en Intelligence artificielle/informatique et en Sciences des données en particulier ;
  • la représentation et la restitution de ce type d’information dans le cadre de la visualisation et de l’aide à la décision également devant prendre en compte la pertinence du retour attendu compte tenu des attentes des nouveaux usages et moyens de communications avec les objets connectés.

Dans cette AP, une réflexion est menée sur l’incertitude, la définition des concepts, les applications et les méthodes et outils employés pour la représenter et la gérer ; il reste un nombre certain de problèmes ouverts auxquels les travaux des chercheurs de l’action pourront apporter des réponses ciblées autour notammentdu passage d’un formalisme de l’incertitude à un autre (par exemple erreur, mesure de probabilité et mesure de possibilité), de la complétude de ces différents concepts, de la propagation dans le raisonnement associé, des relations existant entre le type de formalisme mathématique pour un objet spatial caractérisé par des grandeurs scalaires, topologiques et sémantiques, etc.

L’aide à l’identification du caractère imprécis de l’information géographique dans un questionnement thématique, et la mise en oeuvre des outils adaptés restent une difficulté à ce jour. Ainsi, au-delà de ces questionnements de recherche, l’objectif de l’AP est de travailler sur la généralisation de la prise en compte de l’incertitude dans l’information géographique au travers de la diversité des approches représentées par la communauté scientifique regroupée dans cette AP.

La principale production ciblée sera un ouvrage qui décrira de façon très large les origines de des données incertaines et des méthodes à employer pour les traiter. Il s’agit d’un ouvrage ambitieux qui mobilisera une vingtaine d’auteurs spécialistes sur les différentes facettes du sujet. Au final, le livre réalisera une réelle synthèse cohérente de centaines de publications scientifiques et techniques. La théorie sera présentée dans les différents chapitres de l’ouvrage, puis illustrée de manière large sur des exemples « fils rouges ». Les outils informatiques (logiciels, boîtes à outils, etc.) à utiliser seront décrits. L’ouvrage se destine aux ingénieurs, étudiants, enseignants, scientifiques étant amenés à travailler avec des données géographiques. Le public visé est constitué de
la large communauté existante autour des données géographiques, en informatique, agronomie, géographie, urbanisme, écologie, géosciences etc.

La dimension abordée dans cette AP peut également se retrouver à l’interface d’autres APs : l’AP Energie, l’AP Analyse d’images suivi des milieux, l’AP VGICrowdsourcing et l’AP Extraction de connaissances.