EXtraction de Connaissances à partir de donnéEs Spatialisées (EXCES)

Porteurs

Maguelonne Teisseire (TETIS, Montpellier)
Christian Sallaberry (LIUPPA, Pau)

Contexte, problématique, rationalité, enjeux

L’exploitation de données géo-spatiales disponibles sur le Web est un problème émergent. Ces données sont enfouies dans une multitude de sites web ou bien mises à disposition par des organisations dans le cadre de la politique des données ouvertes. L’analyse de telles données nécessite l’identification et l’interprétation pour la construction de connaissances : les principales problématiques sont liées à la diversité et l’hétérogénéité structurelle, sémantique, temporelle et spatiale des données ainsi qu’à leur volume (Big data). La prise en compte de la spatialité complexifie les méthodes à mettre en oeuvre et il est important de mieux maitriser et partager les enjeux associés. Des approches de visualisation et notamment de cartographie (cartographie du Web et cartographie spatio-temporelle) peuvent également être proposées pour analyser des données géographiques volumineuses et hétérogènes.
Dans le cadre de cette action, l’objectif est de rationnaliser les méthodes permettant de relier, manipuler et analyser ces informations spatiales hétérogènes afin de mieux comprendre les dynamiques globales, comme par exemple les dynamiques territoriales et faire face aux problématiques d’aménagement des territoires (manque d’espace, impact des infrastructures sur la biodiversité, tendance des évolutions urbaines).

Verrous scientifiques, objectifs de l’AP

Comment utiliser la pleine complémentarité des données disponibles et utiliser de façon efficace les dimensions thématiques, spatiales et temporelles de l’information disponible sur le Web ? Comment intégrer des sources externes de connaissances ? Ces deux premières questions qui mettent en exergue la liste non exhaustive de verrous suivante :

  • Préparation des données des corpus (Identification des données)
  • Analyse des données des corpus, monodimensionnelle ou multidimensionnelle
  • Interprétation et enrichissement des données : algorithmes, connaissances Indexation et interrogation des corpus (Recherche d’information multicritère)