Graphes de connaissances géohistoriques

Porteurs de l’action prospective

  • Bertrand Duménieu, Ingénieur de recherche, Centre de recherches historiques (UMR 8558 EHESS/CNRS), bertrand.dumenieu@ehess.fr
  • Nathalie Abadie, Chargée de recherche, Université de Paris-Est, IGN-ENSG, LaSTIG, STRUDEL, nathalie-f.abadie@ign.fr

Contexte et enjeux de la création et du liage de données géohistoriques

Avec l’essor des humanités numériques, le volume et la diversité des données géohistoriques présentes sur le Web vont grandissant. Un processus cumulatif pourrait exploiter cette richesse pour construire des représentations riches et à grande échelle de l’espace géographique pris dans sa profondeur historique. On peut espérer, en effet, que des données diverses et nombreuses aient des propriétés de complémentarité et de redondance qui laissent envisager la construction de référentiels géohistoriques à haut niveau de détail et dotés d’une bonne continuité temporelle.
Sur le Web, les approches de type entrepôt laissent la place à une interconnexion légère qui repose sur les bonnes pratiques du Web de données pour lier, publier et partager des données. Fondés sur l’hypothèse du monde ouvert, les standards du Web de données autorisent la construction collaborative de grands graphes de connaissances, permettant l’ajout d’informations incomplètes, imparfaites, voire contradictoires, leur intégration à l’aide de liens et l’inférence de nouvelles données à partir des connaissances fournies.

Or, il n’existe aujourd’hui aucun référentiel géohistorique de cette forme et de grande taille car les données sont disséminées sur le Web et modélisées diversement, selon les motivations de leur création et selon le champs disciplinaire et la culture technique de leurs producteurs.

Verrous scientifiques et objectifs de l’action prospective

Cette action prospective vise favoriser l’émergence de graphes de connaissances géohistoriques permettant de répondre à des requêtes spatiales et spatio-temporelles à partir de corpus de données hétérogènes et interconnectées.

Cet objectif à long terme rencontre plusieurs verrous :

  • il faut des méthodes et des ressources pour identifier et créer des liens entre jeux de données géohistoriques hétérogènes. C’est une tâche complexe pour laquelle peu d’outils existent;
  • les liens générés par les outils de liage existants sont très majoritairement des relations d’équivalence. Ils ne modélisent pas des relations spatio-temporelles entre des données issues de jeux différents;
  • dans le cas des corpus de ressources géohistoriques non structurées (document textuels, iconographie, etc.) le graphe créé ne permet généralement pas d’interroger le contenu des ressources mais seulement leurs métadonnées.

Pour répondre à ces questions, nous souhaitons développer un espace de discussion entre chercheurs en humanités numériques, géomatique, traitement d’images, TALN et représentation de connaissances. Les échanges seront mis à profit pour proposer un agenda de recherche et favoriser l’émergence de collaborations interdisciplinaires. Pour cela, nous souhaitons organiser des ateliers ou des journées d’études sur:

  • le liage de jeux de données géohistoriques,
  • la création de vocabulaires pour la représentation et l’inférence de relations spatio-temporelles,
  • les techniques d’extraction et gestion de connaissances permettant le traitement des sources d’informations non structurées,
  • le croisement de données structurées et non structurées.

Chercheurs intéressés

Vincent Alamercery (LARHRA UMR 5190 – ISH), Francesco Beretta (LARHRA, UMR 5190 – ISH), Jean-Yves Blaise (UMR CNRS/MCC 3495 MAP), Carmen Brando (CRH, UMR 8558 EHESS/CNRS), Paul Chapron (Université de Paris-Est, IGN-ENSG, LaSTIG, STRUDEL), Christophe Claramunt (MOTIM, Ecole Navale), Florence Clavaud (Conservateur en chef du patrimoine, responsable de la mission référentiels, Archives Nationales), Geraldine Del Mondo (LITIS, INSA Rouen), Valérie Gouet (Université de Paris-Est, IGN-ENSG, LaSTIG, ACTE), Clément Mallet (Université de Paris-Est, IGN-ENSG, LaSTIG, STRUDEL), Béatrice Markhoff (LIFAT, Université de Tours), Eric Mermet (CAMS – UMR 8557, EHESS/CNRS), Ludovic Moncla (LIRIS, INSA Lyon), Teriitutea Quesnot (UMR 6554 LETG, Université de Bretagne Occidentale), Cyril de Runz (CReSTIC, Université de Reims Champagne-Ardenne).