bandeau_carte_marine

Ateliers > Extraction et recherche Information Géographique

Extraction et Recherche d’Information Géographique

Matinée du lundi 23 septembre 2013, à partir de 9h30

 

Porteur du projet : Christian Sallaberry (christian.sallaberry@univ-pau.fr), Mauro Gaio (mauro.gaio@univ-pau.fr), Jean-Christophe Desconnets, Thierry Joliveau

 

Programme :

09h30-09h45 : Bienvenue et présentation générale de l’atelier

Nous commençons par un tour de table et listons les domaines de recherche dans lesquels les participants travaillent. Les verrous scientifiques correspondants seront précisés au fil de la matinée et nous allons en rediscuter dans notre réflexion de clôture.

L’atelier aura un conférencier invité et trois sessions suivies d’une discussion de clôture. Chaque session débutera par un exposé d'environ 15 minutes. Ces présentations seront suivies de questions et d’une discussion ayant pour but d’identifier les sujets émergeants du domaine. Pour chaque session, nous avons également identifié une lecture préliminaire, que nous suggérons de consulter avant l’atelier.

 

09h45-10h30 Sentiment, territoire et société

Le projet SENTERRITOIRE réunit des chercheurs dont les domaines de compétence concernent (i) l'analyse des dynamiques territoriales, (ii) l’accompagnement des usagers dans l’appropriation de l’information géographique, (iii) l’extraction automatique dans les documents numériques de descripteurs géo-spatiaux et la fouille d’opinion, (iv) la représentation des connaissances et la recherche d’information. Pour une meilleure analyse de la perception des territoires par les différents acteurs impliqués, ce projet se décline en deux étapes. La première consiste en la récolte des données numériques (ensemble des informations disponibles sur le territoire), leur éventuelle agrégation et structuration. La seconde vise, d'une part, la mise à disposition de ces données afin de permettre une interrogation et restitution adaptées aux besoins des acteurs territoriaux et, d'autre part, leur mise en relation dans un objectif de découverte de nouvelles connaissances.

Conférencier invité : Maguelonne Teisseire ou Mathieu Roche « SENTERRITOIRE : territoire, acteur et sentiment »

Lecture conseillée :                                    

Gérard Dray, Michel Plantié, Ali Harb, Pascal Poncelet, Mathieu Roche, and François Trousset (2009). “Opinion Mining From Blogs”. In proceedings of International Journal of Computer Information Systems and Industrial Management Applications (IJCISIM), ISSN: 2150-7988 Vol.1 (2009), pp.205-213 (http://hal.archives-ouvertes.fr/docs/00/80/79/63/PDF/IJCISIM_Vol_1_Paper_16.pdf)

Sabiha Tahrat, Eric Kergosien, Sandra Bringay, Mathieu Roche, and Maguelonne Teisseire (2013). “Text2Geo: from textual data to geospatial information”. In proceedings of International Conference on Web Intelligence, Mining and Semantics, Spain

(http://hal-lirmm.ccsd.cnrs.fr/docs/00/81/62/77/PDF/Tahrat_wims13.pdf)

 

10h30-11h Extraction et Recherche d’Information Géographique dans des corpus textuels 

L’extraction et l’interprétation d’informations spatiales et temporelles contenues dans des documents textuels est au cœur de ces préoccupations. Ainsi, nous proposons des modèles de représentation de données spatiales et temporelles nécessaires à ce repérage, à l’interprétation et à la représentation de références toponymiques ou calendaires mais aussi de relations spatiales ou temporelles. Nous proposons également des chaines de traitement dédiées à la reconnaissance et à la résolution d’entités nommées spatiales et temporelles.

Ces résultats d’extraction et d’annotation sont ensuite exploités à des fins d’indexation et de recherche d’information multicritère tenant compte des caractéristiques spatiales, temporelles et thématiques contenues dans les documents et les requêtes.

Intervenant : Christian Sallaberry, Mauro Gaio « Des exemples de corpus textuels et d’images recensés dans le cadre de l’AP ERIG ainsi que des exemples d’annotation de documents »

Lecture conseillée :

Purves R., Jones C., (2011). “Geographic Information Retrieval”, SIGSPATIAL Special, vol. 3, num. 2, p. 2-4, ACM

Christopher B. Jones, Ross S. Purves, (2008). “Geographical information retrieval”, International Journal of Geographical Information Science (GIS) 22(3):219-228

Gaio M., Nguyen V.T., Sallaberry C., (2012). “Typage de noms toponymiques à des fins d’indexation géographique”, Revue Traitement Automatique des Langues, Vol. 53, n° 2, p. 143-176

 

11h-11h30 Extraction et Recherche d’Information Géographique dans des corpus d’images ou hybrides (textes, images, cartes, …)

L’extraction et la recherche d’information géographique dans des corpus d’images s’appuient le plus souvent sur des IHM peu adaptées aux non experts du domaine, rendant délicat le processus de filtrage et de sélection des données. De plus, le modèle de recherche sous-jacent est souvent frustre. Il induit le plus souvent des réponses soient trop nombreuses, on parle alors de moteur de recherche « bavard », soient nulles, on parle alors de moteur « muet ». Deux pistes pourraient être investies pour améliorer la précision et le rappel des moteurs de recherche d’information géoréférencées :

-          dans la phase amont à la recherche en aidant l’utilisateur à formuler sa demande par l’intermédiaire d’IHM et de vocabulaire adapté à son expertise,

-          dans la phase de recherche, à proprement parler, en mettant en œuvre des modèles de recherche  plus flexibles que ceux actuellement utilisés.

Intervenant : Jean-Christophe Desconnets, Thérèse Libourel « Extraction et recherche d’information dans des corpus d’images »

Lecture conseillée :

Vestavik Ø. Geographic Information Retrieval: An Overview. Internal Doctoral Conference, IDI, NTNU

Bucher B., Clough P., Purves R., Syed A., (2005). Geographic IR system: requirements and evaluation, 22nd International Cartographic Conference (ICC'05), 9-16 July, A Coruña (Spain)

 

11h30-12h Usages, méthodes et problèmes dans les thématiques SHS : géographie, histoire, archéologie, sociologie

La question de l’Extraction et de la Recherche d’Information Géographique à partir d’un corpus documentaire composé de textes, d’images fixes ou animées, ou d’ensembles combinés de ces différentes formes trouve des usages dans de multiples activités. Au moment où les questions de géolocalisation et d’analyse des distributions des phénomènes dans l’espace se généralisent, il devient de plus en plus nécessaire de disposer d’outils pour extraire des éléments de localisation absolue ou relative, à partir du contenu de documents ne comportant pas d’indication explicite et formalisée. Il peut s’agir de pages de sites Web, de fichiers d’offre d’emploi ou de petites annonces, de journaux de voyage, d’articles de blog, d’annonces de presse, mais aussi de photographies, de vidéos ou de films ou même de rapports comportant des cartes ou d’Atlas. Ces techniques intéressent de nombreuses disciplines en Sciences humaines et Sociales, la géographie au premier chef mais aussi l’histoire et l’analyse des sources, les sciences de l’information et de la communication, les études littéraires ou cinématographiques ou la sociologie confrontée à l’analyse géographique des entretiens ou des récits de vie. Ces questions recouvrent en partie celle des SIG qualitatifs.

Du côté de l’informatique et des sciences du numérique en général, de nombreux travaux sont en cours que l’Action Prospective ERIG « Extraction et Recherche d’Information Géographique » vise à soutenir, développer et mettre en synergie. Du côté des applications et des SHS, l’enjeu est plus de repérer, confronter et systématiser des usages de ces techniques, des types de besoin associés soit à des pratiques professionnelles soit à des problématiques de recherche. La rencontre de ces deux groupes devrait permettre de faire émerger des classes de problème et des stratégies de solution susceptibles de produire des méthodes et outils adaptés

Intervenant : Thierry Joliveau « Usages d’information géographique »

 

12h-12h30 Discussion de clôture

Réflexion avec l’ensemble des participants pour notamment :

-   Dresser un premier panorama des travaux de la communauté sur ces thèmes ;

-   Identifier les principaux verrous associés à ces thèmes ;

-   Planifier les prochains RDV pour une collaboration suivie visant quelques un des verrous précédents ;

-   Planifier l’animation d’autres ateliers/workshops nationaux ou internationaux.

 

Personnes connectées : 1