Séminaire au laboratoire ERIC (Lyon)

Date:

Séminaire du laboratoire ERIC sur le thème du TAL et de l’apprentissage automatique appliqués au geparsing et à l’analyse géo-sémantique de textes.

Lors de ce séminaire je présenterai mes travaux de recherche en extraction d’informations géographiques et je détaillerai en particulier différents projets pour lesquels ces techniques sont développées. Je présenterai en particulier la plateforme PERDIDO qui implémente une méthode d’annotation géo-sémantique d’informations à partir de textes. Cette méthode, basée sur une approche TAL hybride, combine une analyse morphosyntaxique, une cascade de transducteurs, l’interrogation de ressources externes (gazetteer) et la structuration des informations géographiques. La méthode développée vise à marquer et formaliser les relations entre entités nommées étendues, termes géographiques, relations spatiales et expressions de déplacement. Cette méthode a été développée et enrichie lors de différentes collaborations et projets en informatique et en humanités numériques.

Je présenterai également les résultats obtenus dans le cadre du projet GéoDISCO sur le traitement et l’analyse des articles géographiques de l’encyclopédie de Diderot et d’Alembert (1751-1772) ainsi que les travaux préliminaires commencés lors du projet GEODE autour de l’analyse du discours géographique dans les encyclopédies françaises.

Je terminerai ma présentation par les résultats obtenus dans le cadre du projet HextGEO qui s’intéresse à l’entrainement de modèles de geocoding par apprentissage profond basé sur les cooccurrences de toponymes et leurs relations spatiales.