28 janv. 2013 - 31 janv. 2014 ATALA (France)

Numéro spécial sur les Entités Nommées

Direction :

Sophia Ananiadou
Nathalie Friburger
Sophie Rosset

sophia.ananiadou AT manchester.ac.uk, nathalie.friburger AT univ-tours.fr, sophie.rosset@limsi.fr


Les entités nommées constituent un champ de recherche très actif depuis de nombreuses années. Elles sont depuis longtemps considérées comme un point central dans de nombreuses applications mettant en jeu des notions comme la compréhension, la recherche sémantique, etc.
La notion d'Entités Nommées (EN) couvre non seulement les noms propres mais aussi des entités plus complexes comme les expressions multi-mots. Les entités nommées sont en général typées selon des taxonomies plus ou moins vastes et fortement dépendantes du domaine d'application ou des besoins considérés. Elles recouvrent classiquement des noms désignant des personnes, des lieux ou des organisations mais peuvent aussi se rapporter à des notions plus techniques comme les maladies.

La détection des entités et de leurs relations, malgré de nombreuses années de recherche, reste un problème difficile. Les principaux points à résoudre incluent la résolution des ambiguïtés, la détection des synonymes, la co-référence et la variabilité (acronymes, orthographe etc.). Plusieurs méthodes ont été proposées et évaluées pour améliorer la détection et la classification
des entités ainsi que leurs relations. Ces méthodes vont des approches fondées sur des connaissances explicites (approches à base de règles, de lexiques, etc.) aux approches à base d'apprentissage supervisé, faiblement supervisé voire non supervisé.

L'évaluation des systèmes de détection des entités nécessite au minimum l'existence de corpus de référence (gold standard). L'évaluation des relations ajoute un niveau de complexité puisqu'il s'agit, le plus souvent, d'une tâche complexe impliquant la détection des entités puis des relations entre elles. Comment évaluer la détection des relations dans le cadre d'une tâche complète ? Quelle métrique utiliser pour tenir compte des erreurs de la tâche précédente (détection des EN) ?
Si les entités nommées simples permettent d'atteindre de bons voire de très bons résultats, il n'en va pas de même lorsque leur définition est complexe ou lorsqu'on traite des domaines spécialisés.
Nous invitons donc les contributions portant sur tout aspect relatif au traitement des entités nommées, et en particulier (liste non exclusive) :

  • Définition et typologie des entités nommées, y compris dans un sens étendu
  • Détection des entités nommées et type de documents (résumés, articles, ressources collaboratives comme Wikipedia, domaine de   spécialité, media sociaux comme twitter, emails, file de discussion, parole...)
  • Détection des empans et analyse structurelle des EN
  • Co-référence inter-documents et suivi d'entités
  • Suivi d'entités à travers le temps, les groupes sociaux et géographiques, suivi d'entités intra- et inter-documents, etc.
  • Reconnaissance d'entités nommées dans le domaine général ou en domaine de spécialité
  • Guides et schémas  d'annotation, outils, méthodes et corpus annotés
  • Aspects multilingues, extraction d'entités dans des corpus comparables ou parallèles
  • Désambiguïsation des entités
  • Applications et entités
  • Evaluation, comparaison et validation d'outils
   

A NOTER

DATES IMPORTANTES

  • 15 avril 2013 : Deadline pour le réumé
  • 30 avril 2013 : Deadline pour la soumission
  • Juillet 2013 : Notification aux auteurs
  • Automne 2013 : Publication

LA REVUE

Depuis 40 ans, TAL (Traitement Automatique des Langues) est un journal international publié par l'ATALA (Association pour le Traitement Automatique des Langues) avec le soutien du CNRS. Depuis quelques années, il s'agit d'un journal en ligne, des versions papier pouvant être obtenues sur commande. Ceci n'affecte en rien le processus de relecture et de sélection.

Personnes connectées : 1