sophia.ananiadou AT manchester.ac.uk, nathalie.friburger AT univ-tours.fr, sophie.rosset@limsi.fr
Les entités nommées constituent un champ de recherche très actif depuis de nombreuses années. Elles sont depuis longtemps considérées comme un point central dans de nombreuses applications mettant en jeu des notions comme la compréhension, la recherche sémantique, etc. La notion d'Entités Nommées (EN) couvre non seulement les noms propres mais aussi des entités plus complexes comme les expressions multi-mots. Les entités nommées sont en général typées selon des taxonomies plus ou moins vastes et fortement dépendantes du domaine d'application ou des besoins considérés. Elles recouvrent classiquement des noms désignant des personnes, des lieux ou des organisations mais peuvent aussi se rapporter à des notions plus techniques comme les maladies.
La détection des entités et de leurs relations, malgré de nombreuses années de recherche, reste un problème difficile. Les principaux points à résoudre incluent la résolution des ambiguïtés, la détection des synonymes, la co-référence et la variabilité (acronymes, orthographe etc.). Plusieurs méthodes ont été proposées et évaluées pour améliorer la détection et la classification des entités ainsi que leurs relations. Ces méthodes vont des approches fondées sur des connaissances explicites (approches à base de règles, de lexiques, etc.) aux approches à base d'apprentissage supervisé, faiblement supervisé voire non supervisé.
L'évaluation des systèmes de détection des entités nécessite au minimum l'existence de corpus de référence (gold standard). L'évaluation des relations ajoute un niveau de complexité puisqu'il s'agit, le plus souvent, d'une tâche complexe impliquant la détection des entités puis des relations entre elles. Comment évaluer la détection des relations dans le cadre d'une tâche complète ? Quelle métrique utiliser pour tenir compte des erreurs de la tâche précédente (détection des EN) ? Si les entités nommées simples permettent d'atteindre de bons voire de très bons résultats, il n'en va pas de même lorsque leur définition est complexe ou lorsqu'on traite des domaines spécialisés. Nous invitons donc les contributions portant sur tout aspect relatif au traitement des entités nommées, et en particulier (liste non exclusive) :
Définition et typologie des entités nommées, y compris dans un sens étendu
Détection des entités nommées et type de documents (résumés, articles, ressources collaboratives comme Wikipedia, domaine de spécialité, media sociaux comme twitter, emails, file de discussion, parole...)
Détection des empans et analyse structurelle des EN
Co-référence inter-documents et suivi d'entités
Suivi d'entités à travers le temps, les groupes sociaux et géographiques, suivi d'entités intra- et inter-documents, etc.
Reconnaissance d'entités nommées dans le domaine général ou en domaine de spécialité
Guides et schémas d'annotation, outils, méthodes et corpus annotés
Aspects multilingues, extraction d'entités dans des corpus comparables ou parallèles
Désambiguïsation des entités
Applications et entités
Evaluation, comparaison et validation d'outils
A NOTER
DATES IMPORTANTES
15 avril 2013 : Deadline pour le réumé
30 avril 2013 : Deadline pour la soumission
Juillet 2013 : Notification aux auteurs
Automne 2013 : Publication
LA REVUE
Depuis 40 ans, TAL (Traitement Automatique des Langues) est un journal international publié par l'ATALA (Association pour le Traitement Automatique des Langues) avec le soutien du CNRS. Depuis quelques années, il s'agit d'un journal en ligne, des versions papier pouvant être obtenues sur commande. Ceci n'affecte en rien le processus de relecture et de sélection.