Un jeu de données pour répondre à des questions visuelles à propos d’entités nommées en utilisant des bases de connaissances - Conférences TALN RECITAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2022

Un jeu de données pour répondre à des questions visuelles à propos d’entités nommées en utilisant des bases de connaissances

Résumé

Dans le contexte général des traitements multimodaux, nous nous intéressons à la tâche de réponse à des questions visuelles à propos d’entités nommées en utilisant des bases de connaissances (KVQAE). Nous mettons à disposition ViQuAE, un nouveau jeu de données de 3 700 questions associées à des images, annoté à l’aide d’une méthode semi-automatique. C’est le premier jeu de données de KVQAE comprenant des types d’entités variés associé à une base de connaissances composée d’1,5 million d’articles Wikipédia, incluant textes et images. Nous proposons également un modèle de référence de KVQAE en deux étapes : recherche d’information puis extraction des réponses. Les résultats de nos expériences démontrent empiriquement la difficulté de la tâche et ouvrent la voie à une meilleure représentation multimodale des entités nommées.
Fichier principal
Vignette du fichier
968.pdf (3.82 Mo) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03701521 , version 1 (24-06-2022)

Identifiants

  • HAL Id : hal-03701521 , version 1

Citer

Paul Lerner, Olivier Ferret, Camille Guinaudeau, Hervé Le Borgne, Romaric Besançon, et al.. Un jeu de données pour répondre à des questions visuelles à propos d’entités nommées en utilisant des bases de connaissances. Traitement Automatique des Langues Naturelles (TALN 2022), Jun 2022, Avignon, France. pp.434-444. ⟨hal-03701521⟩
81 Consultations
75 Téléchargements

Partager

Gmail Facebook X LinkedIn More