Un jeu de données pour répondre à des questions visuelles à propos d’entités nommées en utilisant des bases de connaissances

Dans le contexte général des traitements multimodaux, nous nous intéressons à la tâche de réponse à des questions visuelles à propos d’entités nommées en utilisant des bases de connaissances (KVQAE). Nous mettons à disposition ViQuAE, un nouveau jeu de données de 3 700 questions associées à des images, annoté à l’aide d’une méthode semi-automatique. C’est le premier jeu de données de KVQAE comprenant des types d’entités variés associé à une base de connaissances composée d’1,5 million d’articles Wikipédia, incluant textes et images. Nous proposons également un modèle de référence de KVQAE en deux étapes : recherche d’information puis extraction des réponses. Les résultats de nos expériences démontrent empiriquement la difficulté de la tâche et ouvrent la voie à une meilleure représentation multimodale des entités nommées.

Mots clés

jeu de données question-réponse visuelle bases de connaissances multimodalité.

Domaines

Informatique et langage [cs.CL]

Fichier principal

968.pdf (3.82 Mo)

Origine : Fichiers éditeurs autorisés sur une archive ouverte

Yannick Parmentier : Connectez-vous pour contacter le contributeur

https://hal.science/hal-03701521

Soumis le : vendredi 24 juin 2022-16:42:49

Dernière modification le : mercredi 3 avril 2024-11:14:12

Archivage à long terme le : dimanche 25 septembre 2022-21:39:19

Dates et versions

hal-03701521 , version 1 (24-06-2022)

Identifiants

HAL Id : hal-03701521 , version 1

Citer

Paul Lerner, Olivier Ferret, Camille Guinaudeau, Hervé Le Borgne, Romaric Besançon, et al.. Un jeu de données pour répondre à des questions visuelles à propos d’entités nommées en utilisant des bases de connaissances. Traitement Automatique des Langues Naturelles (TALN 2022), Jun 2022, Avignon, France. pp.434-444. ⟨hal-03701521⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CEA UNIV-TLSE2 CNRS INRIA UT1-CAPITOLE CENTRALESUPELEC DRT GENCI CEA-UPSAY UNIV-PARIS-SACLAY LIST IRIT TALN-RECITAL LISN GS-ENGINEERING GS-COMPUTER-SCIENCE GS-SPORT-HUMAN-MOVEMENT TOULOUSE-INP UNIV-UT3 TALN-RECITAL2022 UT3-TOULOUSEINP

81 Consultations

75 Téléchargements