https://www.data.gouv.fr/fr/reuses/modele-de-questions-reponses-francophone/ - Mouve

Site d'origine

Modèle etalab-ia/camembert-base-squadFR-fquad-piaf

Lien du modèle sur Hugging Face Hub

Intro

Modèle francophone de questions-réponses, utilisant comme base CamemBERT fine-tuné sur la combinaison de trois jeux de données francophones de questions-réponses:

  1. PIAFv1.1
  2. FQuADv1.0
  3. SQuAD-FR (SQuAD traduit automatiquement au Français)

Utilisation

from transformers import pipeline

nlp = pipeline('question-answering', model='etalab-ia/camembert-base-squadFR-fquad-piaf', tokenizer='etalab-ia/camembert-base-squadFR-fquad-piaf')

nlp({
    'question': "Qui est Claude Monet?",
    'context': "Claude Monet, né le 14 novembre 1840 à Paris et mort le 5 décembre 1926 à Giverny, est un peintre français et l’un des fondateurs de l'impressionnisme."
})

Citation

PIAF

@inproceedings{KeraronLBAMSSS20,
  author    = {Rachel Keraron and
               Guillaume Lancrenon and
               Mathilde Bras and
               Fr{\'{e}}d{\'{e}}ric Allary and
               Gilles Moyse and
               Thomas Scialom and
               Edmundo{-}Pavel Soriano{-}Morales and
               Jacopo Staiano},
  title     = {Project {PIAF:} Building a Native French Question-Answering Dataset},
  booktitle = {{LREC}},
  pages     = {5481--5490},
  publisher = {European Language Resources Association},
  year      = {2020}
}

FQuAD

@article{dHoffschmidt2020FQuADFQ,
  title={FQuAD: French Question Answering Dataset},
  author={Martin d'Hoffschmidt and Maxime Vidal and Wacim Belblidia and Tom Brendl'e and Quentin Heinrich},
  journal={ArXiv},
  year={2020},
  volume={abs/2002.06071}
}

SQuAD-FR

 @MISC{kabbadj2018,
   author =       "Kabbadj, Ali",
   title =        "Something new in French Text Mining and Information Extraction (Universal Chatbot): Largest Q&A French training dataset (110 000+) ",
   editor =       "linkedin.com",
   month =        "November",
   year =         "2018",
   url =          "\url{https://www.linkedin.com/pulse/something-new-french-text-mining-information-chatbot-largest-kabbadj/}",
   note =         "[Online; posted 11-November-2018]",
 }

Discussions

Discussion entre l'organisation et la communauté à propos de ce jeu de données.

level de log mis à 1

Récupération du document https://www.data.gouv.fr/fr/reuses/modele-de-questions-reponses-francophone/.

Récupération de l'URL https://www.data.gouv.fr/fr/reuses/modele-de-questions-reponses-francophone/...

Raccourcis

Commandes

Fermer