Codage automatisé versus codage manuel dans l’indexation de résumés de textes en Médecine générale et de Famille
Collaboration
- Département d’Information et d’informatique médicale, université de Rouen: Prof Darmoni MD, PHD, Chloé Cabot PHD, Julien Grosjean PHD
- Département de médecine générale de l’Universite de Liège : Marc Jamoulle, MD, Doctorant ULg
Introduction
Extraire des concepts de textes médicaux est la clé de nombreuses applications avancées dans la collecte d’information médicale [1]
Objectif
Le but de cette étude est d’analyser la couverture de 2 terminologies disponibles en français et spécifiques de la médecine Générale et de Famille (CISP-2 & Q-Codes) dans le HeTOP sur un ensemble de résumés extraits du corpus médical français LiSSa
Méthode
Serveur multi-terminologique www.hetop.eu
Restreint aux bases terminologiques CISP-2 et Q-codes
Utilisation de l’ Extracteur de Concepts Multi-Terminologique (ECMT v3) mis au point à Rouen
Utilisation de résumés et de mots-clefs de communications de médecine de famille en langue française
300 documents à annoter manuellement et automatiquement avec chaque terminologie : 100 résumés, 100 mots-clés et 100 titres d’articles.
Comparaison entre un codage manuel par expert et un codage automatisé
Résultats attendus
Sources
[1] Cabot, C; Soualmia, LF; Dahamna, B & Darmoni, SJ. SIBM at CLEF eHealth Evaluation Lab 2016: Extracting Concepts in French Medical Texts with ECMT and CIMIND. 2016 Conference and Labs of the Evaluation Forum, CLEF, Pages 47-60, 2016
[2] Nicolas Griffon, Matthieu Schuers, Lina Fatima Soualmia, Julien Grosjean,Gaetan Kerdelhue, Ivan Kergourlay, Badisse Dahamna, and Stefan Jacques Darmoni. A Search Engine to Access PubMed Monolingual Subsets: Proof of Concept and Evaluation in French. Journal of Medical Internet Research, 16(12):e271, December 2014.