Codage automatisé avec ECTMV3 – France 2017

Codage automatisé versus codage manuel dans l’indexation de résumés de textes en Médecine générale et de Famille

Collaboration

  • Département d’Information et d’informatique médicale, université de Rouen: Prof Darmoni MD, PHD, Chloé Cabot PHD, Julien Grosjean PHD
  • Département de médecine générale de l’Universite de Liège : Marc Jamoulle, MD, Doctorant ULg

Introduction

Extraire des concepts de textes médicaux est la clé de nombreuses applications avancées dans la collecte d’information médicale [1]

Objectif

Le but de cette étude est d’analyser la couverture de 2 terminologies disponibles en français et spécifiques de la médecine Générale et de Famille (CISP-2 & Q-Codes)  dans le HeTOP sur un ensemble de résumés extraits du  corpus médical français LiSSa

Méthode

Serveur multi-terminologique www.hetop.eu

Restreint aux bases terminologiques CISP-2 et Q-codes

Utilisation de l’ Extracteur de Concepts Multi-Terminologique (ECMT v3) mis au point à Rouen

Utilisation de résumés et de mots-clefs de communications de médecine de famille en langue française

300 documents à annoter manuellement et automatiquement avec chaque terminologie : 100 résumés, 100 mots-clés et 100 titres d’articles.

Comparaison entre un codage manuel par expert et un codage automatisé

Résultats attendus

Sources

[1] Cabot, C; Soualmia, LF; Dahamna, B & Darmoni, SJ. SIBM at CLEF eHealth Evaluation Lab 2016: Extracting Concepts in French Medical Texts with ECMT and CIMIND. 2016 Conference and Labs of the Evaluation Forum, CLEF,  Pages 47-60, 2016

[2] Nicolas Griffon, Matthieu Schuers, Lina Fatima Soualmia, Julien Grosjean,Gaetan Kerdelhue, Ivan Kergourlay, Badisse Dahamna, and Stefan Jacques Darmoni. A Search Engine to Access PubMed Monolingual Subsets: Proof of Concept and Evaluation in French. Journal of Medical Internet Research, 16(12):e271, December 2014.