À propos de CISMeF

CISMeF : pourquoi, comment ?

Responsables éditoriaux :

  • Stéfan Darmoni, Professeur des universités – praticien hospitalier
    Liens d'intérêt
    Le Pr. SJ. Darmoni est actionnaire des sociétés IS@S et Informed 79 travaillant dans le médicosocial. Il n’a reçu aucun émolument de ces deux sociétés depuis l’année 2011.
  • Benoit Thirion, Bibliothécaire

Contact : maitre-toile.cismef@chu-rouen.fr

Sommaire :
1. Introduction
2. Matériel et méthodes
3. Réalisation du catalogue
4. Résultats
5. Discussion
6. Justification
7. Perspectives
Références

Résumé

L’Internet est aujourd’hui devenu une source majeure et incontournable d’informations de santé. Ce projet a pour objectif le Catalogage et l’Indexation des Sites Médicaux de langue Française (acronyme : CISMeF) accessibles sur l’Internet.

CISMeF est un projet initié par le Centre Hospitalier Universitaire de Rouen – Hôpitaux de Rouen. Il a débuté dès l’existence du site Web du CHU en février 1995. Son adresse URL est http://www.chu-rouen.fr/cismef/ ou http://www.cismef.org/. Ce catalogue indexe les principaux sites et documents francophones. Il a dépassé les 43.000 ressources indexées en mai 2008 avec une moyenne de 55 nouvelles ressources par semaine.

Cette liste de sites contient un classement thématique, en particulier des spécialités médicales, un classement alphabétique, et un accès par type de ressources. Depuis juin 2000, l’outil associé, Doc’CISMeF, permet d’effectuer des recherches dans le catalogue de ressources, et offre des possibilités de recherche plus étendues.

CISMeF utilise deux outils standards pour organiser l’information : le thesaurus MeSH (Medical Subject Headings) utilisé notamment pour la base de données bibliographique Medline et le format de métadonnées du Dublin Core. Chaque site indexé comprend une notice descriptive. CISMeF adhère aux principes de qualité de l’information de santé sur l’Internet, développé à la fois par le Net Scoring développé en collaboration avec Centrale Santé et par la grille Health on the Net (HON). CISMeF est un outil utile pour la communauté francophone, professionnel de santé ou cyber-citoyen : chaque jour ouvré, 30.000 ordinateurs se connectent sur ce site représentant environ 40.000 personnes.

Prix, partenaires et financements

Dans le cadre de la procédure « Autoroutes de l’Information », CISMeF a obtenu en mars 1998 le label « Expérimentation d’Intérêt Public » par le Comité Interministériel des Autoroutes et Services de l’Information.

Depuis novembre 1998, CISMeF fait partie des actions prioritaires financées par l’Agence Universitaire de la Francophonie (AUF) dans le cadre du programme de l’Université Virtuelle Francophone (UVF).

Dans le cadre du programme Educnet, Doc’CISMeF a obtenu en juin 2000 un financement par le Ministère de la recherche.

Stéfan Darmoni et Benoit Thirion, coordinateurs du projet CISMeF, ont obtenu, pour ce travail, le titre de Lauréats de l’Académie nationale de médecine par l’attribution du prix Albert Sézary en octobre 2000.

CISMeF a obtenu le prix des jeudis de l’ATICA aux Electrophées 2003, dans la catégorie « Réutilisation des données et XML ».

Pour plus de détails, voir les partenaires et les financements de CISMeF.

Pour obtenir d’avantage de détails sur l’utilisation de CISMeF et de Doc’CISMeF, voir la rubrique Aide.

Mots-clés (MeSH)

Analyse et indexation [abstracting and indexing] ; catalogage [cataloging] ; France; Internet; MEDLINE ; National Library of Medicine (U.S.) ; descripteur [subject headings] ; subvention gouvernementale non USA [support, non-U.S. gov’t]; vocabulaire contrôlé [vocabulary, controlled] ;

1. Introduction

L’Internet est devenu aujourd’hui une source majeure et incontournable d’informations scientifiques et médicales [Schatz97]. Pour le professionnel de santé, trouver l’information adéquate sur l’Internet n’est pas une tâche aisée [Thirion98]; d’où la multiplication des annuaires et des outils de recherche [Flannery95]. Mais par expérience, les sites-catalogues généralistes, comme Yahoo France [http://www.yahoo.fr/], et les moteurs de recherche comme Google [http://www.google.fr/] ne nous ont jamais permis d’obtenir de manière claire et organisée une présentation de l’information disponible en médecine, limitant ainsi son utilisation potentielle. En neurologie par exemple, un panorama des ressources disponibles n’existe pas. Ces sites-catalogues généralistes et ces moteurs de recherche contiennent pourtant un nombre impressionnant de sites médicaux mais l’organisation et la hiérarchie de leurs données ne sont pas adaptées à la médecine. Nous avons besoin d’une classification spécialisée et hiérarchisée dont la consultation de l’arborescence permet d’ « en savoir plus »en s’élevant ou en descendant dans la hiérarchie.

Pour assister le professionnel de santé dans sa quête d’informations électroniques, certains sites tentent de recenser manuellement ou automatiquement les différents sites existants. En effet, l’Internet a engendré un changement de paradigme : il a permis de passer de la problématique de l’accès à l’information à celle du tri dans l’avalanche d’informations.

Il nous paraît illusoire, sans l’aide d’une classification humaine rigoureuse, d’organiser de façon cohérente des ressources aussi diverses que des associations de patients, journaux électroniques, listes de diffusion, recommandations de bonne pratique clinique, unités INSERM, etc… Une sélection humaine rigoureuse, effectuée par des professionnels de l’information appuyés par des réseaux d’experts, nous paraît être actuellement l’approche la plus raisonnable et la plus efficace pour avoir accès à une partie de la richesse inouïe de ce réseau. Il devient donc urgent, devant l’ampleur de la tâche, de mettre en place des projets coopératifs et de construire des sites fédérateurs d’initiatives visant à sélectionner, décrire et indexer les ressources présentes sur l’Internet. Le catalogage partagé est plus que jamais d’actualité.

Le but de CISMeF est d’assister les professionnels de santé dans leurs quêtes d’informations et de connaissances électroniques disponibles sur l’Internet. Le cadre de CISMeF est centré sur la santé et les sciences médicales, dépassant la médecine proprement dite. Trois axes prioritaires ont été définis : les ressources concernant l’enseignement, la médecine factuelle (recommandations pour la bonne pratique clinique et conférence de consensus) et les documents spécialement destinés aux patients et au grand public, dans le but de participer à l’amélioration de l’éducation sanitaire dans le monde francophone. Nous avons proposé que l’indication du niveau de preuve devienne le critère de qualité du contenu médical sur l’Internet, en cas d’information ‘sensible’, c’est-à-dire tout information impliquant une décision médicale.

CISMeF est un projet initié par le Centre Hospitalo-Universitaire (CHU) de Rouen. Son URL (Universal Resource Locator) est http://www.chu-rouen.fr/cismef/. CISMeF a débuté en février 1995, dès la création du site Web du CHU de Rouen qui fut le premier créé d’un hôpital français. SJ. Darmoni et B. Thirion en sont les deux maitres-toile).

Le cadre de CISMeF est centré sur la santé et les sciences médicales, dépassant la médecine proprement dite. Trois axes prioritaires ont été définis : les ressources concernant l’enseignement, la médecine factuelle (recommandations pour la bonne pratique clinique et conférence de consensus) et les documents spécialement destinés aux patients et au grand public, dans le but de participer à l’amélioration de l’éducation sanitaire dans le monde francophone.

L’équipe CISMeF est co-dirigée par Stéfan Darmoni, professeur d’informatique médicale à la faculté de médecine de Rouen et Benoit Thirion, conservateur des bibliothèques. Pour plus d’information, voir le reste de l’équipe SIBM. Sur le plan universitaire, l’équipe CISMeF est rattachée à l’équipe TIBS (Traitement de l’Information en Biologie et Santé) du laboratoire LITIS EA 4108 : voir ici, nos publications.

Face au nombre croissant de ressources intégrées au catalogue et au besoin de répondre à des requêtes de plus en plus précises, le CHU de Rouen a initié un nouveau projet : la création de Doc’CISMeF en juin 2000. Doc’CISMeF est l’outil qui permet d’effectuer des recherches dans le catalogue de ressources CISMeF, en proposant des possibilités de recherche plus étendues et plus performantes, tout en utilisant la même structure de modèle d’information

En conclusion, la création du  » site-catalogue  » manuel CISMeF est justifiée par : (a) l’avalanche d’informations potentiellement accessibles, (b) la difficulté de séparer clairement les informations pour les professionnels de celles pour les patients, (c) le manque de spécificité des moteurs de recherche [Darmoni 96] tels que Google quand on les compare aux meilleurs sites-catalogues qui utilisent le thesaurus de Medline pour indexer les sites, et enfin et surtout, (d) la nécessité absolue en médecine de connaître la source et la qualité de l’information. Il est difficile, surtout pour les plus jeunes et les débutants, d’évaluer la qualité des sites.

Cette liste de ressources contient un classement thématique, en particulier des spécialités médicales, un classement alphabétique, et un accès par type de ressources. Depuis juin 2000, nous avons créé un outil de recherche Doc’CISMeF, permettant d’effectuer des recherches dans le catalogue de ressources, et offre des possibilités de recherche plus étendues.

CISMeF utilise deux outils standards pour organiser l’information : le thesaurus MeSH (Medical Subject Headings) utilisé notamment pour la base de données bibliographique Medline et le format de métadonnées du Dublin Core. Chaque site indexé comprend une notice descriptive. CISMeF adhère aux principes de qualité de l’information de santé sur l’Internet défini par la Health on the Net (HON) Foundation depuis 10 ans maintenant. De nombreux travaux de recherche ont été menés autour du thésaurus MeSH, en créant de nouveaux concepts, comme les métatermes et les types de ressources. Depuis 2005, un changement stratégique a eu lieu : nous passons de l’univers mono-terminologique à un univers multi-terminologique. En 2012, le moteur de recherche est passé de monolingue à multilingue.

2. Matériel et méthodes
2.1. Matériel et logiciel

CISMeF a été implanté à l’origine en février 1995 sur une machine SUN avec Unix comme système d’exploitation. Actuellement, Doc’CISMeF utilise une ferme de quatre serveurs HP Proliant DL380 sous Linux (Debian Etch) avec le serveur d’application HTTP Tomcat 5.5 et la base ORACLE XE. La répartition de charge entre les différents serveurs Tomcat se fait via le module jk d’un serveur Apache 2.
La partie serveur terminologique utilise un serveur HP Proliant DL380 sous Linux (Debian Etch) avec un serveur Apache 2.2, PHP 5.2 et une base MySQL 5.0.

Nous avons successivement utilisé différents logiciels de statistiques, Getstats version 1.2., NetIntellect, puis enfin Webtrends version 4.5) pour évaluer l’utilisation de ce site après exclusion des requêtes effectuées par les machines du CHU.

2.2. Standards

CISMeF est réalisé en HTML statique. Nous avons originellement utilisé le standard HTML 2.0 pour que ce site soit lisible par la grande majorité des navigateurs. Nous utilisons maintenant le standard plus récent HTML 4.0. Depuis juin 2001, le standard XML est également utilisé, pour permettre une interopérabilité avec d’autres catalogues ou serveurs de ressources (voir un exemple de notice au format HTML et XML).

Nous utilisons le format RDF (into HTML) pour présenter toutes nos métadonnées.

Ce catalogue utilise également des outils standards pour organiser l’information : plusieurs ensembles d’éléments de métadonnées (données concernant les données) dont l’objectif est d’améliorer la recherche d’information (nous utilisons notamment le format de méta-données du Dublin Core [Panchyshyn], et les métadonnées HIDDEL) ainsi que le thesaurus MeSH (Medical Subject headings) utilisé notamment pour la base de données bibliographique Medline [NLM98a].

3. Réalisation du catalogue
3.1 Le caractère francophone

En novembre 1994, lors de la connexion initiale du CHU de Rouen à l’Internet, nous avons rapidement constaté l’absence de « sites-catalogues » des ressources francophones dans la santé. Il existait en revanche d’excellents « sites-catalogue » anglophones.

CISMeF recense exclusivement les ressources en français de toute provenance. Nous ne cataloguons pas les sites français de langue anglaise. Le nombre de sites et documents catalogués dans CISMeF dépasse les 43.000 ressources, avec 50 nouvelles ressources en moyenne par semaine ; nous estimons que ce nombre représente environ 10 % de la production mondiale, celle-ci est en grande majorité en anglais.

CISMeF affirme également la présence du français et de la France sur l’Internet. La méthodologie CISMeF comprend 3 étapes : recensement des ressources, filtrage et sélection, description et indexation. Une aide bibliothécaire est en charge du recensement des nouveaux sites, quatre documentalistes sont chargés de leur description et indexation. Le responsable de la bibliothèque médicale est « super-indexeur », en charge de la vérification de l’indexation. Des réunions fréquentes avec les deux médecins informaticiens permettent l’étude des cas difficiles. Depuis 2008, un univers multi-terminologique est utilisé pour indexer les ressources.

3.2. Le recensement des sites et des documents

Le recensement des sites et des documents est effectué grâce à une veille quotidienne sur les annuaires multidisciplinaires francophones permettant une consultation de leurs nouveautés : Nomade, Toile du Québec, Yahoo, …. En 2003, un total de 2.229 administrateurs de sites (maître-toile), soit 17 % des ressources indexées, nous ont signalé leur existence : la plupart ne répondent aux critères de sélection de CISMeF. Une veille complémentaire est effectuée sur des sites producteurs de documents : ministères, agences gouvernementales, sociétés savantes. Enfin une visite régulière de sites majeurs en médecine et une lecture de la presse médicale et des quotidiens nationaux nous permettent de compléter notre recensement. Sont indexées en priorité les sites des institutions et des sociétés savantes ainsi que la documentation en émanant : recommandations pour bonne pratique clinique, conférences de consensus, matériels d’enseignement, et rapports. Les ressources concernant l’enseignement ainsi que les informations à destination des patients font également partie de nos axes prioritaires.

La politique éditoriale de CISMeF a progressivement évolué concernant les sites commerciaux : depuis le début de l’année 2000, nous ne les recensons plus. Ainsi, pour connaître les sites commerciaux dans la santé, nous conseillons d’utiliser d’autres outils de recherche. CISMeF ne recense maintenant que les sites institutionnels et documents en émanant. Les sites personnels de patients sont exceptionnellement acceptés.

3.3. Filtrage et sélection : comment l’information est validée

Dans l’objectif de n’inclure que des ressources de qualité, CISMeF a utilisé le référentiel des critères de qualité de l’information de santé sur l’Internet (Net Scoring), développé en collaboration avec Centrale Santé, groupe de travail français fédéré par l’Ecole Centrale de Paris. Ce groupement professionnel est destiné à réunir les ingénieurs intéressés par l’ingénierie des technologies en santé et des professionnels de santé afin d’offrir une plate-forme neutre de réflexion. Le groupe de réflexion sur le Net Scoring a réuni médecins, bibliothécaires médicaux, ingénieurs et juristes. Il a collaboré avec APUI-Santé (laboratoire des technologies de l’information unifiant des réseaux de savoir et de compétences par différents réseaux numériques).

Depuis 1998, CISMeF adhère également aux huit principes émis par la grille Health on the Net (HON) HON est devenu un standard de fait. En novembre 2007, la Haute Autorité de Santé a choisi HON pour certifier les sites e-santé en France.

Le Net Scoring comprend 49 critères regroupés en huit classes principales : crédiblité, contenu, hyper-liens, design, interactivité, aspects quantitatifs, déontologie, et accessibilité. Certains de ces critères sont inspirés d’un livre blanc américain [Ambre97]. Ces critères permettront d’appliquer aux différents sites un ou plusieurs scores tenant compte entre autres des éléments suivants :

  • nom et logo de l’institution présents sur tous les documents d’un site ;
  • nom et titres de l’auteur mentionnés pour chaque document ;
  • date de création et date de dernière mise à jour de chaque document ;
  • pertinence et utilité d’un site ;
  • présence d’un comité éditorial ;
  • citation des sources originales ;
  • interactivité avec les utilisateurs.

Nous pouvons illustrer cette interactivité :

  • une vingtaine de courriers électroniques hebdomadaires nous sont envoyés pour une aide à la navigation et à la recherche d’informations.
  • Approximativement 9 % des sites indexés l’ont été après envoi d’un courriel ou d’un formulaire.

Il nous a semblé impératif que le projet CISMeF respecte également ces critères de qualité de l’information de santé. Nous attachons une attention toute particulière au fait que les auteurs doivent être clairement identifiés et les cibles indiquées avec précision. Cela nécessite parfois quelques courriels avec les responsables des sites.

La description d’un site doit également permettre d’évaluer la qualité de l’information fournie. Certains sont refusés, notamment parce qu’ils ne respectent pas certains critères déontologiques. Nous ne recensons pas les sites personnels, sauf s’ils contiennent un contenu informationnel de grande qualité. L’information sur un site n’est valable bien sûr qu’à l’instant « t » et la qualité du site devra être révisée périodiquement.
Nous nous appuyons également, pour valider certaines ressources, sur un réseau d’experts locaux ou externes à notre institution, constitué au fil du temps et composé de professionnels de santé à même de juger de l’utilité et de la qualité des sites à indexer.

3.4 Description et indexation

Le catalogage d’un site se justifie à double titre : connaître à l’avance le type d’information présente (gain de temps) et évaluer son contenu.

Chaque ressource est décrite à l’aide des champs suivants, parmi les 15 du projet Dublin Core : titre, auteur, description, site éditeur, date, identifiant (url), format, langue, mots clés et types de ressources. Sept autres champs sont spécifiques de CISMeF et Doc’CISMeF : institution, ville, département, pays, coût, parrainage, public concerné.

Concernant les ressources pédagogiques, destinées aux étudiants, certains éléments du format IEEE 1484 Learning Object Metadata (LOM) (« cycle » et « année d’études » par exemple) sont ajoutés. Nous utilisons 11 éléments de la catégorie « Educational » de LOM, en attendant la création définitive du DC.Education qui s’inspirera du format LOM. S’il s’agit d’un document répondant à une question d’internat, nous indiquons le numéro de la question concernée (établi selon un classement national).

Pour les ressources de médecine factuelle, CISMeF a défini deux champs spécifiques : « indication du niveau de preuve » et « méthode » pour le déterminer.

Actuellement, nous indiquons dans les métadonnées de nos documents HTML les éléments suivants du Dublin Core :

<meta name= »DC.Creator » content= »équipe CISMeF ; cismef@chu-rouen.fr »>
<meta name= »DC.Format » content= »(SCHEME=IMT)text/html »>
<meta name= »DC.Language » content= »(SCHEME=RFC1766)fr »>
<meta name= »DC.Publisher » content= »Rouen University Hospital ; Centre hospitalier universitaire de Rouen « >
<meta name= »DC.Rights » content= »Copyright CHU de Rouen. Toute utilisation partielle ou totale de ce document doit mentionner la source »>
<meta name= »DC.Subject.Keywords » content= »(SCHEME=MeSH)sérologie HIV; AIDS serodiagnosis »>

Plusieurs sites dans la santé ont adopté le Dublin Core : citons Australian Department of Health and Aged Care [http://www.health.gov.au/], Better Health Channel [http://www.betterhealth.vic.gov.au/], National Health and Medical Research Council [http://www.nhmrc.health.gov.au/], et l’OMS (Organisation Mondiale de la Santé) [http://www.oms.ch/].
Pour en savoir plus, voir l’utilisation des métadonnées Dublin Core dans le domaine de la santé et un article en anglais détaillant l’utilisation du Dublin Core dans CISMeF.

Nous avons choisi le thésaurus MeSH, utilisé notamment pour Medline qui est la base de données bibliographiques la plus utilisée au monde. Elle est produite par la bibliothèque nationale américaine de médecine (National Library of Medicine-US). Son thésaurus a l’avantage d’être précis, rigoureux et mis à jour annuellement. En 2015, il contient plus de 27.000 termes traduits : les MeSH (Medical Subject Headings). Ces termes sont organisés hiérarchiquement sur 11 niveaux. Nous utilisons également la traduction en français de ces mots clés, réalisée par le réseau DiscDoc de l’Institut National de la Santé et de la Recherche Médicale (INSERM). Dans certains cas qui restent rares, les ressources ne peuvent être parfaitement indexées avec le MeSH ; nous utilisons alors un « mapping » manuel pour rechercher le terme MeSH le plus propre, par exemple les ressources traitant de dysmélie ont été indexées avec le terme MeSH ectromélie.

Avant 2001, notre indexation ne tenait compte que des thèmes traités de manière importante. Ainsi, la pondération existante dans Medline (MeSH Major Topic qui est la possibilité de réduire une recherche aux références les plus pertinentes) n’était pas utilisée, chaque mot clé étant de facto considéré comme majeur dans CISMeF. Depuis 2001, toutes les ressources sont indexées avec des mots clé en majeur ou mineur.

De même les qualificatifs, qui permettent de préciser le sens d’un mot clé, et d’en souligner un aspect particulier, ne sont pas utilisés de façon aussi systématique dans CISMeF que dans Medline. La localisation géographique est mentionnée, lorsqu’elle peut compléter une information, pour une association ou un hôpital par exemple.

Bibliothèque médicale et scientifique de l’IGR [site éditeur IGR Institut Gustave Roussy. Centre européen de lutte contre le cancer ; renseignements pratiques, présentation des collections et des services]. Villejuif-Fr
mots clés : oncologie médicale
type : bibliothèque

Depuis 2012, nous utilisons également les MeSH Concepts pour indexer les ressources CISMeF… ce que la NLM ne fait pas (encore) . Pour plus d’information : Darmoni, SJ; Soualmia, LF; Letord, C; Griffon, N; Jaulent, MC; Thirion, B & Névéol, A. Improving information retrieval using MeSH Concepts: a test case on rare and chronic diseases. J Med Libr Assoc ,  Volume 100, Number 3, Pages 176-83, 2012.

L’indexation est susceptible de varier entre les différents indexeurs. Le niveau d’accord dans le choix des termes est appelé consistance. Voici les chiffres pour la consistance de CISMeF (mesurée avec un échantillon de 10 ressources, méthode de Hooper [Hooper65]) :
– La consistance globale est de 30%
– La consistance sur les mot clés MeSH majeurs est de 40%
– La consistance pour les types de ressources est de 55%.

La description d’un site doit aussi permettre d’évaluer la qualité de l’information fournie. Ce point est fondamental en particulier dans le domaine de la santé. Chaque site indexé comprend une « notice descriptive courte » incluse dans les pages des mots clés (pour les ressources indexées au mot clé majeur), ainsi qu’une « notice descriptive longue » (exemple : http://doccismef.chu-rouen.fr/html/nl/09/009780.html).

Le « type de ressource » [Darmoni99] est une généralisation des types de publication de Medline. Nous y avons ajouté des types caractéristiques des ressources présentes sur l’Internet : association, information pour le patient, réseau coordonné, etc… Ce champ « type de ressources » fait l’objet d’un développement particulier à CISMeF, rejoignant en ceci le camp des structuralistes du projet Dublin Core, par opposition aux « minimalistes » qui préconisent un type de ressources par trop réducteur à nos yeux. Nous estimons nécessaire, en effet, de pouvoir distinguer cours, QCM (Questions à Choix Multiples), APP (Apprentissage Par Problèmes), d’une ressource textuelle quelconque.
Le type de ressource ne doit pas être confondu avec le mot clé. Par exemple, une conférence de consensus sur l’hépatite C sera indexée au mot clé hépatite c avec comme type de ressource table ronde consensus. Par contre un article traitant de la méthodologie des conférences de consensus sera indexé au mot clé table ronde consensus avec article de périodique comme type de ressource. Certains termes sont tantôt un mot-clé décrivant le sujet (exemple département anesthésie hôpital), tantôt un type de ressources, utilisé comme répertoire (exemple répertoire des départements hospitaliers d’anesthésie).

Enfin, depuis 2002, pour qualifier la qualité de l’information, nous utilisons le langage HIDDEL dans le cadre du projet européen MedCIRCLE (http://www.medcircle.org/). Les 270 principaux sites éditeurs qui produisent des documents de qualité seront évalués (120 le sont déjà). Le but de ce projet est l’interopérabilité entre les institutions participantes, basée sur un échange de fichiers au format RDF (Resource Description Framework). Un logo MedCIRCLE sera attaché à chacune des notices CISMeF correspondant à ces sites éditeurs : CISMeF devient donc un tiers de confiance explicite.

3.5. Structure du catalogue, classification

CISMeF contient un classement thématique, incluant les principales spécialités biologiques et médicales reconnues en France, un classement alphabétique, tous deux inspirés du thésaurus de Medline et un accès par type de ressources.

Méta-terme
Les méta-termes correspondent à des spécialités biologiques ou médicales concernées par un ou plusieurs mots clés (ou arborescences de mots clés), qualificatifs, ou types de ressources [Thirion 99]. Par exemple pour le terme cancérologie, on trouve d’abord les sites généraux consacrés à la spécialité puis les arborescences, mots clés et qualificatifs du thesaurus MeSH concernant cette spécialité : antinéoplasiques (arb), marqueur biologique tumeur (arb), oncologie médicale (arb), secondaire (qualificatif), service oncologie hôpital (MeSH), service oncologie hôpital (type de ressource), tumeurs (arb). D’autres termes bénéficient également de cette structure, lorsque leur thématique le justifie, exemple enseignement et éducation.

A l’intérieur de ces arborescences, chaque mot clé correspond à une page, par exemple, infection hospitalière. Chaque page est organisée à l’aide des qualificatifs hiérarchisés puis, au sein de ceux-ci, à l’aide des types de ressources.

CISMeF est donc structuré en 4 niveaux hiérarchiques :

méta-terme

mot-clé

qualificatif

type de ressources

Le classement alphabétique utilise les termes MeSH en français de la traduction effectuée par l’INSERM, et indique également les termes américains (indiqués entre crochets), ce qui permet une recherche bilingue. A ce jour, nous avons indexé des ressources correspondant à 10 627 mot-clés, soit environ 48% du thesaurus MeSH (version 2004). Nous entreprenons progressivement la traduction des définitions (« scope note ») du thesaurus.
L’utilisation du MeSH en français de l’INSERM nous permet de maintenir une cohérence quant au choix des termes retenus. La consultation de l’arborescence du thesaurus américain en ligne [http://www.nlm.nih.gov/mesh/MBrowser.html] nous permet de déterminer si le mot clé appartient à une ou plusieurs catégories. Ainsi le mot clé « alcoolisme » doit-il être répertorié à la fois dans les arborescences « troubles liés environnement » et « troubles mentaux » . Dans CISMeF, nous développons les arborescences dans l’ordre alphabétique français, avec les accents. Il est, en effet, indispensable de pouvoir naviguer dans les arborescences afin d’élargir ou au contraire affiner une recherche par mots clés. Une navigation « dynamique » est possible en cliquant sur l’icône arborescence et permet de visualiser en un seul clic l’ensemble des arborescences auxquelles le mot-clé appartient.

Cette organisation des données est assez délicate à manipuler, mais offre l’avantage d’allier logique et cohérence. Elle permet en effet d’établir trois classements proches de ceux du MeSH : arborescence (tree) [ par exemple, maladies virales ], alphabétique et permuté. Ce dernier est consultable par le moteur.

Enfin, il est aussi possible d’accéder directement aux types de ressources, lorsque celles-ci font l’objet d’un répertoire particulier, exemple faculté de médecine.

Dans la terminologie CISMeF, outre les mots clés et les qualificatifs qui décrivent le sujet de la ressource, les types de ressources concernent la nature des informations véhiculées. Ce concept s’applique à la ressource dans sa globalité et il est impossible, jusqu’à présent, d’appliquer un type de ressource à une partie de document. Il n’est pas possible d’utiliser les types de ressources pour spécifier un aspect particulier d’un mot clé ou d’un couple mot clé / qualificatif.

L’objectif est de pouvoir faire une recherche plus précise permettant de trouver, par exemple, des images d’une pathologie particulière. Jusqu’à présent, la pathologie était représentée par une indexation par mots clés, et le type de la ressource concernait la ressource dans sa globalité, en ne tenant pas compte de la présence du type d’images dans le document. Le but est donc d’obtenir davantage de précision lors de l’indexation et de la recherche d’information, en permettant la recherche d’images par leur contenu.

Cette idée nous a été apportée par l’existence d’un troisième sujet de thèse (de Filip Florea) qui a débuté en novembre 2003 dans l’équipe CISMeF, concernant l’indexation bimodale texte-image.

91 types de ressources correspondant à des images médicales ont d’abord été créés. Cette liste est en partie dérivée de l’arborescence du mot clé MeSH diagnostic par imagerie, et elle a été revue et mise à jour par un expert en imagerie médicale (le Pr Jean-Nicolas Dacher). L’utilisation de cette nouvelle liste de types de ressources pour l’indexation de documents médicaux contenant des images, permet de rendre le processus d’indexation plus précis. Ainsi, par exemple, une ressource pédagogique concernant la lithiase cholédocienne et contenant des images échographiques de cette pathologie sera indexée avec le mot clé lithiase cholédocienne et les types de ressources échographie et matériel enseignement. Et, si elle contient un paragraphe décrivant l’échographie de la lithiase cholédocienne, la ressource sera indexée avec le mot clé lithiase cholédocienne auquel le qualificatif échographie sera affilié (soit le couple lithiase cholédocienne / échographie) ainsi que le type de ressource matériel enseignement.

La lacune de ce système est que les types de ressources se trouvent toujours être « flottants », c’est-à-dire qu’ils concernent l’ensemble des mots clés choisis pour l’indexation d’une ressource, un même document pouvant concerner plusieurs pathologies différentes, et donc être indexé avec des mots clés très divers. Par exemple, un cours est indexé aux mots clés cardiomyopathie hypertrophique, cardiopathie congestive et cardiomyopathie restrictive et aux types de ressource radiographie et matériel enseignement. Le type de ressource radiographie a été choisi parce que la ressource contient une image concernant la cardiopathie hypertrophique. Lors d’une recherche, un utilisateur peut vouloir trouver une ressource présentant une radiographie de la cardiopathie congestive et formuler la requête booléenne suivante : « cardiopathie congestive.mc AND radiographie.tr » qui renverra notre ressource précédemment décrite alors que l’image contenue concerne la cardiopathie hypertrophique.

Pour affiner la procédure d’indexation et de recherche d’information, l’idéal est de pouvoir associer un type de ressource à un mot clé ou à un couple mot clé / qualificatif, pour ainsi composer un triplet mot clé / qualificatif type de ressource. Ainsi, une ressource contenant des images radiographiques de la cardiopathie congestive sera indexée avec le couple cardiopathie congestive / diagnostic. Si l’image permet le diagnostic de la cardiopathie congestive, la ressource sera indexée avec le triplet cardiopathie congestive / diagnostic radiographie. Seul un nombre de types de ressource spécifiques peuvent être affiliés à un mot clé ou un couple mot clé / qualificatif.

Cette extension du couple mot clé / qualificatif au triplet mot clé / qualificatif type de ressource améliore le processus de recherche d’information. La requête de forme « (mot clé / qualificatif) AND type de ressource » est moins pertinente qu’une requête de forme « mot clé / qualificatif type de ressource ».

Il faut, malgré tout, pouvoir traiter l’ambiguïté de certaines requêtes. Ainsi, un utilisateur formule, en langage naturel (par le formulaire de recherche simple de Doc’CISMeF), une requête de la façon suivante : diagnostic de la lithiase cholédocienne par échographie. Il est impossible à ce stade de savoir si l’utilisateur souhaite un texte expliquant l’échographie dans le but du diagnostic de la lithiase cholédocienne, ou une image échographique permettant le diagnostic de la lithiase cholédocienne. Dans le doute, pour l’instant, les résultats proposés englobent pour l’instant une union des deux, à savoir les textes explicatifs sur la technique d’imagerie ainsi que les images elles-mêmes.

4. Résultats

CISMeF est efficace pour retrouver des ressources francophones de qualité dans la santé. Sur un échantillon représentatif de 600 ressources (sites et documents), 70% proviennent de France, 16 % du Canada, et en particulier du Québec, 4% de Suisse et de Belgique, et 3% d’Afrique.

Ce site Web est principalement et initialement dévolu au professionnel de santé, bien que le grand-public puisse y accéder. Beaucoup de ressources intéressent les deux publics. Toutes les pages de CISMeF sont en libre accès et gratuites. Ainsi, nos « utilisateurs » sont non seulement des professionnels de santé, mais aussi des patients, leurs familles et le grand public [Thirion99]. Nous jugeons qu’une formation à CISMeF devient indispensable pour utiliser toutes ses fonctionnalités, notamment son modèle de structuration de l’information à 4 niveaux. Deux sessions de formation ont été effectuées en février 1999 pour une association de patients (URAPEI).

CISMeF a trois axes principaux : (a) la médecine factuelle, (b) l’enseignement, et (c) l’information aux patients. Nous recensons également :

  1. hôpitaux, centre de soins et cliniques,
  2. institutions,
  3. affaires sociales,
  4. bibliothèques médicales,
  5. journaux électroniques,
  6. bases de données et bibliographies,
  7. éditeurs médicaux,
  8. associations (de professionnels et de patients).

Depuis février 1995, plusieurs nouvelles fonctionnalités ont été ajoutées pour faciliter la recherche d’informations : une rubrique « Quoi de neuf » pour visualiser rapidement les nouveautés sur le site, en particulier les nouveaux sites référencés, et un outil de recherche Doc’CISMeF. Un guide d’utilisation est disponible en ligne. CISMeF est accessible par le dénominateur le plus commun de la technologie Internet.

5. Discussion

L’Internet facilite la communication entre professionnels de santé et avec le grand public. Il améliore également l’accès à l’information et à la connaissance pour ces deux publics. Nous distinguons plusieurs types de services pour retrouver l’information de santé sur l’Internet :

  • niveau 1 : moteur de recherche, généraliste ou spécialiste comme MedHunt [http://www.hon.ch/MedHunt/]
  • niveau 2 : catalogue de sites et index sans thésaurus structuré : par exemple Medical Matrix [http://www.medmatrix.org/] et MedWebPlus-Us [http://www.medwebplus.com/]
  • niveau 3 : catalogue de sites et index avec thésaurus structuré : celui de UMLS (Unified Medical Language System) metathesaurus [NLM98b] ou le thésaurus MeSH de Medline. Ce dernier est utilisé par MedWebPlus, US [http://www.medweb.emory.edu/MedWeb/], CliniWeb [http://www.ohsu.edu/cliniweb/], Oregon Health Sciences University-US, DDRT, Diseases, Disorders and Related Topics [http://www.mic.ki.se/Diseases/index.html], de la bibliothèque et du centre d’information médicale de l’Institut Karolinska (Stockholm, Suède) et OMNI (Organising Medical Networked Information – UK) [http://omni.ac.uk/] [Norman] et Health on the Net [http://www.hon.ch/] [Boyer97].
  • niveau 4 : catalogue de sites, index avec thésaurus structuré, métadonnées et description des sites. A notre connaissance, CISMeF, Healthinsite-Au [http://www.healthinsite.gov.au/] et l’Infobanque des GPC de l’AMC Association Médicale Canadienne ont atteint ce niveau 4 : On trouve dans OMNI aujourd’hui environ 4.500 ressources recensées, essentiellement britanniques. C’est peu, comparés aux plus de 8.000 sites de MedWebPlus, ou aux 40.000 de MedHunt, mais nous pensons que c’est le type de serveur dont les professionnels de santé et d’information de santé ont besoin pour utiliser au mieux les ressources de l’Internet [Darmoni 96].

OMNI et MedWebPlus utilisent le thésaurus UMLS. OMNI, HON et CliniWeb ont également développé une base de données structurée de leurs ressources (HTML dynamique), ce qui permet de meilleures recherches, notamment pour l’utilisateur expérimenté. Cette fonction a été mise en ligne en juin 2000, avec la création de Doc’CISMeF.

Il est difficile, spécialement pour les étudiants, les patients et le grand-public d’évaluer la qualité de l’information des ressources de santé disponibles sur l’Internet, qui n’ont pas été dans la plupart des cas soumis à un comité de pairs. C’est pourquoi nous avons dévelopé une approche spécifique pour les patients, leur famille et le grand public : CISMeF-patients.

Le principal objectif de CISMeF est de promouvoir les bonnes pratiques médicales et l’enseignement des professionnels de santé et l’éducation sanitaire du grand public, en permettant l’accès aux ressources de qualité dans ces domaines. C’est pourquoi nous recensons en priorité les ressources traitant de médecine factuelle, d’enseignement pour les professionnels de santé et d’information pour les patients et le grand-public. Nous avons récemment proposé que l’indication du niveau de preuve devienne le critère de qualité du contenu médical sur l’Internet, en cas d’information ‘sensible’ [Darmoni01].

6. Justification

CISMeF permet dès aujourd’hui de démocratiser l’accès des professionnels de santé mais aussi des patients aux inforoutes francophones de la santé. Orienté en priorité pour les professionnels de santé, CISMeF est de plus en plus utilisé par les patients et leurs familles voire le grand-public. De nombreux sites sont dévolus aux deux publics (professionnels de santé d’une part, patient, familles et grand-public d’autre part). Nous avons organisé lors du premier trimestre 1999 nos premières sessions de formation à CISMeF pour les associations de patients (URAPEI).

L’organisation de CISMeF autorise aussi la découverte « par hasard » de sites voisins. Ainsi, lors d’une recherche sur l’hémiplégie, peut-on découvrir l’existence de sites sur la paraplégie (relation de proximité) et, plus généralement, en remontant dans l’arborescence, sur la paralysie (relation de hiérarchie). De même, le renvoi d’orientation « voir aussi » (par exemple « voir aussi les soins palliatifs » sur une page consacrée à la douleur) nous semble très délicat à manier pour un algorithme, même sophistiqué ! Ces renvois sont le fruit d’une réflexion et non d’un calcul statistique. C’est cette même réflexion qui permet de leur donner un sens (une direction). Ainsi la réciprocité n’est pas toujours de mise. S’il est justifié de faire un renvoi de la douleur vers les soins palliatifs et la bioéthique, le renvoi de la bioéthique vers la douleur ne doit pas être systématique.

CISMeF étant aujourd’hui le « site-catalogue » de référence dans la santé francophone, il contribue au développement de l’aire d’éducation, de formation et de recherche, en recensant notamment les sites francophones traitant des ces trois domaines connexes. Par nature, CISMeF participe à la circulation des contenus francophones, en établissant une vigie des sites et documents francophones dans la santé. Ainsi, CISMeF contribue à la valorisation et à l’utilisation du patrimoine francophone dans la santé. CISMeF affirme également la présence du français et de la France sur l’Internet. Ainsi, il permet des échanges d’informations entre les acteurs de la communauté francophone des six continents, grâce à la naissance du septième, le cyber-espace.

Les nouvelles technologies de l’information rendent possible l’accès à la connaissance et le partage des progrès scientifiques à un coût extrêmement faible, ce qui a comme conséquence de désenclaver les pays en développement en les associant à la communauté scientifique internationale francophone.

Ces facilités leur donnent la possibilité de confronter leurs connaissances et de valoriser leurs travaux en les rendant accessibles au plus grand nombre. CISMeF est de plus un outil important de diffusion de la formation continue des professionnels de santé. Au total, CISMeF participe à l’optimisation des pratiques de soin.

Pour des raisons de protection juridique (un certain nombre de sites Web effectuant du « Web-pillage » de notre site), les 2 maîtres-toile (administrateurs du site) du CHU de Rouen, et responsables du projet CISMeF, ont, avec l’accord du Directeur Général du CHU, publié les ouvrages « Annuaire de l’Internet médical francophone » [Darmoni97] et « Internet Médical professionnel » [Cassagne2000]. Une des raisons du succès de notre site pourrait résulter de la synergie entre les deux maîtres-toile qui sont tous les deux des professionnels de l’information (1 médecin informaticien, 1 bibliothécaire) ayant néanmoins une vision différente sur celle-ci [Braude94, Braude95].

Dans le cadre de la procédure « Autoroutes de l’information » , CISMeF a obtenu en mars 1998 le label « Expérimentation d’Intérêt Public » par le Comité Interministériel des Autoroutes et Services de l’Information. Depuis novembre 1998, CISMeF fait partie des actions prioritaires financées par l’Agence Universitaire de la Francophonie (AUF) dans le cadre du programme de l’Université Virtuelle Francophone (UVF). Pour les ressources concernant l’enseignement, une collaboration a été instituée avec la commission pédagogique de la Conférence Internationale des Doyens de facultés de Médecine d’Expression Française (CIDMEF) [Denef99]. Dans le cadre du programme Educnet , Doc’CISMeF a obtenu en juin 2000 un financement par le Ministère de la recherche. Stéfan Darmoni et Benoit Thirion, coordinateurs du projet CISMeF, ont obtenu pour ce travail le titre de Lauréats de l’Académie nationale de médecine par l’attribution du prix Albert Sézary en octobre 2000. CISMeF a obtenu le prix des jeudis de l’ATICA aux Electrophées 2003 dans la catégorie « Réutilisation des données et XML ».

Voir la liste des partenaires.

7. Perspectives

Nous nous proposons d’enrichir le projet CISMeF en développant quatre nouveaux modules :

  1. l’extension de CISMeF vers les pays du Sud (Tunisie et Burkina-Faso pour l’Afrique et Vietnam pour l’Asie) dans le cadre du programme Université Virtuelle Francophone, financé par l’Agence Universitaire de la Francophonie.
  2. la maintenance d’un référentiel de critères de qualité de l’information de santé sur l’Internet : le Net Scoring, en collaboration avec Centrale Santé et APUI-Santé. Une étape supplémentaire serait la « certification » des sites médicaux francophones. Cette grille pourrait constituer un élément constitutif de cette certification, afin d’informer au mieux le « cyber-médecin ». Elle peut également aider les acteurs d’Afrique et d’Asie à l’auto-évaluation et la réalisation par les pays du Sud de sites Web conformes aux critères de qualités internationaux.


CISMeF est un des éléments majeurs du projet plus global Internet/Intranet au CHU de Rouen, qui s’étendra dans les prochaines années, autour de 3 axes :

(a) la diffusion d’informations de santé dans le cadre du développement de l’Université Médicale Virtuelle Francophone (UMVF) devenue Université Numérique Francophone des Sciences de la Santé et du Sport (UNF3S) et de la Bibliothèque Electronique de Rouen (Faculté-CHU) avec des prolongements régionaux, nationaux, européens et francophones. Le CHU et la Faculté de médecine de Rouen font partie du consortium de sept facultés de médecine (Grenoble, Lille, Marseille, Nancy, Paris, Rennes, et Rouen) financés par le Ministères de l’Education Nationale, de la Recherche et de la Technologie pour créer une Université Médicale Virtuelle Francophone (UMVF). [URL : www.unf3s.org].

Références
[Ambre97] Ambre J, Guard R, Perveiler FM, Renner J, Rippen H. Health Information Technology Institute. Working Draft White Paper: Criteria for Assessing the Quality of Health Information 8 April 1999. [Web document, accessed 10 May 1999] Available from Internet: <http://www.mitretek.org/hiti/showcase/documents/criteria.html>.

[Boyer97] Boyer C, Baujard O, Baujard V, Aurel S, Selby M, Appel RD. Health On the Net automated database of health and medical information. International Journal of Medical Informatics 1997; 47(1-2): 27-9.

[Braude94] Braude RM. Medical librarianship and medical informatics: a call for the disciplines to join hands to train tomorrow’s leaders. J Am Med Inform Assoc 1994 Nov-Dec;1(6):467-8

[Braude95] Braude RM, Florance V, Frisse M, Fuller S. The organization of the digital library. Acad Med 1995 Apr;70(4):286-91

[Cassagne2000] Cassagne H, Darmoni SJ, Thirion B. Internet médical professionnel. Guide pour les recommandations de bonne pratiques et l’enseignement. Editions MMI, Paris, 2000.

[Centrale Santé98] Centrale Santé. 20 Avril 1998 (Page consultée le 10 Mai 1999). Net scoring : critères de qualité de l’information médicale sur l’Internet, (En ligne). Adresse URL : http://www.chu-rouen.fr/dsii/publi/critqualv2.html

[Darmoni96] Darmoni S.J. Thirion B. – Indexing the Web ? A comparative study of three medical Web servers on the Internet: Cliniweb, « Diseases, Disorders and Related Topics », Omni.Mednet 96, European Congress of the Internet in Medicine, Brighton, Royaume-Uni, Octobre 1996, pp 5-6 (version mise à jour)

[Darmoni97] Darmoni SJ, Thirion B. Annuaire de l’Internet médical francophone 1997. Editions Médicales Spécialisées, Paris, 1997.

[Darmoni98] Darmoni SJ, Benichou J, Thirion B, Fuss J. Medline: centralised CD-ROM vs. decentralised Intranet access. Mednet 98, World Congress of the Internet in Medicine, p 39.

[Darmoni99] Darmoni SJ, Thirion B. A standard metadata scheme for health resources. J Am Med Inform Assoc 2000; Jan-Feb;7(1):108-109.

[Darmoni01] Darmoni SJ, Haugh MC, Lukacs B, Boissel JP. Quality of health information about depression on internet: Level of evidence should be gold standard. BMJ 2001;322:1366 (2 June).

[Denef99] Denef JF. Nouvelles technologies et professionnalisation médicale. Rev. Educ. Méd. 1999; (in press)

[Flannery95] Flannery MR. Cataloging Internet resources. Bull Med Libr Assoc 1995; 83(2): 211-5.

[Hennebo2008] Hennebo N.Le cadre théorique du concept de Web triangulation. Une analyse par théorisation ancrée du dialogue médecin-patient lié à l’Internet durant la consultation [Thèse de médecine]. Faculté de médecine de l’université Lille 2; 2008.232 p. Accessible en ligne à l’adresse http://www.thesehennebo.com/ [consulté le 02/02/2009].

[Hersh96] Hersh WR. Brown KE. Donohoe LC. Campbell EM. Horacek AE. CliniWeb: managing clinical information on the World Wide Web. Journal of the American Medical Informatics Association 1996 ; 3(4): 273-80.

[Hooper65] HOOPER, R.S. Indexer consistency test-origin, measurements, results and utilization. Bethesda: IBM Corporation, 1965

[Ingwersen98] Ingwersen P. The calculation of WEB impact factor. Journal of Documentation; 1998; 54 (2): 236-243.

[NLM98a] National Library of Medicine. Fact Sheet Medline. 6 July 1998 [Web document, accessed 11 Jan 1999] Available from Internet: <http://www.nlm.nih.gov/pubs/factsheets/medline.html>

[NLM98b] National Library of Medicine. Fact Sheet UMLS Metathesaurus. 7 January 1998 [Web document, accessed 11 Jan 1999] Available from Internet: <http://www.nlm.nih.gov/pubs/factsheets/online_indexing_system.html>

[Norman98] Norman F. Organizing Medical Networked Information (OMNI). Medical Informatics 1998 ; 23 : 43-51.

[Panchyshyn97] Panchyshyn RS, BouthillierF. Cataloguer le cyberespace : le défi des ressources électroniques. Documentation et bibliothèques vol 43, numéro 3, juillet – septembre 1997.

[Schatz97] Schatz BR. Information Retrieval in Digital Libraries: Bringing Search to the Net. Science 1997; 275: 327-34.

[Thirion98] Thirion B, Darmoni SJ. Les sites médicaux francophones sur Internet : le devoir d’ingérence des bibliothèques [format *.pdf]. Bulletin des Bibliothèques de France, 1998, n 3, pp 42-5.

[Thirion99] Thirion B, Darmoni SJ. Simplified access to MeSH Tree Structures on CISMeF. Bull Med Libr Assoc 1999; Oct;87(4):480-1.

[Weibel98] Weibel S, Juha H. DC-5: The Helsinki Metadata Workshop; A Report on the Workshop and Subsequent Developments. D-Lib Magazine 1998. Available from Internet: <http://www.dlib.org/dlib/february98/02weibel.html>.

 

Consulter les statistiques d’utilisation de CISMeF

Dernière modification : 05 août 2015