Web Impact Factor : Un nouvel outil bibliométrique pour mesurer l'impact des sites Web.

L'exemple des CHU français

SJ. DARMONI, B.THIRION, M. DOUYERE, C. CHALHOUB, JP. LEROY

CHU de Rouen, 1 rue de Germont 76031 Rouen Cedex ;
Laboratoire Perception et Système d’Information, Institut National des Sciences Appliquées, BP08 Place Emile Blondel, 76131 Mont Saint Aignan Cedex Tel: +33.232.88.88.29 ; Courriel : Stefan.Darmoni@chu-rouen.fr
De nombreuses méthodes sont utilisées pour évaluer les journaux scientifiques sans solution standard. Une citation par d'autres articles scientifiques est considérée comme une bonne estimation de son originalité et de son importance. L'Impact Factor (IF) [1] du Journal Citation Reports (JCR) du Science Citation Index (SCI) édité par l'Institute for Scientific Information (ISI) est le critère bibliométrique le plus utilisé pour évaluer les journaux biomédicaux. La méthode de calcul et l'utilité de l'IF sont largement discutés [2]. Dans le même temps, l'Internet en général, et le Web en particulier, sont devenus sources majeures d'informations de santé. Ingwersen [2] a proposé en 1998 une adaptation de l'IF au monde de l'Internet, plus précisément pour mesurer l'impact des sites Web. L'objectif de ce travail est de présenter le Web Impact Factor (WIF) et de l'appliquer aux centres hospitalo-universitaires (CHU) français. La définition du WIF est le nombre de pages (ou de sites) ayant au moins un hyper-lien vers le site Web étudié après avoir éliminé les auto-liens, c'est-à-dire les pages du site Web étudiées qui pointent sur lui-même. Comme Ingwersen, nous proposons d'utiliser Altavista comme moteur de recherche pour calculer le WIF. 

La formule générique est la suivante :  +link:nom de domaine.nom de pays – url : nom de domaine.nom de pays, ce qui donne, par exemple, pour le CHU de ROUEN : +link: chu-rouen.fr – url: chu-rouen.fr En utilisant Altavista, nous obtenons un WIF calculant un nombre de pages. Bien entendu, ce chiffre n'est qu'une estimation en sachant qu'un seul moteur de recherche ne couvre plus aujourd'hui que moins de 20 % du Web. Pour obtenir un WIF fondé sur les sites, il faut d'une part, agréger par site le résultat précédent et détecter en utilisant d'autres moteurs de recherche ou manuellement les sites "pointant" sur le site étudié : travail chronophage, s'il en est ! Nous avons effectué ce travail pour le site du CHU de ROUEN : voir  http://www.chu-rouen.fr/dssi/html/pointeur.html.

Depuis déjà quelques années, Altavista a créé des moteurs spécifiques à certains pays, comme les Etats-Unis, le Canada ou la France. Il faut donc être rigoureux et utiliser le même moteur pour comparer une série de sites Web car les résultats obtenus par les différentes versions par pays sont différents. Pour notre travail, nous utilisons Altavista US (http://www.altavista.com). Le WIF que nous venons de définir est le WIF absolu car nous proposons d'introduire un dénominateur pour se rapprocher de l'Impact Factor de l'ISI : ce dénominateur est le nombre de pages du site Web étudié recensées par le moteur de recherche. Il est calculé par la formule +url: nom de domaine.nom de pays. Au total, nous définissons le WIF relatif par la formule suivante : (+link:nom de domaine.nom de pays -url : nom de domaine.nom de pays) / +url : nom de domaine.nom de pays. Pour illustrer le WIF, nous avons calculé le WIF absolu des CHU français (du moins ceux ayant un site Web en Octobre 2000) : voir tableau ci-dessous.

CHU

WIF absolu

Rouen

4086

Paris

1773

Lille

342

Toulouse

160

Bordeaux

152

Nancy

144

Lyon

132

Montpellier

96

Caen

91

Reims

83

Nantes

77

Poitiers

77

Nice

48

Clermont Ferrand

45

Grenoble

32

Dijon

21

Rennes

20

Besançon

14

Saint-Etienne

14

Plusieurs remarques : le WIF absolu n'est qu'un indicateur de l'impact d'un site. Il en existe de nombreux autres : outre le WIF relatif ci-dessus, citons : Le WIF a plusieurs avantages quand on le compare à l'IF: il est facile à mettre en œuvre. Tout un chacun peut calculer le WIF de son site Web (ou de celui de son concurrent) alors que le calcul de l'IF est centralisé à l'ISI. L'IF ne concerne qu'un nombre limité de revues (quelques centaines) alors que le WIF peut s'appliquer à plusieurs millions de sites Web. Si l'IF par structure ne donne qu'une image datant de deux ans, le WIF est recalculé tous les 15 jours : le temps que le moteur AltaVista indexe l'ensemble du Web qu'il parvient à détecter. Enfin, le WIF et l'IF partagent une qualité fondamentale pour un indicateur : ils sont reproductibles. Revenons au tableau 1. Si la place de numéro un de notre institution nous fait plaisir, nous devons raison garder. D'une part, nous sommes partis les premiers : en créant notre site en février 1995, nous sommes considérés à juste titre comme des dinosaures de l'Internet. De plus; en prenant comme indicateur le WIF relatif sur les trois premiers du classement précédent , les résultats s'inversent :
  1. AP-HP - WIF relatif : 1772/1122 = 1,58
  2. CHU ROUEN – WIF relatif : 4086/3016 = 1,35
  3. CHU LILLE – WIF relatif : 342/1180 = 0,30
En conclusion, le Web Impact Factor (absolu ou relatif) est un bon indicateur pour mesurer l'impact d'un site Web. Se méfier néanmoins des interprétations trop hâtives. 

References

  1. Garfield E. Fortnightly review: how can impact factors be improved? British Medical Journal. 313: 411-413,1996.
  2. Ingwersen P. The calculation of WEB impact factor. Journal of Documentation 1998;54(2):236-43.