Découverte de documents

La prise en compte des pratiques et usages propres aux acteurs d’un domaine applicatif donné nous amènera à proposer un mécanisme original d’appariement (matching) entre une requête et des documents indexés. Il ne s’agit pas seulement de chercher à minimiser une distance sémantique entre des documents et une requête mais aussi de considérer un cadre d’interprétation relatif au type d’utilisateur impliqué ainsi qu’à la nature de son activité de recherche. Le profil de l’utilisateur et de son activité aura un impact sur le résultat de la découverte de documents à la fois sur la pertinence estimée des documents, leur niveau de précision et de technicité et sur les modes d’édition, de visualisation et de navigation. C’est ici que seront spécifiées, en collaboration avec les sciences de l’information, les modalités d’accès aux services d’indexation et de numérisation et l’ensemble des fonctionnalités d’assistance à l’utilisateur dans ce contexte qui se veut très ouvert et sans doute précurseur d’un futur WEB 3.0 où devraient converger les technologies d’indexation et du Web sémantique, fondés sur la galaxie XML/RDF/SPARQL et la création/validation de contenus personnalisés au sein de communautés d’utilisateurs. Les contributions scientifiques originales impliquées par cette tâche consistent en un algorithme de découverte de documents centré sur les usages, et une adaptation des modèles de description sémantique des documents permettant leur exploitation par cet algorithme.

Outils d’éditorialisation, de visualisation et de navigation

Cette tâche s’intéressera auxoutils d’assistance et interfaces d’interaction entre les utilisateurs et la plate-forme. Des fonctionnalités d’édition permettront aux utilisateurs de modifier et d’enrichir le contenu de la plate-forme selon une approche dite « Web 2.0 » où les utilisateurs ne sont pas seulement consommateurs mais aussi producteurs de contenu. Le succès de cette approche repose sur deux notions clés : une démarche collaborative à la production de contenus et un système de gestion de la confiance. La dimension collaborative sera apportée par l’existence d’outils ciblés d’édition et de visualisation ouvrant des droits, limités selon la catégorie de l’utilisateur (experts, professionnels, amateurs), à la modification des contenus ou au suivi des modifications effectués par d’autres. La notion de confiance est quant à elle utilisée comme mesure de fiabilité sur les acteurs et leurs productions puis exploitée par un système de protection contre les éditions erronées ou attaques. La confiance est alors construite par les membres de la communauté d’utilisateurs contribuant ainsi en un contrôle social du système. Du point de vue de la visualisation et de la navigation, notre objectif est de cartographier les écosystèmes d’informations spécialisées et de savoirs liés au domaine du droit des transports et de la logistique. Notre hypothèse est que la capacité des individus à maîtriser des grands ensembles d’informations est conditionnée par la cohérence et l’organisation de l’accès à l’information. Pour lever le risque d’une recherche infructueuse ou faiblement pertinente, nous souhaitons optimiser la navigation à l'intérieur des documents et doter les usagers d’instruments de synthèse et d’exploration adaptés à leurs profils. Pour cela, les spécialistes distinguent deux régimes de cartographies numériques que nous voulons associer :

  1. le modèle de la cartographie SIG (système d'informations géographiques) où l'information est produite et consultable par des experts, où la carte est un outil d'aide à la décision en permettant par exemple, de visualiser sur une carte différents documents proches en fonction d’une jurisprudence.
  2. le modèle de la cartographie « 2.0. » où l'information est produite et consultable selon des besoins spécifiques et la carte un outil d'interaction et de participation (carte collaborative).