Exercice de travail dirigé Greenstone

Back to wiki
Retourner à l' indexe
Fichiers échantillon: oai.zip
Fabriqué pour version Greenstone: 2.60
Modifié pour version Greenstone: 2.70

Ouvrez la collection Open Archives Initiative (OAI)

Cet exercice explore l'interopératibilité des services en utilisant le protocole Open Archive Initiative permettant la moisson de métadonnées (OAI-PMH). Vous pouvez le faire sur un ordinateur autonome car nous n'allons pas nous connecter à un serveur distant qui se comporterait comme un serveur de données. Nous proposons d'utiliser un ensemble de fichier XML constituant des enregistrements produits du protocol OAI-PMH.

Un des exemples Greenstone est basé sur OAI. Cette exercice montre comment le reconstruire étape par étape. (Note : cet exemple est une colleciton d'image et il est indispensable d'installer ImageMagick) Vous pouvez regarder la démonstration OAI pour savoir ce que l'exercice va construire.

  1. Démarrez une nouvelle collection appelée OAI Service Provider. Remplissez les informations requises et laissez les options par défaut car elles ne seront d'aucune utilité..

  1. Dans le volet Gather regardez le dossier sample_small et sample_files/oai. Glissez et déposez ce dossier dans la collection.

  1. Pendant la copie une fenêtre vous demandera s'il faut ajouter OAIPlug à la liste des plugins, car, ne pouvant gérer ce type de fichier, l'interface Librarian n'a pas trouvé d'autres plugins. Cliquez sur <Add Plugin>.

Quand des fichiers sont copiés ainsi, l'interface du Bibliothécaire étudie chacun d'entre eux en fonction de leur extension et tente d'y associer un plugin. Aucun plugin dans la liste n' est capable de traiter les fichiers OAI qui sont copiés travers (ils ont une extension de fichier .oai), donc l' Interface du Bibliothécaire vous demande d' ajouter le plugin approprié.

Parfois, il y a plus d'un plugin qui peut traiter un type de fichier—par exemple dans le cas d'XML, l'extension est utilisée pour plusieurs formats. La fenêtre popup propose d'ailleurs le choix entre plusieurs plugin qui peuvent marcher. C'est normalement facile à choisir. Si vous le souhaitez, vous pouvez ignorer le problème (cliquer <Don't Add Plugin>), car on peut s'en occuper plus tard en passant par le volet Design et sa section Document Plugins

  1. Vous devez configurer le plugin Image. Dans le volet Conception sélectionnez la section Document Plugins, puis la ligne plugin ImagePlug et cliquez <Configure Plugin...>. Dans la fenêtre popup qui apparait, localisez l'option screenviewsize, activez-la et tapez 300 dans la case à côté. Cela créera une vignette de 300 pixels . Cliquez sur <OK>.

  1. Passez au volet Création et procédez à un build puis une preview de la collection.

Comme d'autres collections que nous avons construites en nous basant sur les valeurs par défaut de Greenstone, le résultat est passable mais on peut l'améliorer. La prochaine étape peaufine la collection en utilisant les métadonnées récoltées par le protocole OAI-PMH via les fichiers .OAI

  1. Dans la section Browsing Classifiers du volet Design effacez les deux classificateurs AZList (ex.Title et ex.Source).

  1. Ajoutez un classificateur AZCompactList basé sur les métadonnées ex.Subject.

  1. Maintenant ajoutez un classificateur AZCompactList basé sur les métadonnées ex.Description . Dans son volet de configuration, sélectionnez mincompact = 1, maxcompact = 10 et buttonname = Captions.

  1. Dans la section Search Indexes du volet Conception effacez tous les index et ajoutez-en un nommé "captions" basé sur les métadonnées ex.Description .

  1. Construisez et visualisez la collection avec Build et preview.

Peaufiner la présentation avec des formats personnalisés

  1. Dans le volet Conception sélectionnez Format Features. Remplacez la définition de format VList comme suit :

    <td>
      {If}{[numleafdocs],[link][icon][/link],[link][thumbicon][/link]}
    </td>
    <td valign=middle>
      {If}{[numleafdocs],[Title],<i>[Description]</i>}
    </td>

    Vous trouverez le fichier dans vlist_tweak.txt dans le dossier oai/format_tweaks attaché à sample_files. Cliquez sur <Replace Format> pour valider le changement

    Cette définition de format personnalise l'affichage des listes verticales comme les résultats de recherche ou les listes légengées comprenant à la fois une vignette et et une métadonnée de description. . Greenstone utilise par défaut l'extraction de métadonnées si bien que [Description] équivaut à [ex.Description].

  1. Ensuite, sélectionnez DocumentHeading dans la liste déroulante Choose Feature et changez sa définition de format à:

    <h3>[Subject]</h3>

    L'entête du docucment apparaît au dessus et il n'y a pas de bouton en surbrillance quand vous arrivez à un document dans la collection. Par défaut, DocumentHeading affiche les métadonnées de ex.Title. Dans cet ensemble d'enregistrements OAI exportés, les titres sont des noms de fichiers correspondant à des images JPEG et ces noms de sont vraiment pas informatifs (par exemple 01dla14). Vous pouvez le voir dans le volet Enrich si vous sélectionnez une image dans sample_small → oai → JCDLPICS → srcdocs et vérifiez son nom de fichier par rapport à ex.Title. Le format précédent affiche ex.Subject.

  1. Enfin, vous avez remarqué qu'au moment de l'affichage des documents, un message apparait This document has no text. Pour réctifier cela, choisissez DocumentText dans la liste déroulante Choose Feature et utilisez le texte suivant comme définition de format. doctxt_tweak.txt présent dans le dossier format_tweaks que l'on mentionnait précédemment:

    <center><table width=_pagewidth_ border=1>
    <tr><td colspan=2 align=center>
    <a href=[OrigURL]>[screenicon]</a></td></tr>
    <tr><td>Caption:</td><td> <i>[Description]</i> <br>
    (<a href=[OrigURL]>original [ImageWidth]x[ImageHeight] [ImageType] available</a>)
    </td></tr>
    <tr><td>Subject:</td><td> [Subject]</td></tr>
    <tr><td>Publisher:</td><td> [Publisher]</td></tr>
    <tr><td>Rights:<td> [Rights]</td></tr>
    </table></center>

    Cliquez <Remplacer Format>..

    La définition de format modifie comment le document sera présenté. Elle inclut une version redimensionnée de l'image qui est reliée à la version haute définition disponible via le web. Il y a des informations factuelles sur l'image comme sa largeur, hauteur et son type.

  1. Les définitions de formats sont générés par l'exécution de Greenstone, donc il n'y a pas besoin de reconstruire la collection pour voir les changements prendre effet. Il suffit d'aller au volet Conception et de faire une <Preview Collection>.

Pour rendre l'indexation plus rapide, la collection contient un plus petit nombre de documents que dans les version fournies avec Greenstone, mais après ces modifications, les fonctionnalités sont les mêmes.


Copyright © 2005 2006 2007 by the New Zealand Digital Library Project at the University of Waikato, New Zealand
Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled “GNU Free Documentation License.”