Exercice de travail dirigé Greenstone

Back to wiki
Retourner à l' indexe
Fichiers échantillon: niupepa.zip
Fabriqué pour version Greenstone: 2.60
Modifié pour version Greenstone: 2.70

Ballayer une collection d'images

Nous allons construire une réplique simplifié de Niupepa, the magazine Maori, en utilisant 5 revues issues de leurs publications. On pourra chercher dans le texte, et parcourir les revues par titre ou par date. Quand un magazine est visualisé, une vignette d'image and son texte correspondant sont présentés côte à côte, avec un lien pourla voir en entier en haut de la page.

La collection est un mélange de plugin, de classificateurs et de définitions de formats. L'essentiel du travail est fait par PagedImgPlug, un plugin spécialement conçu pour le genre de donnée que nous devons gérer. Pour chaque document, un fichier "item" est préparé pour décrire une liste d'images constituant le document, signalées par le numéro de page et (option) qui sera accompagné par un fichier texte correspondant à la page, mais aussi destiné à la recherche textuelle. Trois magazines de notre collection (tous issu de la série Te Whetu o Te Tau) ont des présentations sous forme de texte, et deux autres (issus de Te Waka o Te Iwi) sont constitués uniquement d'images. Les fichiers Item peuvent aussi spécifier des métadonnées. Dans notre exemple, les séries de magazines sont enregistrés comme ex.Title et leur date de publication comme ex.Date. Ces métadonnées sont extraites pendant le processus d'indexation.

  1. Démarrez une nouvelle collection nommée Paged Images et remplissez les champs avec les bonnes informations : c'est une collection constituée par des extraits de documents de Niupepa; les seules métadonnées étant le titre et la date du document. Elles sont extraites des fichiers Item inclus dans les documents sources donc il n'y a pas de les stipuler.

  1. Ajoutez PagedImgPlug dans Design → Plugins de document et activez son screenview en cochant la case prévue à cet effet. Les images sources que nous utilisons ont été scannées en haute définition et sont assez lourdes à charger. L'option screenview génère des versions allégées en définition écran au moment de la construction.

  1. Dans le volet Gather panel, ouvrez le dossier niupepa\sample_items dans sample_files et glissez le dans la collection sur le côté droit.

  1. Certains fichiers que vous venez de glisser sont des textes issus des fichiers images. Nous voulons qu'ils soient traités par PagedImgPlug, et non pas par TEXTPlug. Allez au volet Conception et effacez TEXTPlug. Pendant que vous y êtes, vous pouvez aussi retirer HTMLPlug, EMAILPlug, PDFPlug, RTFPlug, WordPlug, PSPlug, ISISPlug et NULPlug puisqu'ils seront inutiles.

  1. Allez sur le volet Création, lancez build puis preview. Cherchez waka et regardez les titres listés (les trois apparaissent sous Te Whetu o Te Tau). Explorez par ordre alphabétique avec titles a-z et visualisez l'un des titres Te Waka o Te Iwi.

Cette collection a été construite avec les options par défaut de Greenstone. Vous pouvez localiser les éléments, mais les informations ne sont pas aussi claires ou attractives que dans la vraie collection Niupepa.

Groupement des documents par titre de série et affichage les dates dans chaque groupe

Avec titles a-z, les documents se répètent sans aucune distinction comme la date. Il serait préférable de les regrouper et d'ajouter une date à chaque élément. On peut le faire avec le classificateur AZCompactList plutôt que AZList, et personnaliser la définition de format VList.

  1. Dans le volet Conception sous la section Browsing Classifiers effacez dans AZList les classificateurs ex.Source et ex.Title.

  1. Ajoutez maintenant dans AZCompactList le classificateur ex.Title et dans DateList le classificateur ex.Date en réglant son option de métadonnée à ex.Date.

  1. Utilisez Modify pour la définition de format pour VList. Trouvez la partie du format par défaut qui dit

    {If}{[ex.Source],<br><i>([ex.Source])</i>}

    et changez-la pour

    {If}{[ex.Date],: [ex.Date]}

    Cela a pour effet d'afficher l'information de date extraite, si elle existe.

  1. A la fin de cette définition de format, où l'on trouve :

    </td>

    append

    {If}{[numleafdocs],<td>([numleafdocs] items)</td>}

    et cliquez sur <Remplacer Format>.

    L'usage du classificateur AZCompactList implique d'une icône d'étagère apparaisse dans on navigue dans les titres. Ce format personnalisé spécifie entre crochets le nombre d'éléments contenu dans l'étagère. En effet, seul les icônes d'étagère proposent la métadonnée [numleafdocs].

Supprimer le texte inutile

Quand vous regardez un magazine, seul le texte associé est visible. Quand l'un des magazines Te Waka o Te Iwi est visualisé, le message suivant "This document has no text" apparait alors. Aucune information sur l'image scannée (résolution entre autres) n'est disponible, même si elle a été générée et stockée avec le document. On peut le modifier avec une définition de format qui change les paramètres de DocumentText.

  1. En restant dans la section Format Features du volet Design , sélectionnez en dessous de "Choose Feature" l'élément DocumentText. La chaîne de caractère montre le texte du document ce qui renvoyant au paramètre par défaut affichant "This document has no text". Effecturez ces changements :

    <center>
      <table width=_pagewidth_>
        <tr>
          <td valign=top>[srclink][screenicon][/srclink]</td>
          <td>[Text]</td>
        </tr>
      </table>
    </center>

    et cliquez sur <Remplacer Format>.

    (disponibles dans niupepa\doc_tweak.txt)

    Inclure [screenicon] a pour effet d'incorporer une image redimensionnée cela grâce à l'option screenview de PagedImgPlug. L'icône est liée à l'image source par la construction [srclink]...[/srclink].

  1. Passez au volet Create et ; construisez puis visualisez les résultats avec build et preview.

  1. Vous pouvez change le logo et l'image de fond comme l'exercice précédent. Des images utilisables dont dans niupepa\images, et sont activées via macros\extra.dm.

Dans la collection que vous venez d'achever, les magazines sont groupés par titre de séries, et les dates sont affichées à côté de chaque élément pour les distinguer. L'utlisateur peut parcourir la collection par ordre chronologique, et quand un magazine est visualisé, une vignette s'affiche sur la gauche et quand on clique dessus on accède à la version originale en haute définition, accompagnée par la version texte du journal, si elle est disponible.


Copyright © 2005 2006 2007 by the New Zealand Digital Library Project at the University of Waikato, New Zealand
Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled “GNU Free Documentation License.”