Exercice de travail dirigé Greenstone

Back to wiki
Retourner à l' indexe
Obligation: Une importante collection de fichiers HTML—Tudor
Fabriqué pour version Greenstone: 2.60
Modifié pour version Greenstone: 2.70

Collection étendue de fichiers HTML

On retourne à la collection Tudor et on ajoute les métadonnées qui expriment la hiérarchie concernée. Ensuite, on va construire un classificateur qui va permettre aux lecteurs de parcourir les documents selon les critères voulus, ici monarques, proches parents, citoyens et autres.

Ajouter des métadonnées hiérarchiques et un classificateur de hiérarchie

  1. Ouvrez la collection tudor (la version originale, pas celle avec webtudor), passez au volet Enrichir et sélectionnez le dossier monarchs (un sous-dossier de tudor). Etablissez son sujet et les mots clés dc.Subject and Keywords sous forme de métadonnées dans Tudor period|Monarchs. (Par souci de rapidité, on se référera à cet élément simplement avec dc.Subject and Keywords.) La barre verticale ("|") est un marqueur de hiérarchie. En sélectionnant un dossier folder et ajoutant des métadonnées, a pour effet d'associer ces métadonnées à tous les fichiers inclus dans ce dossier, avec ses sous-dossiers et ainsi de suite. Une boîte de dialogue vous en informera.

  1. Répétez l'opération pour les dossiers relative et citizens, en renseignant les métadonnées dc.Subject à Tudor period|Relatives et Tudor period|Citizens respectivement. Notez que la hiérarchie apparait dans la zone Valeurs existantes pour dc.Subjects and Keywords.

  1. Enfin, sélectionnez tous les fichiers restant—ceux qui ne sont pas dans les dossiers monarchs, relative, et citizens—en sélectionnant le premier et en faisant un shift (majuscule) + clic sur le dernier. Etablissez leur métadonnée dc.Subject à Tudor period|Others: cela en une seule opération (il peut y avoir un petit retard avant qu' il ne soit complet).

  1. Passez au volet Conception et choisissez Navigation dans les Classificateurss dans la liste de gauche. Etablissez l'élément de menu Sélectionnez le classificateur à ajouter à Hiérarchie; puis cliquez sur <Ajouter Classificateur...>.

  1. Une boîte de dialogue va permettre de contrôler les options du classificateur. Changez les métadonnées à dc.Subject puis cliquez sur <OK>.

  1. Pour être plus propre, retirez avec remove le classificateur classifier pour Source

  1. Maintenant passez au volet Create , construisez la collection avec build et visualisez-la avec preview . choisissez le lien nouveau subjects présent dans la barre de navigation, et cliquez sur l'étagère pour naviguer dans la hiérarchie à quatre niveaux que vous avez créée.

Ensuite, nous partitionnons l'index textuel en quatre parties distinctes. Pour cela nous définissons d'abord quatre sous-collections obtenues en filtrant les documents selon les critères figurant dans les métadonnées de dc.Subject. Un index est alors assigné à chaque sous-collection.

Partitionner l'index textuel basée sur les valeurs de métadonnées

  1. Passez au volet Conception et cliquez sur <Partition Indexes>. Cette fonctionnalité est désactivée car vous êtes en mode bibliothèque. En haut de l'écran, la barre de titre affiche Librarian Mode

  1. Passez alors en mode Library Systems Specialist en allant dans Preferences (dans le menu File) et en cliquant <Mode>. Vous pouvez lire les autres modes disponibles et celui que vous activez s'affichera dans la barre de titre.

  1. Retournez à la section Partition Indexes du volet Conception. Assurez-vous que l'onglet Define Filters est bien sélectionné (valeur par défaut). Définissez un filtre de sous-collection monarchs qui correspond à dc.Subject and Keywords, et saisissez Monarchs comme expression régulière de référence. Cliquez sur <Add Filter>. Ce filtre inclura tout fichierdont les métadonnées dc.Subject contiennent le mot Monarchs.

  1. Définissez un autre filtre relatives, qui correspond à dc.Subject pour le mot Relatives. Définissez un troisième puis un quatrième filtre, citizens etothers, qui vont correspondre aux mots Citizens et Others respectivement.

  1. Avec les sous-collections définies, on partitionne l'index en partie correspondantes. Cliquez sur l'onglet <Assign Partitions>. Sélectionnez la première sous-collection et nommez la citizens; cliquez ensuite <Add Partition>. Répétez l'opération pour les trois autres partitions, en les nommant monarchs, others et relatives. Après vous pouvez reconstruire avec Build et prévisualiser la collection avec preview .

  1. La page de recherche inclut un menu déroulant qui permet de sélectionner l'une de ces partitions pour filtrer la recherche. Par exemple, essayez de chercher dans la partition relatives si mary existe, et répétez le même test dans la partition monarchs.

  1. Pour permettre à l'utilisateur de chercher aussi bien globalement que dans chaque partition, retournez à la section Partition Indexes du volet Conception et sélectionnez l'ongletAssign Partitions .Entrez all dans le nom de partition Partition Name et sélectionnez toutes les partitions en cochant leurs cases.

  1. Pour être sûr que l'index all apparaisse en tête de liste pour l'utilisateur au moment de la recherche, utilisez le bouton<Move Up> pour le remonter dans le liste par le biais du volet Conception. Vous pouvez alors construire et prévisualiser la collection avec build et preview.

  1. Cherchez un mot courant (comme the) dans les cinq partitions et vérifiez que le nombre d'occurences (non de documents) s' ajoutent.

  1. Revenez en mode bibliothèque Librarian , via Preferences (dans le menu File).

Ajouter un index hiérarchique de phrase (PHIND)

  1. Allez au volet Conception et choisissez l'élément Browsing Classifiers dans la liste figurant à gauche.

  1. Choisissez Phind dans le menu Select classifier to add.... Cliquez sur <Add Classifier>. Une fenêtre apparaît pour les options de configuration : laissez les valeurs par défaut (cela créera un index de texte intégral) et cliquez sur <OK>.

  1. Reconstruisez la collection avec Build et visualisez-la avec preview . Essayez alors une nouvelle option phrases dans la barre de navigation. Une clé de recherche PHIND serait particulièrement intéressantes dans le cas présent : king.

Enfin, regardons comment le processus de construction s'effectue. Le développement d'un nouvelle collection suppose souvent plusieurs cybles de construction, de prévisualisation, avec l'ajustement d'enrichissements divers, etc.Pendant la phase de conception, il est préférable de réduire le nombre de documents dans la collection. On le gère avec le paramètre "maxdocs" dans le processus de construction.

Controller le processus de construction

  1. Allez au volet Création et regardez les options proposées dans la partie supérieure de l'écran. Choisissez maxdocs et affectez lui la valeur 3. Construisez avec build.

  1. visualisez la nouvelle collection et la page titles a-z. Avant elle affichait une douzaine de pages par lettre de l'alphabet mais maintenant il n'y en a que trois—soit les trois premières trouvées durant la construction.

  1. Retournez sur le panel Créer et fermez l' option maxdocs. Reconstruisez la collection pour que yous les documents soit inclus.


Copyright © 2005 2006 2007 by the New Zealand Digital Library Project at the University of Waikato, New Zealand
Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled “GNU Free Documentation License.”