Exercice de travail dirigé Greenstone

Back to wiki
Retourner à l' indexe
Fichiers échantillon: tudor.zip
Fabriqué pour version Greenstone: 2.60
Modifié pour version Greenstone: 2.70

Une importante collection de fichiers HTML—Tudor

  1. Invoquez l'interface Bibliothécaire de Geenstone (a partir du menu démarrer) et créez une nouvelle collection appelée tudor (utilisez le menu Fichier). Remplissez la boîte de dialogue avec des valeurs appropriées et gardez l'option Dublin Core, séléctionnée par défaut comme ensemble de métadonnées.

  1. Dans le volet Rassembler, ouvrez le dossier tudor dans sample_files

  1. Faites glisser englishistory.net depuis le côté gauche jusqu'au côté droit pour l'inclure dans votre collection tudor.

  1. Passez au volet Créer et cliquez sur Construire la collection.

  1. Quand la reconstruction est terminée, visualisez la collection.

  1. Les fonctions de navigation dans cette collection (titres a-z et noms de fichier) sont entièrement basées sur les métadonnées extraites. Retournez à l'interface Bibliothécaire et examinez les métadonnées qui ont été extraites pour quelques fichiers.

Vous avez probablement remarqué que la collection contient quelques images égarées ainsi que les documents HTML. C'est une erreur. De nombreux documents HTML contiennent des images, et Greenstone essaye de déterminer leur appartenance aux documents HTML pour ne pas les inclure dans la collection. Normalement, uniquement les images non référencées dans des documents HTML sont inclues dans la collection. Dans ce cas, Greenstone n'a pas réussi à déterminer l'appartenance à des documents HTML de certaines images. (Cela provient en général du site web à partir duquel ces fichiers ont été téléchargé qui ne respecte pas les règles de structuration hiérarchique utilisée habituellement).

  1. Passez au volet Création et sélectionnez la section Greffons pour Documents.A coté de Greffon HTMLPlug vous verrez -smart_block. Cette option permet d'identifier les images qui appartiennent aux pages HTML et d'éviter de les inclure dans la collection—Dans notre cas, ce n'est pas suffisant! Sélectionnez la ligne Greffon HTMLPlug et cliquez <Configuration Greffon>. Une boîte de dialogue apparaît. Descendez pour visualiser l'option smart_block et désactivez cette option. Puis cliquez sur <OK>.

  1. Passez au volet Création et visualiser la collection. La collection est exactement comme avant excepté que les images égarées ont disparu. Le travail des greffons s'enchaîne comme dans un tuyau: le fichier de sortie d'un greffon est transmis comme entrée au greffon suivant tant qu'un greffon pouvant traiter le fichier n'est trouvé. Par défaut (c.a.d. sans smart_block) le greffon HTML bloque toutes les images, ce qui est approprié pour cette collection.

Visualiser différentes vues des fichiers dans les volets "Assembler" et "Enrichir"

  1. Passez au volet Assembler et dans la partie droite, ouvrez englishhistory.net → tudor.

  1. Dans le menu Montrer les Fichiers de la partie droite, changez Tous les Fichiers par HTM & HTML. Notez que les fichiers affichés ci-dessus sont filtrés afin de retenir seulement ce type de fichier.

  1. Passez du menu Montrer les Fichiers au menu Images. A nouveau, les fichiers montrés changent.

  1. Maintenant, retournez au menu Montrer les Fichiers pour remettre Tous les Fichiers, sinon vous risquez d'être gêné plus tard. Rappelez-vous bien que si les volets Rassembler ou Enrichir ne montrent pas tous vos fichiers, cela peut être le problème.


Copyright © 2005 2006 2007 by the New Zealand Digital Library Project at the University of Waikato, New Zealand
Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled “GNU Free Documentation License.”