Ejercicio tutorial de Greenstone

Back to wiki
De regreso al index
Archivos muestra: niupepa.zip
Ideado para versión Greenstone: 2.60
Modificado para versión Greensotne: 2.70

Colección de imágenes escaneadas

Aquí construimos una pequeña réplica de Niupepa, la colección del diario Maor, usando cinco diarios tomados de dos series de diarios. Permite una búsqueda completa de texto y permite explorar por título y fecha. Cuando se mira un dario, una vista previa de la imagen y de su texto plano correspondiente, se presentan una al lado del otro, con una opción de navegación goto en la parte superior de la página.

La colección involucra una mezcla de plug-ins, de clasificadores y de instrucciones de formato. La mayor parte del trabajo la hace PagedImgPlug, un plug-in diseñado precisamente para la clase de datos que tenemos en este ejemplo. Para cada documento, se prepara un archivo de "items" que especifica una lista de archivos de imagen que constituye el documento, etiquetado con el número de página y (opcionalmente) acompañado por un archivo de texto que tiene una versión de la imágen que puede leer la máquina y que se usa para una búsqueda completa del texto. Tres diarios en nuestra colección (todos de la serie Te Whetu o Te Tau) tienen sus representaciones y dos (de Te Waka o Te Iwi) tienen solamente imágenes. Los items de imagen tambien pueden especificar metadatos. En nuestro ejemplo, la serie de diario se registra como ex.Title y su fecha de publicación como ex.Date. Estos metadatos se extraen como parte del proceso de construcción.

  1. Comience una nueva colección llamada Paged Images y llene los campos con la información apropiada: es una colección obtenida en un extracto de documentos de Niupepa; los unicos metadatos usados son el título de documento y la fecha, y estos se extraen de los archivos de "items" incluidos en los documentos fuente, de manera que no se necesita estipular conjunto de metadatos.

  1. En Diseño → DocumentoEntrada, adicione PagedImgPlug y cambie en la opción de configuración screenview chequeando la caja. Las imágenes fuente que usamos fueron escaneadas con alta resolución y son archivos grandes para ser bajados por un explorador. La opción screenview genera imágenes de cada página con resolución de pantalla más pequeña, cuando se construye la colección.

  1. En el panel Reunir , abra la carpeta niupepa\sample_items en archivos_ejemplo y arrástrela hasta su colección al lado derecho.

  1. Algunos de los archivos que se arrastraron son archivos de texto que contienen el texto extraido de las imágenes de página. Queremos procesarlas con PagedImgPlug, no con TEXTPlug. Cámbiese al panel Diseño y elimine TEXTPlug. Estando allí, puede limpiar las cosas eliminando HTMLPlug, EMAILPlug, PDFPlug, RTFPlug, WordPlug, PSPlug, ISISPlug y NULPlug, ya que no se usarán.

  1. Ahora vaya al panel Crear, construir la colección y vista previa del resultado. Busque waka y vea uno de los títulos listados (los tres aparecen como Te Whetu o Te Tau). Explore por títulos a-z y vea uno de los títulos Te Waka o Te Iwi

Esta colección se construyó a partir de las definiciones por defecto de Greenstone. Se pueden encontrar items de interés, pero la presentación de la información es menos clara y atractiva que en la colección completa de Niupepa.

Agrupar documentos por series de títulos y mostrar fechas dentro de cada grupo

Bajo títulos a-z los documentos de la misma serie se repiten sin ningún tipo de distinción tal como fecha. Sería mejor agruparlos por series de título y mostrar las fechas dentro de cada grupo. Esto se puede hacer con un clasificador AZCompactList en vez de, y ajustando la instrucción de formato VList.

  1. En el panelDiseño, en la sección Clasificadores para explorar elimine los clasificadores AZList por ex.Fuente y ex.Título.

  1. Ahora añada un clasificador AZCompactList, estableciendo la opción de metadatos a ex.Title, y agregar el clasificador DateList estableciendo la opción metadatos por ex.Date.

  1. Modicar la instrucción de formato para VList. Encuentre la parte de la instrucción por defecto que dice

    {If}{[ex.Source],<br><i>([ex.Source])</i>}

    y cámbiela a

    {If}{[ex.Date],: [ex.Date]}

    Esto tiene el efecto de mostrar la información de la fecha extraida, si está presente

  1. Al final de esta instrucción de formato, donde dice:

    </td>

    añadir

    {If}{[numleafdocs],<td>([numleafdocs] items)</td>}

    y haga clic sobre <Replazar Formato>.

    Como consecuencia de usar el clasificador AZCompactList, los íconos de estantería aparecen al explorar títulos. Esta instrucción de formato revisada tiene el efecto de especificar entre corchetes cuántos items hay en un estante. Trabaja aprovechando el hecho de que sólo los íconos de estantería definen metadatos [numleafdocs] .

Supresión de texto ficticio

Cuando se obtiene un diario, solo se muestra su texto asociado. Cuando se accede a uno de los diarios Te Waka o Te Iwi, la vista del documento presenta el mensaje: "Este documento no tiene texto". No se muestra información de la imagen escaneada (resolución de pantalla u otra), aunque se ha computado y se almacenado con el documento. Esto se puede fijar con con una instrucción de formato que modifica el comportamiento por defecto para TextoDocumento.

  1. Permaneciendo dentro de la sección Aspectos de Formato en el panel Diseño, bajo "Escoja Aspecto" seleccione TextoDocumento. El defecto de formato se muestra en el texto plano del documento, o si no lo hay, "Este documento no tiene texto". Cámbielo a:

    <center>
      <table width=_pagewidth_>
        <tr>
          <td valign=top>[srclink][screenicon][/srclink]</td>
          <td>[Text]</td>
        </tr>
      </table>
    </center>

    y haga clic sobre <Remplazar Formato;.

    (disponible como niupepa\doc_tweak.txt)

    la inclusión de [íconopantalla] tiene el efecto de enbeber la imagen tamaño de pantalla generada cuando con el cambio de la opción vistapantalla en PagedImgPlug. Se la ha asignado un Hypervínculo a la imagen original con [srclink]...[/srclink].

  1. Cámbiese al panel Crear ;construir y vista previa de la colección revisada.

  1. SI lo desea, adicione un logo y cambie el fondo como se hizo antes. Encontrará una imagen apropiada en el archivo niupepa\images, que se activa con macros\extra.dm.

En la colecón que usted acaba de construir, los diarios se agrupan por series de título y las fechas se suministran al lado de cada uno para distinguirlo de los otros de la misma serie. Los usuarios puden explorar cronológicamente por fecha y se ve la página de un diario, aparece una imagen previa que se muestra en la izquierda donde también se ve la versión original en alta resolución, acompañada a la derecha por la versión plana del texto del diario (si está disponible).


Copyright © 2005 2006 2007 by the New Zealand Digital Library Project at the University of Waikato, New Zealand
Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled “GNU Free Documentation License.”