User Tools

Site Tools


legacy:manuals:es:user:making_greenstone_collections

CREACIÓN DE COLECCIONES GREENSTONE

La forma más sencilla de crear nuevas colecciones es por medio de la Interfaz de Bibliotecario de Greenstone (GLI por sus siglas en inglés), la cual permite reunir conjuntos de documentos, importarlos o asignarles metadatos y construir con ellos una colección Greenstone. La Interfaz de Bibliotecario de Greenstone cuenta con soporte para cinco actividades básicas, las cuales pueden intercalarse, aunque nominalmente se toman en el siguiente orden:

  1. Copiar documentos desde el espacio de archivos de la computadora, incluyendo colecciones existentes, e incluirlos en una nueva colección. Los documentos “conservan” los metadatos anteriores y también pueden bajarse de Internet a través de un programa de espejeo integrado.
  2. Enriquecer los documentos añadiendo más metadatos a los documentos individuales o a grupos de documentos.
  3. Designar la colección determinando su apariencia y los programas de acceso que a los que dará soporte.
  4. Construir la colección por medio de Greenstone.
  5. Tener una vista previa de la colección que se acaba de crear, la cual se habrá instalado en su página principal Greenstone como una de las colecciones regulares.

La interfaz de bibliotecario le permite añadir lo que la gente llama metadatos “externos” a los documentos, es decir, metadatos que pertenecen al documento como un todo. Pero los documentos a menudo necesitan estar estructurados en secciones y subsecciones, con lo que también puede haber metadatos “internos” asociados a cada parte. En Greenstone los documentos de origen pueden estar etiquetados con esta información, tal como se explica en la Sección tagging_document_files.

Finalmente, también se cuenta con una forma alternativa para crear colecciones a través del Colector, que le ayuda a crear nuevas colecciones, modificar o añadir colecciones existentes o eliminarlas. Aunque este programa de recopilación antecede a la interfaz de bibliotecario, para fines prácticos se recomienda usar esta última en lugar del Colector. El Colector se describe en la Sección the_collector.

Para poder aprovechar todo el poder que le ofrece Greenstone para construir colecciones avanzadas, usted también necesitará leer el Capítulo getting_the_most_out_of_your_documents de la Guía del Programador.

La Interfaz de Bibliotecario

Para explicar el funcionamiento de la interfaz de bibliotecario de Greenstone nos gustaría hacerlo a través de un sencillo ejemplo. Las figuras de la <imgref figure_starting_a_new_collection> a la <imgref figure_previewing_the_newly_built_collection> son imágenes en pantalla de los diferentes momentos de la acción. Este ejemplo utiliza documentos del Subconjunto de la Biblioteca para el Desarrollo (DLS por sus siglas en inglés), la cual se distribuye junto con Greenstone. Para los fines de esta exposición, la explicación toma la forma de un sencillo paseo por los pasos mencionados arriba. No obstante, una patrón de uso más realista es ir de atrás para adelante a través de las diferentes etapas conforme la tarea avanza.

La interfaz del bibliotecario puede iniciarse en uno de cuatro posibles modos: Asistente de biblioteca, Bibliotecario, Especialista de sistemas de biblioteca, y Avanzado. Estos modos controlan el nivel de detalle dentro de cada interfaz, y pueden cambiarse usando la opción de "Preferencias" en el menú de "Archivo". El recorrido en esta sección supone que la interfaz de bibliotecario se encuentra operando en el modo Bibliotecario.

Para empezar

Si cuenta con Windows inicie la interfaz de bibliotecario de seleccionando Biblioteca Digital Greenstone en la sección de Programas del menú de Inicio y eligiendo Interfaz de Bibliotecario. Si está usando UNIX, entonces escriba:

cd ~/gsdl
cd gli
./gli.sh

donde ~/gsdl es el directorio que contiene el sistema Greenstone. Para empezar usted debe abrir una colección existente o iniciar una nueva. La figura <imgref figure_starting_a_new_collection> muestra al usuario en el proceso de iniciar una nueva colección, seleccionando New [Nuevo] en el menú de archivos y llenando la información general acerca de la colección: título, dirección de correo electrónico del responsable de la colección y una breve descripción de su contenido. El título de la colección es una frase corta que se utilizará a  lo largo de toda la biblioteca digital para identificar su contenido. Las colecciones existentes tienen nombres como Biblioteca de la Alimentación y la NutriciónBiblioteca  Mundial del Medio Ambiente, etc. Cuando se escribe el título el sistema le asigna un identificador mnemotécnico único, que equivale al “nombre” de la colección para uso interno (usted puede cambiarlo si así lo desea). La dirección de correo electrónico corresponde al primer punto de contacto para cualquier problema que se tenga con la colección.

La descripción es una breve relación de los principios que rigen la selección de los materiales que van a formar parte de la colección. Aparece bajo el encabezado About this collection [Acerca de esta colección] en la página inicial.

<imgcaption figure_starting_a_new_collection|%!– id:170 –%Iniciando una nueva colección ></imgcaption>

<imgcaption figure_exploring_the_local_file_space|%!– id:171 –%Explorando el espacio de archivos ></imgcaption>

En este punto el usuario decide si desea que la nueva colección se base en la misma estructura que una colección existente o construir un tipo de colección totalmente nuevo. En la figura <imgref figure_starting_a_new_collection> el usuario decidió basarla en el Subconjunto de la Biblioteca para el Desarrollo (DLS por sus siglas en inglés). Esto implica que el conjunto de metadatos “DLS” que se utiliza en esta colección se usará para la nueva colección. (De hecho, este conjunto de metadatos se ha usado para crear varias colecciones Greenstone que comparten una misma estructura y organización, pero con diferentes contenidos, incluyendo las colecciones de Muestra y la del Subconjunto de la Biblioteca para el Desarrollo que se incluyen como ejemplos junto con Greenstone.)

El conjunto de metadatos DLS contiene los siguientes elementos:

  • Título
  • Tema
  • Idioma
  • Organización
  • Palabra clave (es decir, “Cómo”).

(Existe además un elemento de metadato llamado AZList que se utiliza para determinar qué compartimento de la lista alfabética contiene el título del documento, con valores como “A-B” o “C-D-E”. Esto se utiliza para lograr un control preciso sobre las divisiones de la lista. En la mayoría de las otras colecciones estos compartimentos están ausentes y Greenstone los asigna por sí mismo.)

Si en cambio el usuario eligió “Nueva Colección”, se le pedirá que seleccione los conjuntos de metadatos que se van a usar en la nueva colección. Se ofrecen tres conjuntos estándar: Dublin Core, el conjunto de metadatos DLS mencionado arriba y un conjunto que comprende elementos de metadatos extraídos automáticamente por Greenstone de los documentos de la colección. El usuario también puede crear nuevos conjuntos de metadatos por medio de una pantalla que se activa a través del menú “metadatos”.

Varios conjuntos de metadatos diferentes se pueden asociar a la misma colección, ya que el sistema los mantiene separados (de tal manera que los documentos, por ejemplo, pueden tener un Título en Dublin Core y uno en DLS). Estos conjuntos se mantienen claramente diferenciados en la interfaz. Entre bastidores los conjuntos de metadatos se representan en XML.

Reuniendo el material

Después de hacer click en el botón Aceptar las partes restantes de la interfaz que habían permanecido sombreadas hasta este momento se activarán. La pantalla Reunir, seleccionado por medio de la pestaña del mismo nombre que se encuentra cerca de la parte superior de la figura <imgref figure_starting_a_new_collection>, aparecerá en pantalla. Esto le permitirá al usuario explorar el espacio de archivos y las colecciones existentes en su computadora, y reunir los documentos seleccionados para la nueva colección. La pantalla se divide en dos secciones: la izquierda para explorar las estructuras existentes y la derecha para los documentos que integrarán la colección.

Las operaciones disponibles en esta etapa incluyen:

  • Navegar de manera normal por las jerarquías de la estructura de archivos existente y por la que se está creando.
  • Arrastrar y colocar archivos en la nueva colección.
  • Seleccionar varios archivos a la vez.
  • Arrastrar y colocar subjerarquías completas.
  • Eliminar documentos de la naciente colección.
  • Crear nuevas subjerarquías dentro de la colección.
  • Filtrar los archivos que son visibles, tanto en el sistema local de archivos como en la colección, con base en grupos predeterminados o en términos de correspondencia de archivos estándar.
  • Llamar al programa apropiado para que muestre en pantalla los contenidos de un archivo seleccionado haciendo doble click en él.

Se ha tenido especial cuidado en evitar los conflictos entre nombres cuando archivos con el mismo nombre en diferentes partes de la estructura de directorios de la computadora se copian en la misma carpeta de la colección.

En la figura <imgref figure_exploring_the_local_file_space> el usuario está utilizando la pantalla interactiva del árbol de archivos para explorar el sistema de archivos local. En esta etapa la colección a la derecha está vacía. El usuario la llena arrastrando y colocando los archivos correspondientes de la parte izquierda a la parte derecha de la pantalla. Estos archivos se “copian” en vez de “moverse”, de tal manera que el sistema original de archivos no resulta afectado. Las técnicas usuales para seleccionar varios archivos, arrastrarlos y colocarlos, estructurar la nueva colección creando subdirectorios (“carpetas”) y eliminar archivos de ella moviéndolos al basurero o a la papelera de reciclaje están todas ellas disponibles.

Las colecciones existentes se representan por medio de un subdirectorio a la izquierda llamado “Colecciones Greenstone”, el cual puede abrirse y explorarse como cualquier otro directorio. Sin embargo, los documentos que se encuentran ahí difieren de los archivos comunes debido a que ya tienen metadatos adjuntos y estos se conservan cuando pasan a formar parte de la nueva colección. Los conflictos podrían surgir debido a que sus metadatos tal vez les fueron asignados usando un conjunto diferente de metadatos del que se usa para la nueva colección, por lo que el usuario deberá resolver esto. En la figura <imgref figure_importing_existing_metadata> el usuario ha seleccionado algunos documentos de la colección existente y los ha arrastrado a la nueva colección. La ventana que aparece explica que el elemento de metadato Organization [Organización] no se pudo importar automáticamente y le pide al usuario que seleccione un conjunto de metadatos y presione A ñadir para añadir el elemento de metadato a dicho conjunto,1)o que elija un conjunto de metadatos, luego un elemento y presione Combinar para nombrar nuevamente el antiguo elemento de metadato de acuerdo al nuevo y combinarlos. Los metadatos de los siguientes documentos de la misma colección serán tratados automáticamente de la misma manera.

Cuando se seleccionen, arrastren y coloquen grandes conjuntos de archivos en la nueva colección, la operación de copiado puede llevar algún tiempo, particularmente si esto incluye la conversión de metadatos. Para indicar el grado de avance la interfaz muestra el archivo que se está copiando y el porcentaje de archivos que se han procesado.

También se cuenta con programas especiales para tratar con grandes conjuntos de archivos. Por ejemplo, el usuario puede filtrar los directorios y subdirectorios para mostrar únicamente ciertos archivos por medio de un menú de tipos de archivos que se encuentra debajo. En la figura <imgref figure_filtering_the_file_trees> únicamente se muestran los archivos HTM y HTML y sólo se copiarán estos archivos al momento de arrastrarlos y colocarlos en la nueva colección.

Enriqueciendo los documentos

La siguiente fase es enriquecer los documentos añadiendo los metadatos. La pestaña Enriquecer despliega una nueva pantalla de información (figura <imgref figure_assigning_metadata_using_enrich_view>), la cual muestra los directorios y subdirectorios de la colección a la izquierda y a la derecha permite añadir los metadatos a los documentos individuales o a los grupos de documentos.

Los documentos que se copiaron durante el primer paso incluyen todos los metadatos que se les hayan asociado. Si un documento es parte de una colección Greenstone, los metadatos definidos previamente pasan a formar parte de la nueva colección. Ciertamente, es posible que esta nueva colección tenga un conjunto diferente de metadatos, o quizá sólo un subconjunto de los metadatos definidos y únicamente se conserven los metadatos que pertenecen al conjunto de la nueva colección. La solución de este tipo de conflictos tal vez requiera la intervención del usuario por medio de un diálogo suplementario (figura <imgref figure_importing_existing_metadata>). Cualquier selección que se haga se recordará para la copia de los siguientes archivos.

La pantalla Enriquecer permite asignar los valores de los metadatos a los documentos de la colección Por ejemplo, se pueden agregar nuevos valores al conjunto de los valores existentes para un elemento. Si los valores del elemento tienen una estructura jerárquica, la jerarquía se puede extender de la misma forma.

<imgcaption figure_importing_existing_metadata|%!– id:202 –%Importando metadatos existentes ></imgcaption>

<imgcaption figure_filtering_the_file_trees.|%!– id:203 –%Filtrando los árboles de archivos. ></imgcaption>

<imgcaption figure_assigning_metadata_using_enrich_view|%!– id:204 –%Asignando metadatos por medio de la pantalla Enriquecer. ></imgcaption>

<imgcaption figure_viewing_all_metadata_for_selected_files|%!– id:205 –%Viendo todos los metadatos de los archivos seleccionados. ></imgcaption>

Los valores de los metadatos también pueden asignarse a carpetas justo de la misma manera. Los documentos que se encuentran en estas carpetas y para los cuales no se hayan especificado estos metadatos heredan sus valores. Sin embargo, estos pueden sustituirse posteriormente proporcionando valores diferentes para cada documento.

Las operaciones en esta etapa del proceso incluyen:

  • Asignar valores de metadatos nuevos y existentes a los documentos.
  • Asignar metadatos a un documento individual.
  • Asignar metadatos a una carpeta (estos son heredados por todos los documentos de la carpeta, incluyendo los que se encuentran en las carpetas anidadas).
  • Asignar metadatos jerárquicos, cuya estructura pueda actualizarse dinámicamente en caso necesario.
  • Editar o actualizar metadatos.
  • Revisar los metadatos asignados a una selección de archivos y directorios.

Siguiendo con nuestro ejemplo, en la figura <imgref figure_assigning_metadata_using_enrich_view> el usuario ha seleccionado la carpeta ec121e y le ha asignado el valor “EC Courier” como metadato de la Organización. Los botones para actualizar y eliminar el metadato se activan, dependiendo de las selecciones que se hayan hecho.

Durante la fase de enriquecimiento e inclusive en cualquier otro momento el usuario puede ver todos los metadatos que se le han asignado a los documentos de la colección. Esto se hace seleccionando el conjunto de documentos y eligiendo Metadatos Asignados en el menú de conjuntos de metadato, el cual despliega una ventana como la que se puede ver en la figura <imgref figure_viewing_all_metadata_for_selected_files>. Esta ventana muestra los metadatos en forma de hoja de cálculo. Para grandes colecciones resulta de gran utilidad poder ver solamente los metadatos asociados a ciertos tipos de documentos y si el usuario ha especificado un filtro de archivos tal como se menciona arriba, únicamente se mostrarán los documentos seleccionados en la pantalla de metadatos.

La pantalla en la figura <imgref figure_editing_the_metadata_set> le permite al usuario editar los conjuntos de metadatos. Aquí el usuario está viendo el elemento Subject [Tema] del conjunto DLS. Los valores de este elemento forman una jerarquía y el usuario está examinando y tal vez cambiando la lista de valores asignados. La misma pantalla también le permite cambiar el “perfil” para mapear los elementos de un conjunto de metadatos a otro. Este perfil se crea al momento de importar documentos de colecciones que tienen metadatos asignados previamente.

<imgcaption figure_editing_the_metadata_set|%!– id:217 –%Editando el conjunto de metadatos. ></imgcaption>

<imgcaption figure_designing_the_collection|%!– id:218 –%Diseñando la colección ></imgcaption>

<imgcaption figure_specifying_which_plug-ins_to_use|%!– id:219 –%Especificando los plugins que se van a usar. ></imgcaption>

<imgcaption figure_configuring_arguments_to_a_plug-in|%!– id:220 –%Configurando los argumentos de los plugins. ></imgcaption>

Diseñando la colección

La pantalla Diseño (figuras <imgref figure_designing_the_collection>—<imgref figure_configuring_arguments_to_a_plug-in>) le permite a uno especificar la estructura, organización y presentación de la colección que se está creando. Tal como se mencionó antes, el resultado de este proceso se registra en un “archivo de configuración de la colección”, que es la forma que tiene Greenstone de expresar las funciones y programas que requiere una colección. Este paso incluye una serie de pantallas separadas, cada una de las cuales trata un aspecto relativo al diseño de la colección y sirve, en efecto, como un equivalente gráfico al proceso normal de editar manualmente el archivo de configuración.

Las operaciones incluyen:

  • Revisar y editar los metadatos a nivel de colección, como el título, autor y disponibilidad de la colección.
  • Definir qué índices de texto completo se van a crear.
  • Crear subcolecciones y armar los índices de las mismas.
  • Añadir o eliminar el soporte de la interfaz para idiomas predefinidos.
  • Construir una lista de los plugins que se usarán junto con sus argumentos.
  • Presentar la lista al usuario para que la revise y modifique.
  • Configurar plugins individuales.
  • Construir una lista de “clasificadores”, sus argumentos, asignación y configuración.
  • Asignar cadenas de formato a varios controles dentro de la colección, alterando así su apariencia.
  • Revisar los conjuntos de metadatos usados en la colección junto con sus elementos.

En la figura <imgref figure_designing_the_collection> el usuario ha hecho click en la pestaña Diseño y está revisando la información general acerca de la colección, ingresada al momento de crearla. A la izquierda aparece una lista de las diferentes facetas que el usuario puede configurar: general, plugins de documento, tipos de búsqueda, índices de búsqueda, índices de partición, búsqueda cruzada a través de varias colecciones, clasificadores de exploración, características del formato, traducción de texto y conjuntos de metadatos. La apariencia y funcionalidad varía entre ellas. Por ejemplo, al hacer click en el botón Plugins de documento aparece la pantalla que se muestra en la figura <imgref figure_specifying_which_plug-ins_to_use>, la cual le permite añadir, eliminar o configurar los plugins, así como cambiar el orden en el que se aplican a los documentos.

Los plugins y clasificadores tienen varios argumentos u “opciones” diferentes que el usuario puede proporcionar. El cuadro de diálogo que aparece en la figura <imgref figure_configuring_arguments_to_a_plug-in> muestra los argumentos que el usuario ha especificado para algunos de los plugins. Los campos sombreados se activan cuando el usuario añade la opción haciendo click en el recuadro que se encuentra a su lado. Debido a que Greenstone es un sistema abierto en constante crecimiento, el número de opciones tiende a aumentar conforme los programadores añaden nuevos programas y funciones. Para arreglárselas con esto, Greenstone tiene un programa de “información de plugins”  que muestra una lista de las opciones disponibles para cada plugin y la interfaz de bibliotecario recurre automáticamente a esta lista para determinar las opciones que debe mostrar. Esto le permite a la interfaz del usuario mantener automáticamente el ritmo de los desarrollos del programa de software.

<imgcaption figure_getting_ready_to_create_new_collection.|%!– id:236 –%Preparándose para crear una nueva colección. ></imgcaption>

<imgcaption figure_previewing_the_newly_built_collection|%!– id:237 –%Vista previa de la nueva colección. ></imgcaption>

Creando la colección

La pantalla Crear (figura <imgref figure_getting_ready_to_create_new_collection>) se utiliza para construir una colección basada en los documentos y metadatos asignados. El peso de este trabajo lo lleva el código Greenstone. El usuario controla el proceso externo a través de una serie de pantallas separadas, cada una de las cuales trata con los argumentos proporcionados durante las diferentes etapas del proceso de creación.

El usuario observa el proceso de construcción a través de una ventana que muestra no sólo los textos generados por los guiones de importación y creación de índices de Greenstone, sino también las barras de progreso que indican el grado general de avance de cada guión.

La figura <imgref figure_getting_ready_to_create_new_collection> muestra la pantalla Crear. En la parte superior se muestran algunas opciones que pueden aplicarse durante el proceso de creación. El usuario selecciona los valores apropiados para cada opción. Esta figura muestra asimismo un cuadro de “recomendaciones” que está disponible a través de toda la interfaz para explicar la función de cada argumento.

Una vez que el usuario esté satisfecho con los argumentos, deberá hacer click en Build Collection [Crear Colección] . Greenstone imprime continuamente el texto que indica el grado de avance y éste se acompaña de una barra de progreso que muestra de forma aún más clara esta información.

Presentación preliminar de la colección

El botón de Vista Previa de la colección (figura <imgref figure_getting_ready_to_create_new_collection>) se utiliza para ver la imagen de la colección que se acaba de crear. Al oprimir este botón se inicia un navegador de web que muestra la página inicial de la colección (Figura <imgref figure_previewing_the_newly_built_collection>). En la práctica la vista previa a menudo muestra las deficiencias en el diseño de la colección o en los valores de los metadatos individuales, por lo que con frecuencia el usuario debe regresar a etapas anteriores para poder corregirlas. Este botón se activa una vez que la colección se ha creado. La nueva colección también se habrá instalado en su página principal Greenstone como una de las colecciones regulares.

Ayuda

La ayuda en línea siempre está disponible y se puede acudir a ella usando el elemento Ayuda que se encuentra a la derecha de la barra principal de menús en la parte superior de cada pantalla. Éste abre un archivo estructurado jerárquicamente con texto de ayuda, el cual toma en cuenta el contexto actual del usuario para destacar la sección correspondiente a dicha etapa del proceso. Más aún, como se mencionó arriba cada vez que el cursor se mantenga sobre un objeto interactivo aparecerá una pequeña ventana con “recomendaciones”, como se puede ver en la parte inferior de la figura <imgref figure_getting_ready_to_create_new_collection>.

Guia del Usuario de la Interfaz de Bibliotecario

&chap_gli;

Etiquetado de los Archivos de Documento

Muy a menudo es necesario estructurar los documentos de origen (source documents) en secciones y subsecciones y se necesita comunicar esta información a Greenstone para que preserve la estructura jerárquica. Además, se pueden asociar metadatos, generalmente el título, a cada sección y subsección.

Los documentos de origen obtenidos mediante un proceso de OCR suelen ser una serie de archivos de tratamiento de texto con sus ilustraciones. Cuando se trate de archivos en formato Word de Microsoft, podrá utilizarse el plugin Word para introducirlos en Greenstone. De otra forma, cabe la posibilidad de convertirlos en archivos HTML e incorporarlos a Greenstone mediante el plugin HTML.

En cualquiera de los dos casos es preciso indicar la estructura jerárquica de un documento insertando etiquetas en el texto, como sigue:

<!--
<Section>
<Description>

      <Metadata name=“Title”> Realizing human rights for poor people: Strategies for achieving the international development targets </Metadata>

</Description>
-->

(el texto de la sección va aquí)

<!--
</Section>
-->

Se utilizan los marcadores %!– y –% porque indican que se trata de comentarios en HTML, y de esta forma las etiquetas de una sección no influirán en el formato del documento. Debe incluir estos marcadores alrededor de sus etiquetas de sección, aún cuando el documento que esté trabajando no sea HTML (por ejemplo si es un archivo Word de Microsoft).

En la parte correspondiente a la descripción (entre las etiquetas <Description> y </Description>) pueden especificarse otros tipos de metadatos, aunque no se haga para colecciones como las aquí descritas.

Es importante recordar que cuando inserta etiquetas de sección, está creando una tabla de contenidos jerárquica. Esto significa que las secciones pueden estar anidadas dentro de otras secciones. De hecho, todas las secciones deben estar anidadas dentro de una única sección que abarca a todo el documento.

El siguiente ejemplo muestra un documento con dos capítulos, el segundo de los cuales contiene dos subsecciones. Para ver ejemplos reales de documentos de origen etiquetados de esta manera, vea los documentos de origen para las colecciones Demo y DLS.

<!--
<Section>
  <Description>
    <Metadata name="Título">Mi Documento</Metadata>
  </Description>
  <Section> 
    <Description>
      <Metadata name="Título">Capítulo 1</Metadata>
    </Description>
-->

(el texto del capítulo 1 va aquí)

<!—
  </Section>
  <Section>
    <Description>
      <Metadata name="Título">Capítulo 2</Metadata> 
    </Description>
    <Section>
      <Description>
        <Metadata name="Título">Subsección 1</Metadata>
      </Description>
-->

(el texto de la subsección 1  va aquí)

<!—
    </Section>
    <Section>
      <Description> 
        <Metadata name="Título">Subsección 2</Metadata> 
      </Description>
-->

(el texto de la subsección 2  va aquí)

<!—
    </Section>
  </Section>
</Section>
-->

Recuerde que el metadato asignado desde adentro de una etiqueta de sección en un documento de origen tiene prioridad sobre aquel que le fue asignado al documento como un todo. Esto significa que usted no deberá especificar explícitamente el metadato Título para la sección de nivel superior dentro de un documento de origen a menos que quiera que sustituya el título que le dio al momento de especificar el metadato. En el ejemplo de arriba, a menos que usted quiera sustituir el título existente del documento deberá omitir la línea que dice:

<Metadata name="Título">Mi Documento</Metadata>

El Colector

El Colector es una función que le ayuda a crear nuevas colecciones y modificar, añadir o suprimir colecciones. Para hacerlo, será guiado por una secuencia de páginas Web en que se le pedirá la información necesaria. La secuencia es muy fácil de seguir y en esta sección se le proporcionarán las explicaciones necesarias. En lugar de utilizar el Colector, también se pueden crear colecciones a partir de la línea de comandos; en las primeras páginas de la Guía del Programador se explica en detalle cómo hacerlo.

Antes de crear y distribuir colecciones de información, hay que reflexionar sobre las consecuencias y las responsabilidades que ello entraña. Hay cuestiones jurídicas de derecho de autor: poder tener acceso a documentos no significa necesariamente poder comunicarlos a terceros. Hay también cuestiones de tipo social: en el manejo de las colecciones se deben respetar los usos y costumbres de la comunidad de la que proceden los documentos. Y hay también cuestiones éticas: algunos documentos no deben ponerse a disposición de nadie. ¡La pluma es más poderosa que la espada! Sea consciente del poder de la información y utilícelo con prudencia.

Para acceder al Colector, haga clic en el enlace correspondiente en la página principal de la biblioteca digital.

En Greenstone, la estructura de una colección en particular se determina en el momento de su creación. Ello incluye el formato de los documentos de origen, la manera de mostrarlos en la pantalla, la fuente de los metadatos, las funciones de consulta que deben suministrarse, los índices de búsqueda en texto completo que deben proporcionarse, y la manera en que deben mostrarse los resultados de las búsquedas. Una vez creada la colección, es fácil añadirle nuevos documentos, siempre que tengan el mismo formato que los documentos existentes y se suministre el mismo tipo de metadatos, exactamente de la misma manera.

El Colector tiene las funciones básicas siguientes:

  1. Crear una nueva colección con la misma estructura que una existente.
  2. Crear una nueva colección con una estructura diferente de las existentes.
  3. Añadir nuevo material a una colección existente.
  4. Modificar la estructura de una colección existente.
  5. Suprimir una colección.
  6. Grabar una colección existente en un CD-ROM autónomo y de instalación automática.

En la Figura <imgref figure_using_the_collector_to_build_a_new_collection> se muestra la utilización del Colector para la creación de una nueva colección, en este caso a partir de un conjunto de archivos HTML almacenados localmente. Se debe decidir en primer lugar si se ha de trabajar con una colección existente o crear una nueva. En el primer caso se presentan las opciones 1 y 2 arriba mencionadas; en el segundo, las opciones 3 a 6. En la Figura <imgref figure_using_the_collector_to_build_a_new_collection>, el usuario opta por crear una nueva colección.

<imgcaption figure_using_the_collector_to_build_a_new_collection|%!– id:481 –%(a) %!– id:480 –%Utilización del Colector para crear una nueva colección (continuación en las páginas siguientes) ></imgcaption>

Inicio de sesión

En cualquier caso, es necesario en primer lugar iniciar la sesión. Por lo general los usuarios utilizan su navegador Web para acceder a la función de creación de colección en una computadora remota y crear la colección en ese servidor. Obviamente, no podemos permitir que cualquier persona cree colecciones (aunque sólo sea por motivos de derechos), por lo cual Greenstone contiene un sistema de seguridad que obliga a las personas que desean crear colecciones iniciar en primer lugar la sesión. Esto permite a un sistema central ofrecer un servicio a quienes desean crear colecciones de información y utilizar ese servidor para ponerlas a disposición de otros. Por otra parte, si utiliza Greenstone en su propia computadora, puede crear colecciones localmente, pero sigue siendo necesario iniciar la sesión, ya que otras personas que utilicen el sistema Greenstone en la misma computadora no estarán habilitadas a crear colecciones sin una autorización previa.

<imgcaption figure_using_the_collector_to_build_a_new_collection_1|%!– id:486 –%(b) %!– id:485 –%Utilización del Colector para crear una nueva colección (continuación) ></imgcaption>

Una vez iniciada la sesión, aparece la página presentada en la Figura <imgref figure_using_the_collector_to_build_a_new_collection_1>. En ésta se muestra la secuencia de pasos que supone la creación de una colección. Estos pasos son:

  1. Informaciones sobre la colección
  2. Datos fuente
  3. Configurar la colección
  4. Crear la colección
  5. Visualizar la colección

El primer paso consiste en especificar el nombre de la colección y la información conexa. El segundo, en indicar la procedencia de los datos de origen. El tercero consiste en ajustar las opciones de configuración, etapa que resulta más útil a medida que usted adquiere experiencia con Greenstone. En el cuarto paso es donde la computadora efectúa toda su labor. Durante el proceso de “creación” el sistema elabora todos los índices y reúne todas las demás informaciones necesarias para el buen funcionamiento de la colección. El quinto paso consiste en visualizar la colección que se ha creado.

Estos cinco pasos se muestran como una secuencia lineal de botones grises en la parte inferior de la pantalla de la Figura <imgref figure_using_the_collector_to_build_a_new_collection_1>, y en la parte inferior de todas las demás páginas generadas por el Colector. Esta pantalla ayuda a los usuarios a ubicarse en el proceso. El botón que se debe pulsar para continuar la secuencia aparece en verde (informaciones sobre la colección en la Figura <imgref figure_using_the_collector_to_build_a_new_collection_1>). Los botones grises (todos los demás de la Figura <imgref figure_using_the_collector_to_build_a_new_collection_1>) están desactivados. Los botones cambian a color amarillo a medida que se avanza en la secuencia, y el usuario puede volver a cualquier paso anterior haciendo clic en el botón amarillo correspondiente. Esta pantalla sigue el modelo de los “asistentes” que se utilizan ampliamente en los programas comerciales para guiar a los usuarios a través de las diferentes etapas necesarias para la instalación de un nuevo programa.

Informaciones sobre la colección

<imgcaption figure_using_the_collector_to_build_a_new_collection_2|%!– id:497 –%© %!– id:496 –%Utilización del Colector para crear una nueva colección (continuación) ></imgcaption>

En la Figura <imgref figure_using_the_collector_to_build_a_new_collection_2> se muestra el próximo paso en la secuencia: las informaciones sobre la colección. Cuando se crea una nueva colección es necesario proporcionar algunas informaciones al respecto:

  • el título
  • la dirección de correo electrónico de contacto, y
  • una descripción breve.

El título de la colección es una frase breve que se utiliza constantemente en la biblioteca digital para identificar el contenido de la colección. Como ejemplos de títulos pueden mencionarse Biblioteca de la alimentación y la nutrición, Biblioteca sobre el medio ambiente mundial, Biblioteca para el desarrollo, etc. La dirección de correo electrónico especifica el primer punto de contacto para cualquier problema que se plantee con la colección. Si el programa Greenstone detecta un problema, puede enviarse un informe de diagnóstico a esta dirección. Por último, la descripción breve consiste en una oración en que se enuncian los principios por los que se rige el contenido de la colección. Aparece en la primera página, debajo del encabezado acerca de esta colección, cuando se presenta la colección.

La etapa en que se encuentra el usuario en la secuencia de creación de una colección está indicada por una flecha que aparece en la parte inferior de la pantalla, en este caso concreto, como muestra la Figura <imgref figure_using_the_collector_to_build_a_new_collection_2>, nos encontramos en la etapa de las informaciones sobre la colección. El usuario sigue a la Figura <imgref figure_using_the_collector_to_build_a_new_collection_3> pulsando el botón verde datos fuente.

Datos fuente

<imgcaption figure_using_the_collector_to_build_a_new_collection_3|%!– id:506 –%(d) %!– id:505 –%Utilización del Colector para crear una nueva colección (continuación) ></imgcaption>

La Figura <imgref figure_using_the_collector_to_build_a_new_collection_3> ilustra el momento en que el usuario especifica el texto de origen que corresponde a la colección. Puede usted basar su colección en una de las estructuras por defecto suministradas, o en la estructura de una colección existente.

Si opta por la estructura por defecto, la nueva colección podrá contener documentos HTML (archivos que terminan en .htm o .html), documentos de texto sin formato (archivos que terminan en .txt o .text), documentos en formato Microsoft Word (archivos que terminan en .doc), documentos pdf (archivos que terminan en .pdf) o documentos de correo electrónico (archivos que terminan en .email). En la sección 3.9 se da más información sobre los diferentes formatos de documento que pueden incluirse.

Si basa su nueva colección en una existente, los archivos de la nueva colección deben ser exactamente del mismo tipo que los utilizados para la creación de la colección existente. Conviene observar que algunas colecciones utilizan formatos de archivos de entrada no normalizados, mientras que otras utilizan metadatos especificados en archivos auxiliares. Si sus nuevos datos carecen de esta información, algunas funciones de consulta pueden no funcionar correctamente. Por ejemplo, si usted clona la colección de demostración, podrá percatarse de que los botones temas, organizaciones e índices no pueden activarse.

En la página Web aparecen casillas para indicar la localización de los documentos de origen: como se indica en la Figura <imgref figure_using_the_collector_to_build_a_new_collection_3>, se pueden especificar hasta tres fuentes distintas. Si necesita más, basta con hacer clic en el botón marcado more sources (más fuentes).

Hay tres tipos de especificaciones:

  • un nombre de directorio en el sistema del servidor Greenstone (que comienza con “file://”)
  • una dirección que comienza por “http://” para los archivos que han de descargarse de la Web
  • una dirección que comienza por “ftp://” para los archivos que han de descargarse utilizando un FTP anónimo.

Si utiliza file:// o ftp:// para especificar un archivo, se descargará ese archivo.

Si utiliza http://, todo depende si la URL correspondiente hace aparecer en su navegador una página Web normal o una lista de archivos. Si se trata de una página, ésta se descargará, así como todas las páginas con las que tiene un enlace y las páginas con las que éstas tienen enlace, etc., siempre que residan en el mismo sitio, bajo esa URL.

Si utiliza file:// o ftp:// para especificar una carpeta o un directorio, o emplea una URLhttp://que lleva a una lista de archivos, todo lo que se encuentre en la carpeta y todas sus subcarpetas se incluirán en la colección.

Puede usted especificar fuentes de varios tipos.

En este caso (Figura <imgref figure_using_the_collector_to_build_a_new_collection_3>) la nueva colección contendrá documentos tomados de un sistema de archivos local así como de un sitio Web remoto, que se copiará durante el proceso de creación de la colección.

Si se pulsa el botón configurar la colección para pasar a la siguiente etapa de la creación, el Colector verificará que se puede llegar a todas las fuentes de datos que usted ha especificado. Esto puede tomar algunos segundos, o incluso algunos minutos si ha especificado varias fuentes. Si una o varias de las fuentes de datos que usted ha especificado no están disponibles, aparecerá una página como la de la Figura <imgref figure_using_the_collector_to_build_a_new_collection_4>, en que se marcan las fuentes no disponibles (en este caso, las dos).

<imgcaption figure_using_the_collector_to_build_a_new_collection_4|%!– id:522 –%(e) %!– id:521 –%Utilización del Colector para crear una nueva colección (continuación) ></imgcaption>

Las fuentes pueden no estar disponibles porque:

  • el archivo, el sitio FTP o la URL no existen;
  • necesita conectarse primero con su proveedor de servicios Internet;
  • está tratando de tener acceso a una URL protegida por un cortafuegos (firewall).

El último caso es posiblemente el más misterioso. Normalmente se produce si tiene que suministrar un nombre de usuario y una contraseña para tener acceso a Internet. A veces, si se introduce la URL, es posible ver la página desde su navegador Web, aunque el Colector anuncia que no está disponible. La explicación es que la página en su navegador puede venir de una copia almacenada localmente (cache). Por desgracia, las copias almacenadas localmente en la memoria cache son invisibles para el Colector. En este caso, recomendamos que descargue las páginas utilizando primero su navegador.

Configuración de la colección

<imgcaption figure_using_the_collector_to_build_a_new_collection_5|%!– id:530 –%(f) %!– id:529 –%Utilización del Colector para crear una nueva colección (continuación) ></imgcaption>

En la Figura <imgref figure_using_the_collector_to_build_a_new_collection_5> se muestra la siguiente etapa. La creación y presentación de todas las colecciones se controlan mediante especificaciones registradas en un archivo especial de configuración de colección (véase más abajo). Los usuarios experimentados podrán utilizar esta página para modificar los parámetros de configuración, pero la mayoría pasará directamente a la etapa final. En efecto, en la Figura <imgref figure_using_the_collector_to_build_a_new_collection_3> los botones configurar la colección y crear la colección aparecen en color verde, lo cual significa que se puede obviar por completo el paso 3.

En nuestro ejemplo, el usuario ha introducido una pequeña modificación en el archivo de configuración por defecto, incluyendo el indicador file_is_url mediante el plugin HTML. El efecto de este indicador es que se insertan el metadato de URL en cada documento, basándose en la convención de nombre de archivo adoptada por el programa que crea la copia. Estos metadatos se utilizan en la colección para que los lectores puedan remitirse a la versión original del documento y no a una copia local.

Creación de la colección

<imgcaption figure_using_the_collector_to_build_a_new_collection_6|%!– id:535 –%(g) %!– id:534 –%Utilización del Colector para crear una nueva colección (continuación) ></imgcaption>

En la Figura <imgref figure_using_the_collector_to_build_a_new_collection_6> se muestra la etapa de “creación”. Hasta ahora, las respuestas al diálogo de la interfaz se han registrado meramente en un archivo temporal. La etapa de creación es aquélla en que se efectúa todo el trabajo.

Durante la creación de la colección se elaboran los índices de consulta y de búsqueda, siguiendo las instrucciones del archivo de configuración de la colección. El proceso de creación lleva entre varios minutos y varias horas, según el tamaño de la colección y la potencia de su computadora. En algunas colecciones muy voluminosas, la creación puede llevar más de un día.

Al llegar a esta etapa, en la parte inferior de la página Web aparece una línea de estado que le informa cómo está progresando la operación, con una actualización cada cinco segundos. El mensaje visible en la Figura <imgref figure_using_the_collector_to_build_a_new_collection_5> indica que cuando se tomó la instantánea de la pantalla, se estaba convirtiendo un archivo de entrada.

Aparecen mensajes de alerta si se piden archivos de entrada o URL que no existen, o que existen pero no se dispone de un plugin para procesarlos, o el plugin no puede encontrar un archivo asociado, como un archivo de imagen incorporada en un documento HTML. La intención es que usted siga de cerca los progresos manteniendo esta ventana abierta en su navegador. Si algunos errores provocan el final prematuro del proceso, éstos quedan registrados en esta zona de estado.

Puede detener el proceso de creación en cualquier momento haciendo clic en el botón Interrumpir la creación que se muestra en la Figura <imgref figure_using_the_collector_to_build_a_new_collection_6>. Si sale de la página Web (y no ha cancelado el proceso de creación con el botón Interrumpir la creación), la operación de creación continuará y la nueva colección se instalará al final de la operación.

Visualización de la colección

Cuando la colección está creada e instalada, aparece en la parte inferior de la Figura <imgref figure_using_the_collector_to_build_a_new_collection_6> la secuencia de botones visibles en la parte inferior de las Figuras <imgref figure_using_the_collector_to_build_a_new_collection_1>—<imgref figure_using_the_collector_to_build_a_new_collection_5>, con el botón visualizar la colección activado. Al pulsar este botón, el usuario llega directamente a la colección recién creada.

Por último, existe una función de correo electrónico para enviar un mensaje a la dirección digital de contacto de la colección, así como al administrador del sistema, cada vez que se crea (o se modifica) una colección. Esto permite que esos responsables se enteren de todos los cambios que se producen y sigan de cerca lo que sucede en el sistema. Esta función está desactivada por defecto, pero puede reactivarse modificando el archivo de configuración main.cfg (véase a este respecto la Sección configuring_your_greenstone_site de la Guía del Programador de la Biblioteca Digital Greenstone).

Trabajar con colecciones existentes

Cuando comience a utilizar el Colector debe especificar si desea crear una colección totalmente nueva o trabajar con una existente, añadiéndole datos o suprimiéndolos. Como Greenstone crea automáticamente todas las estructuras de búsqueda y consulta a partir de los propios documentos, eso facilita la adición de nuevas informaciones a las colecciones existentes. Puesto que no se insertan enlaces manualmente, se pueden incorporar automáticamente a la colección los nuevos documentos disponibles en el mismo formato.

Para trabajar con una colección existente, hay que seleccionar primero la colección a partir de una lista propuesta por el programa. Algunas colecciones están “protegidas contra escritura” y no pueden ser alteradas: éstas no aparecen en la lista de selección. Una vez escogida la colección, usted puede:

  • Añadir nuevos datos y reconstituir la colección
  • Modificar el archivo de configuración de la colección
  • Suprimir completamente la colección
  • Exportar la colección a un CD-ROM

Añadir nuevos datos

Se añadirán a la colección los archivos que usted especifique. Cerciórese de no volver a especificar archivos que ya existen en la colección, pues de otro modo habrá dos ejemplares. Los archivos se identifican por su ruta de acceso completa y las páginas Web por su dirección Web absoluta. Se deben especificar los directorios y archivos del mismo modo que cuando se crea una nueva colección.

Si desea usted añadir datos a una colección y por algún motivo el proceso de creación se interrumpe, la antigua versión de la colección permanecerá inalterada.

Modificar el archivo de configuración

Los usuarios experimentados pueden modificar el archivo de configuración de la colección, del mismo modo que cuando se crea una nueva colección. En la Sección administration infra se explican los parámetros de configuración.

Suprimir la colección

Se le pedirá que confirme si realmente desea suprimir la colección. ¡Una vez suprimida, Greenstone no podrá recuperarla!

Exportar la colección

Puede usted exportar la colección en una forma que permita grabarla en un CD-ROM Greenstone para Windows autónomo y de instalación automática. Como los programas comerciales que crean discos CD-ROM de instalación automática son onerosos, esta función incluye un módulo de instalación propio del sistema.

Al exportar la colección, el cuadro de diálogo le informa del nombre del directorio en que se ha colocado el resultado. El contenido íntegro del directorio se grabará en el CD-ROM utilizando un programa estándar de grabación de CD.

La inmensa variedad de las diferentes configuraciones Windows posibles nos ha impedido probar y depurar el instalador de Greenstone en todas las condiciones posibles. Aunque produce discos CD-ROM que funcionan en la mayoría de los sistemas Windows, el instalador está aún en proceso de elaboración. Si surgen problemas y dispone usted de un paquete de instalación comercial (por ejemplo, InstallShield), lo puede utilizar para crear discos CD-ROM a partir de la información suministrada por Greenstone. El directorio de exportación antes mencionado contiene cuatro archivos relativos al proceso de instalación, y tres subdirectorios que contienen la colección y el programa informático completos. Quite los cuatro archivos y use InstallShield para obtener una imagen de CD-ROM que instalará esos directorios y creará un acceso directo al programa gsdl\server.exe.

Formatos de documentos

Cuando se crea una colección, Greenstone procesa cada diferente formato o documento de origen buscando un plugin que admita ese formato en particular. Los plugins están especificados en el archivo de configuración de la colección. Greenstone suele utilizar el nombre de archivo para determinar los formatos de documentos, por ejemplo, foo.txt se procesa como un archivo de texto, foo.html, como un archivo HTMLfoo.doc como un archivo Word.

Se ofrece a continuación un resumen de los plugins que están disponibles para los formatos de documento más utilizados. En la Guía del Programador de la Biblioteca Digital Greenstone pueden consultarse más detalles sobre estos plugins y los plugins adicionales para formatos utilizados con menos frecuencia.

TEXTPlug (*.txt,*.text)

TEXPlug interpreta un archivo de texto sin formato como un documento sencillo. Añade los metadatos título basándose en la primera línea del archivo.

htmlPlug (*.htm,*.html; también .shtml, .shm, .asp, .php, .cgi)

htmlPlug procesa los archivos HTML. Extrae los metadatos de título basándose en la etiqueta <title>; también puede extraer otros datos expresados utilizando una sintaxis de la “metaetiqueta” HTML. Este plugin ofrece muchas opciones que se presentan en la Guía del Programador de la Biblioteca Digital Greenstone.

WORDPlug (*.doc)

WORDPlug importa documentos de formato Microsoft Word. Hay muchas variantes diferentes en el formato Word, e incluso los programas Microsoft cometen con frecuencia errores de conversión. Greenstone utiliza programas independientes para convertir los archivos Word en HTML. En el caso de algunos formatos Word más antiguos, el sistema recurre a un algoritmo sencillo de extracción que encuentra todas las porciones de texto en el archivo de entrada.

PDFPlug (*.pdf)

PDFPlug importa documentos de formato Pdf de Adobe (“formato de documento portable”). Al igual que WORDPlug, utiliza un programa independiente, en este caso pdftohtml, para convertir los archivos PDF en HTML.

A semejanza de WORDPlug, las colecciones por defecto mostrarán el equivalente HTML del archivo cuando el usuario haga clic en el icono documento ; sin embargo, es posible ajustar las cadenas de formato en el archivo de configuración de la colección para dar al usuario acceso al archivo PDF original, y le recomendamos que proceda así. Una vez más, basta con sustituir las etiquetas <link>…</link> por <srclink>…</srclink>.

El programa pdftohtml no funciona con algunos archivos PDF. Lo que sucede es que el proceso de conversión lleva un tiempo excepcionalmente prolongado y con frecuencia aparece en la pantalla un mensaje de error relativo a dicho proceso. Si ello ocurre, la única solución que podemos ofrecerle es retirar de la colección el documento causante del error. PDFPlug tampoco puede tratar archivos PDF codificados.

PSPlug (*.ps)

PSPlug importa documentos de formato PostScript. Funciona mejor si ya está instalado en su computadora un programa Linux estándar llamado ps2ascii. Este está disponible en la mayoría de las instalaciones Linux, pero no en Windows. Si el programa no está disponible, PSPlug se limita a un simple algoritmo de extracción de texto.

EMAILPlug (*.email)

EMAILPlug importa los archivos que contienen mensajes de correo electrónico y puede funcionar con los formatos de correo electrónico comunes, como los utilizados por los usuarios de correo electrónico de Netscape, Eudora y Unix. Cada documento de origen se examina para determinar si contiene uno o varios mensajes de correo electrónico unidos en un archivo único, y en ese caso se procesa el contenido. El plugin extrae los metadatos Subject (“Asunto”), To (“Destinatario”, “A”), From (“Remitente”, “De”) y Date (“Fecha”). Sin embargo, este plugin no puede todavía procesar correctamente los mensajes codificados de formato MIME, que aunque son legibles, tienen con frecuencia un aspecto extraño.

ZIPPlug (.gz, .z, .tgz, .taz, .bz, .zip, .tar)

El plugin ZIPPlug trata los siguientes formatos de entrada comprimidos y/o archivados: gzip (.gz, .z, .tgz, .taz), bzip (.bz,), zip ( .zip .jar) y tar (.tar). Se basa en los programas gunzip, bunzip, unzip y tar, que son programas utilitarios Linux estándar. ZIPPlug está desactivado en las computadoras equipadas con Windows.

1)
Esta opción se inhabilita si ya existe un elemento con el mismo nombre.
legacy/manuals/es/user/making_greenstone_collections.txt · Last modified: 2023/03/13 01:46 by 127.0.0.1