Introducción

Uno de los objetivos de la Biblioteca Digital Greenstone es hacer posible que instituciones como las universidades, organismos del sistema de las Naciones Unidas, organizaciones no gubernamentales, gobiernos y organizaciones no lucrativas puedan crear diversas colecciones de información y difundirlas por Internet o en forma de CD-ROM.

El proceso suele comprender los siguientes pasos:

  1. Determinar los documentos que han de figurar en la colección.
  2. Obtener la autorización de los titulares de los derechos de autor para incluir esos documentos en la biblioteca digital.
  3. Escanear y reconocer por medio de OCR los documentos impresos que no estén disponibles en formato digital.
  4. Convertir todos los documentos en un formato que integre texto e imágenes y se pueda importar a Greenstone, de preferencia en formato HTML o Word de Microsoft, aunque también se cuenta con plugins que reconocen otros formatos con un nivel variable de precisión (véase la Guía del Usuario de la Biblioteca Digital Greenstone).
  5. Etiquetar los capítulos, párrafos e imágenes de los documentos electrónicos.
  6. Dotar a la colección de la estructura idónea para que funcione como biblioteca digital.
  7. Crear la biblioteca digital utilizando los programas Greenstone.
  8. Editar y distribuir la colección en CD-ROM y/o distribuirla por Internet.

Para crear una colección digital es preciso que las publicaciones existan antes en formato digital. Los libros, revistas u otros documentos que sólo existan en forma impresa deberán ser escaneados, procesados y convertidos en un formato que la computadora reconozca (paso iii). El procedimiento más usual para ello es el reconocimiento óptico de caracteres (OCR por sus siglas en inglés), aunque a veces se opta por capturar íntegramente el texto. De este proceso tratan los capítulos 2 a 4 del presente manual.

El paso v) sirve para que, una vez finalizada la biblioteca, el usuario pueda seleccionar y ver en pantalla por separado las distintas partes de un documento. El paso vi) consiste en asignar atributos a cada documento, como por ejemplo categorías temáticas, palabras clave y datos bibliográficos con arreglo a los cuales se pueda ordenar y consultar la biblioteca. Estos pasos se explican en el Capítulo 5 del presente manual.

Asimismo, en el presente manual se tratan numerosas cuestiones relativas al procedimiento editorial y a la creación de una colección digital a partir de documentos impresos. Antes de seguir adelante, el lector debe plantearse las siguientes preguntas:

  • ¿Cuál es el objetivo de mi colección?
  • ¿A qué grupo de usuarios se dirige?
  • ¿Cuán grande es dicho grupo? ¿Tiene dimensión local, regional o mundial?
  • ¿Cuántos documentos tengo pensado incluir en la colección?
  • ¿Cuántas páginas?
  • ¿Cuánta información gráfica contienen?
  • ¿Cabe subdividir la documentación en partes que sean de interés para un público reducido y otras que requieran una difusión más amplia?
  • ¿Existen ya en forma electrónica los documentos?
  • De ser así, ¿en qué formato? (Señalemos de paso que un archivo PDF no equivale automáticamente al texto completo en formato electrónico, pues a menudo contiene sólo la imagen de las páginas.)
  • ¿A qué derechos de autor están sujetos los documentos?
  • ¿Quién es el titular de los derechos de autor?
  • ¿Hay otras organizaciones que se dirijan al mismo público?
  • ¿Tengo deseos de colaborar con otros grupos?
  • ¿De qué presupuesto dispongo para el conjunto del proyecto?
  • ¿De qué recursos humanos (en personas-mes) dispongo para las labores de coordinación, edición, escaneado y programación?
  • ¿De cuántas computadoras dispongo para el proyecto?
  • ¿Cuántos CD-ROM tengo pensado distribuir?
  • ¿Voy a distribuirlos gratuitamente o a venderlos?