Упражнения по использованиию Greenstone

Back to wiki
Вернутся к индексу
Файлы-образцы: difficult_documents.zip
Создано для Greenstone версии: 2.60
Изменено для Greenstone версии: 2.70

Сложные документы PDF

  1. Компоновка новой коллекции Greenstone из двух файлов в sample_files\difficult_documents. Используйте конфигурацию коллекции по умолчанию.Т.е. соберите из файлов новую коллекцию и постройте.

    Файлы называются: No extractable text.pdf и Weird characters.pdf - имена обозначают вызываемую ими проблему!

  1. Просмотрите коллекцию. Списки заголовков и наименований файлов показывают только один из документов. После того, как откроется пиктограмма "текст" для просмотра извлечённого из документа текста, там окажется мусор. Во время процесса компоновки появилось сообщение: Один документ был обработан и включён в коллекцию, а другой отклонён.

Режимы Библиотечного интерфейса.

Интерфейс библиотеки может действовать в нескольких режимах. До настоящего времени пользовались режимом по умолчанию-"Библиотекарь".

  1. Использовуйте пиктограмму Предпочтения в меню Файл для переключения в режим Эксперт и соберите коллекцию снова. Панель Создать выглядит в Эксперте по-другому;так,как дает больше опций: найдите кнопку Собрать коллекцию находящуюся внизу окна, и нажмите на неё. Появившееся сообщение говорит о том, что файл не может быть обработан по определённым причинам

  1. Рекомендуем вернутся в режим Библиотекарь для последующих упражнений, во избежание путаницы.

Улучшеная конвертивовка PDF с Ghostscript

Если у вас инсталлирован Ghostscript, вы можете использовать новый метод для конвертировки сложных документов PDF. Ghostscript - это программа для конвертировки Postscript и PDF в другие форматы. Ее можно скачать с http://www.cs.wisc.edu/~ghost/ (следуйте линку к более стабильной версии).

  1. Данные проблемы можно преодолеть с помощью меню PDFPlug. Greenstone может преобразовать файлы PDF в серию изображений с соответствующим файлом, объясняющим способ составления полного документа (называемого item file). На данном этапе упражнения требуется установить ImageMagick (Установите Greenstone).

  1. В панели Дизайн в меню Плагины документа щёлкните дважды на PDFPlug для вызова окна показывающего установки, и установите опцию convert_to к pagedimg_gif.

  1. Постройка коллекции и её предварительный просмотр. Оба документа PDF были обработаны и разбиты на страницы, но при этом каждая страница показывает, что документ не содержит текста, т.к при конвертировании PDF документов в изображения не было извлечено каких-либо текстов.

  1. В целях соответствующего просмотра документов модифицируйте формат оператора. В панели дизайн есть секция характеристики формата, выберите формат оператора Текст документа.Замените:[Text] with [srcicon]. Далее нажмите на <Заменить формат>.

  1. Предварительный просмотр коллекции с панели Создать.(Нет необходимости в построении). Изображения из документа показываются вместо извлечённого текста. Оба файла No extractable text.pdf и Weird characters.pdfтеперь показаны отчетливо..


Copyright © 2005 2006 2007 by the New Zealand Digital Library Project at the University of Waikato, New Zealand
Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled “GNU Free Documentation License.”