Trois exemples: de 1000 à 100 000 pages

Cas d'une petite collection: de 500 à 1000 pages

La plupart des ONG ont un volume de 500 à 1000 pages à numériser. Un tel volume peut être traité sur place si on trouve des volontaires motivés.

Numérisation

La première étape consiste à numériser les publications pour produire un fichier TIFF de bonne qualité de chaque page, et une image séparée pour chaque illustration (croquis, image en niveaux de gris ou en couleurs). Si on fait l'hypothèse que 1000 pages doivent être numérisées, ceci peut représenter un travail à temps partiel d'environ un mois – pour la numérisation seule. Les fichiers TIFF occuperont de 60 à 80 méga-octets d'espace disque, et c'est une bonne idée que de graver un cédérom réinscriptible contenant ces fichiers. Un scanner à plat de bas de gamme de 100 à 300$ suffira à mener cette tâche de numérisation à bien. La numérisation peut être prise en charge par un volontaire, après les heures de bureau ou les jours non ouvrés, au bureau ou à la maison.

ROC

La ROC, menée par un autre volontaire ou par une équipe de volontaires, doués en langue et en correction, vient ensuite. Les fichiers TIFF peuvent être partagés entre ordinateurs, ou bien on peut utiliser un seul ordinateur pour l'ensemble du travail. Il faudra en moyenne de 5 à 6 mois à temps partiel (par exemple, environ 20 heures par semaine) pour convertir 1000 pages en bons documents Word ou HTML.

Sous-traiter

On peut aussi envisager de sous-traiter les opérations de numérisation et de ROC. Il en coûtera probablement de 1500 à 2000$ pour tout convertir en bons fichiers Word ou HTML.

Toutes les publications d'une organisation: 5000 pages

De nombreuses organisations plus importantes disposent d'environ 5000 pages d'archives de livres, journaux, revues, et autres documents, actuels ou épuisés.

Numérisation

Voilà un volume trop important pour un scanner à plat. La numérisation doit donc être sous-traitée (ce qui coûtera environ 400$ pour 5000 pages) ou confiée à un scanner à chargeur (qui coûte environ 900$). On peut aussi envisager l'achat groupé d'un scanner plus performant, avec d'autres institutions ou ONG (il en coûtera 6000$, à diviser par le nombre de participants). Les 5000 pages converties au format TIFF occuperont 300 à 400 méga-octets d'espace disque. Là encore, c'est une bonne idée de graver un cédérom réinscriptible contenant ces fichiers.

ROC

La ROC, menée par un volontaire ou par une équipe de volontaires, doués en langue et en correction, vient ensuite. Ici encore, les fichiers TIFF peuvent être partagés entre ordinateurs, ou bien on peut utiliser un seul ordinateur pour l'ensemble du travail. Il faudra en moyenne de 25 à 30 mois à temps partiel (par exemple, environ 20 heures par semaine) pour convertir 5000 pages en bons documents Word ou HTML. En pratique, c'est là une tâche trop longue et gourmande en ressources informatiques pour pouvoir fonctionner sur la base du volontariat. Il faudrait rémunérer les volontaires, surveiller leurs performances et la qualité de leur travail, fournir l'espace adéquat, etc., pour obtenir un travail finalisé de bonne qualité dans des délais raisonnables.

On peut aussi créer des fichiers image PDF, ce qui occupera de 300 à 400 méga-octets d'espace disque, et sera plus difficile à télécharger depuis l'Internet.

Sous-traiter

On peut aussi envisager de sous-traiter les opérations de numérisation et de ROC. Il en coûtera probablement de 7500 à 10 000$ pour tout convertir en bons fichiers Word ou HTML.

Une petite bibliothèques: 100 000 pages

Des organisations plus importantes, des universités, des gouvernements, et des bibliothèques spécialisées disposeront peut-être de toute une bibliothèque à numériser – disons, 100 000 pages. La première question à se poser est celle des droits attachés aux publications: si elles ne sont pas placées ou tombées dans le domaine public, il faut obtenir des détenteurs des droits l'autorisation explicite de les numériser. Pensez aussi à vérifier si les fichiers ne sont pas déjà disponibles sous forme numérique.

Numérisation

Le volume est trop important pour un scanner à chargeur. Il faut donc sous-traiter la numérisation (il en coûtera 8000$ pour 100 000 pages) ou acheter un scanner plus performant en commun avec quelques autres institutions ou ONG (il en coûtera 6000$, à diviser par le nombre de participants). Les 100 000 pages converties au format TIFF occuperont 6 à 8 giga-octets d'espace disque. La meilleure idée est de graver une série de copies de ces fichiers sur cédérom réinscriptible.

ROC

La ROC vient ensuite (on peut aussi penser à créer des fichiers PDF pour des documents moins largement utilisés). Il faudra en moyenne de 500 à 700 mois à temps partiel pour convertir 5000 pages en documents Word ou HTML. C'est une opération impossible à mener sur la base du volontariat, et il faut avoir une approche professionnelle.

On peut réduire les coûts en transformant les pages les moins fréquemment utilisées (par exemple, les 80% les moins utilisés, ce qui représente 80 000 pages) en PDF, et ne transformer que les 20 000 pages restantes en Word et en HTML. Les fichiers PDF occuperont 6 à 8 giga-octets d'espace disque et seront plus difficiles à télécharger sur l'Internet, mais ils ne coûteront que 0.2$ par page à faire produire par des professionnels (pour un coût total de 16 000$). S'il fallait faire créer 80 000 fichiers PDF à partir de fichiers TIFF par des volontaires utilisant des programmes de conversion vers PDF tels qu'Adobe Acrobat, il faudrait prévoir 10 à 20 mois de travail à temps partiel sur un ordinateur puissant.

Sous-traiter

On peut aussi envisager de sous-traiter le travail. Si on reste sur l'hypothèse de 80% des pages converties en PDF et les 20% les plus fréquents en HTML, le coût du PDF s'élévera à environ 16 000$ et celui du HTML de 30 à 40 000$, pour un budget global d'environ 50 000$. Si toutes les pages passaient à la ROC, il en coûterait de 150 à 200 000$ pour convertir toute la collection en fichiers Word et HTML.