|
Interface n° e-88 Octobre 2002
La 3ième édition du Dictionnaire Encyclopédique de la Bible (D.E.B.) : problème s et tendances nouvelles dans la gestion électronique des textes et des documents
(présentation dans le cadre du Forum du Livre et des Médias religieux, Palais des Congrès, Bruxelles, 28 septembre 2002 par R.-Ferdinand Poswick, Yolande Juste, Jean Bajard du Centre 'Informatique & Bible' de Maredsous)
1. En quoi les contenus du D.E.B. ont été revus et augmentés ? 
2. Quels sont les grands défis pour l'édition imprimée aujourd'hui ?
Malgré une production toujours plus abondante de papier dont souffrent les derniers grands domaines forestiers de la planète, l'ère du tout-électronique (ou, comme nous aimons l'appeler, l'ère de l'écriture électronique) remplace progressivement l'ère du papier imprimé (et de l'écriture alpha-phonétique).
Cela donnera peut-être au livre une nouvelle valeur d'objet de luxe plutôt que de consommation de masse (au moins dans les pays technologiquement développés ... et puis, progressivement, partout où s'étendra l'écriture électronique).
Des signaux assez nets sont donnés par les dificultés que rencontrent, depuis une trentaine d'années, tous les groupes de presse, tous les éditeurs et tous les imprimeurs. Un exemple parmi d'autres : la prestigieuse institution qu'était l'Imprimerie Nationale de Paris. Elle a fonctionné depuis l'ère napoléonienne; elle a servi de pilier et de modèle à des générations de typographes, avec des spécialisations pointues dans l'impression de textes dans toutes les langues orientales; elle a été le fondement de l'efficacité administrative de la France centralisée. Privatisée depuis une dizaine d'année, elle tente de survivre en se délocalisant et en vendant ses infrastructures historiques de la rue de la Convention à Paris . Tout un symbole !
Plus concrètement encore : la photocomposition électronique et la fabrication d'un ouvrage comme le Dictionnaire Encyclopédique de la Bible font mettre le doigt sur la désaffection dont la filière de l'imprimé est l'objet, au profit d'une filière du tout-électronique.
Il n'existe que quelques vrais programmes de photocomposition électronique sur le marché. La plupart des imprimeries (en régression par rapport aux potentialités des programmes mis au point pour les gros ordinateurs des générations antérieures) utilisent QuarkXPress (ADOBE), programme qui va bientôt disparaître au profit d'une nouvelle programmation présentée sous le nom d' InDesign. Mais aucun de ces deux produits n'arrive à la cheville de leur grand-frère Framemaker (également proposé par ADOBE depuis 15 ans) et qui, à notre connaissance, est l'un des seuls programmes capable de composer et mettre en page de façon entièrement automatisée des masses de 8 millions de caractères ou plus sur base d'un paramétrage intelligent. En Mars 2002, nous avons ainsi photocomposé automatiquement un ouvrage de plus de 4.000 pages à l'aide de ce programme.
Malheureusement, l'évolution des technologies informatiques pousse vers deux standards qui, dans le futur, pourront être considérés comme des améliorations majeures :
a) l'UNICODE, code de base pour toutes les machines électroniques fondé sur une structure de 16 ou 32 bits. Il remplace progressivement l'ASCII (ou ANSI) à 8 bits utilisé presque depuis les origines de l'informatique sur tous les types de machines programmables. L'UNICODE devrait permettre de donner une adresse directe à 65.536 valeurs (dans un premier temps) au lieu des 256 valeurs d'adressage direct que permet l'ASCII. Dans ce standard, 47.194 caractères ou symboles différents sont déjà définis au plan international et acceptés par tous les constructeurs (dont plus de 27.484 idéogrammes chinois).
b) l'XML (ou EXtended Markup Language) qui codifie les éléments de structuration d'un texte ou d'un document, au-dessus du niveau du caractère : mot, phrase, paragraphe, sous-titre, titre, note, illustration, etc...
L'utilisation de ces deux standards devrait permettre une parfaite transportabilité des données entre différents types de sorties possibles : écrans d'ordinateurs en local ou en télécommunication, téléphonie, filière typographique, etc...
Le test que nous avons réalisé à l'occasion de la création du D.E.B-3 nous a montré que toutes les programmations récentes offrent un nivellement par le bas, c'est-à-dire : vers les exigences limitées de l'Internet. Tandis que les vrais programmes typographiques ne semblent plus faire l'objet de développements. Pas une des grandes familles de caractères numérisés (Times, Times Roman, Garamond, Helvetica ou autres) n'a encore un jeu de caractères électroniques complet en UNICODE. Seul le projet universitaire TITUS à Münich possède, sous un mode assez expérimental et sélectif, un certain nombre de caractères spéciaux en Times. On trouve des séries partielles sur Internet ... et il y en beaucoup sans qu'on sache les raisons (souvent très locales) de l'extension d'un jeu de caractères, ni qu'on puisse rapidement repérer les différences d'une proposition à l'autre.
La seule série UNICODE complète est fournie avec l'ARIAL (un caractère moderne sans pied) de Mr Bill Gates, mais cette série n'est pas directement compatible avec les variantes typographiques des autres polices accessibles électroniquement, même les autres ARIAL! Il faut donc "tromper" les programmes et les machines par des astuces que seuls de très bons analystes et programmeurs sont capables de découvrir et de mettre en oeuvre.
Et, quand on pose des questions aux fabricants de logiciels ou de caractères électroniques ou dans les Forums d'utilisateurs, le constat est général : tous les développements informatiques récents sont pensés en fonction de l'usage dans Internet par des concepteurs qui n'ont plus aucune formation typographique et qui se soucient très peu de la filière du papier imprimé!
On a le même genre de déconvenue dans l'utilisation d'XML : pas un seul des sites qui développent les standards XML ne présente ses données dans l'Internet en XML, elles sont toutes transformées, avant affichage, en HTML, le standard réducteur de l'Internet depuis la création du WWW.
Voici un avertissement et une sonnette d'alarme à tirer en direction de tous ceux qui vivent encore (pour combien de temps ?) du papier imprimé !
3. Comment l'on va vers le tout-Internet (payant) ! 
|