Imprimé,
single source publishing
et technologies du web
Julie Blanc
« Repenser les humanités numériques /
Thinking the Digital Humanities Anew »
27 octobre 2018 – CRIHN, Montréal
01 Contexte historique
Les rapports du texte au numérique sont indissociables d’une histoire technique, je vais donc commencer par une petite
histoire de la composition des textes. Très rapide et donc non exhaustive
XV
e siècle – Composition manuelle en lignes de plomb
Dans les premiers jours de l’imprimerie en Europe, à l'époque de Gutenberg, composer une page se faisait en bougeant des
petites pièces de plombs qui correspondaient chacune à un caractère. Les caractères en plomb étaient assemblés un à
un jusqu’à former plusieurs lignes de texte à la longueur, la justification, désirée. Ils étaient ensuite couvert d’encre
et on utilisait une presse pour les imprimer sur papier. Il fallait travailler une page après l’autre. C’était un travail
très manuel et long, les imprimeurs ont donc cherché des solutions pour réduire leur temps de travail
XVII
e siècle – Composition manuelle avec division du travail (par pages)
Dans les ateliers d’imprimeries du 17e siècle, la composition du texte repose sur la division du travail. Chaque « ouvrier
typographe » reçoit une page qu’il doit composer afin que plusieurs pages d’un livre soient produites en même temps.
Le travail de composition a été divisé en page. Mais pour pouvoir faire cela, les imprimeurs avaient besoin de savoir
exactement combien de contenu pouvait aller dans une page en utilisant des calculs complexes incluant la taille de la
fonte, l’interlignage,la taille de la page, etc. On observe donc déjà l’apparition du calcul dans la composition du
texte.
≈ 1880 – Composition mécanique (Linoytpe)
Puis l’électricité est arrivée et avec cela de nouvelles machines et de nouvelles tentatives de mécanisations du texte. Vers
1880, Ottmar Mergenthaler propose la Linotype. C’est une machine de composition au plomb qui utilise un clavier de 90
caractère. En gros, on tape sur les touches de clavier et la machine sert le caractère en plomb correspondant pour l’insérer
dans une ligne. Cela a permit une composition accélérée et plus régulière des blocs d’imprimerie. Mais on est toujours
dans le mécanique.
≈ 1960 – Photocomposition
Dans les années 60, apparaît un nouveau procédé appelé la photocomposition. Ici, il n'y a plus de pièce de plombs. Assis
devant le clavier d'une machine imposante, un opérateur produit des colonnes de texte sur des films transparents en
tapant sur un grand clavier. Ces films sont ensuite découpés et assemblés pour réaliser les maquettes transparentes
des pages de journal ou de livre. La composition du texte se fait à la colle et aux ciseaux. Puis on photographie, on
« flashe » ces maquettes pour produire des plaques d’imprimerie offset.
≈ 1985 – Publication assistée par ordinateur
En 1985, on observe l’avènement de l’imformatique. La composition se fait désormais sur ordinateur en utilisant un logiciel
de publication assistée par ordinateur. Les règles de la composition et les règles typographiques commencent tout doucement
à s’automatiser mais sont ralentie par un paradigme fort. Celui du wysiwig, what you see is what you get. La composition
du texte se fait à travers une interface visuelle et est affiché à l’écran exactement tel qu’il sera imprimé. Le compositeur
modifie avec sa souris, de façon visuelle, la composition. L'ordinateur offre ici de l'assistance.
Aujourd'hui, le web.
Le web a révolutionné a diffusion des publications. Aujorud'hui, on y trouve des revues, des billets et même des livres.
Tout juste hier, les langages de balisages standardisées (SGML, XML...).
Mais ce dont je veux surtout parler, c'est que le dernier changement le plus important dans la composition du texte est
apparu avec les languages de balisages standardisés au milieu du siècle dernier. (SGML, XML, TeX...)
Le web est basé sur un de ces langage de balisage, l’HyperText Markup Language, HTML, qui définit de manière sémantique
le contenu du document. Le langage de style CSS et utilisée pour stylisé ce document.
C'est important que vous compreniez tous dans la salle pour la suite de ma communication. Je vais donc revenir rapidement
sur la façon dont marche HTML et CSS. Ici, vous voyze une balise h1 qui indique que son contenu est un titre. La présentation
de ce titre est ensuite définie en CSS, on sélectionne tous les titres, les balises h1 et on leur applique un style,
ici une taille de font de 24pt
Un concept de base :
séparer le contenu (structure sémantique)
et la mise en forme (présentation visuelle)
On observe donc un changement de paradigme important par rapport à toute l'histoire de la composition des textes,
le contenu est désormais indépendant de sa forme.
La question de la reproductibilité est donc pas du tout la même entre le code pour le web et les éditeurs WYSIWYG,
on est dans deux philosophies différentes.
WYSIWYG = composition visuelle du texte: on écrit et on voit en faisant le résultat qui sera affiché ou imprimé / la
structuration est facultative
Dans le web, la structuration est indispensable et la mise en forme est déclaré dans un fichier différent.
Automated typesetting
Ce concept de séparation fond/forme a permit l'automatisation de la composition.
Navigateur = marchine de rendu
(Quantum Render project of Firefox)
Les langages du web sont des langages descriptifs, c’est-à-dire qu’ils sont interprétés directement par les navigateurs
sans qu’il y ait besoin de compilation. Le code se donne donc à voir sous deux formes : sa forme alphanumérique au moment
de l’écriture et son interprétation graphique par le navigateur web.
Si la maîtrise du rendu d’un site web était complexe il y a dix ans, les navigateurs sont aujourd’hui de puissants
moteurs de rendu qui peuvent être considérés comme des outils de design.
Quand le navigateur rend le contenu d’une page web, il commence par lire le balisage HTML et regarder le fichier CSS
pour lier le site au contenu. Une fois que cela est fait, il met automatiquement en page, basé sur les déclarations
qu’il peut trouver dans le CSS (les familles de font, les couleurs, les tailles, etc).
Automatisation de la composition de texte
Lorsque vous voyez une page web, vous voyez donc une composition automatisée de contenu faite au moment où vous chargez la
page.
Les designers ne composent donc pas du contenu réel en temps réel, ils désignent plutôt un template qui décrit la façon
dont un contenu va apparaître sur une page web. Ils prennent des décisions à un autre niveau: les titres sont centrés,
les citations ont une typographie différente que le corps de texte, est.
Dans les technologies de composition de, nous sommes donc passé l’assistance à l’automatisation
Je définis ici l’automatisation comme le fait de prévoir le comportement d’éléments balisés sémantiquement dans un
contexte donnée. Alors l’assistance c’est les sélectionner un à un en quelque sorte et d'appliquer des styles.
Je vais y revenir un peu plus tard dans ma présentation
Vous allez me dire, quel rapport avec l'imprimé ? J'y viens...
Single source publishing
Le principe de séparation forme/contenu a permis de développer un modèle de chaîne éditoriale appelée le single source publishing.
Modèle du Single source publishing
Dans un modèle comme le single source publishing, l’objectif est d’écrire une seule fois un document et le manipuler de différentes
manières en fonction de sa contextualisation. Grâce à cela on peut faire plusieurs exports à partir d’un même contenu,
juste en changeant les feuilles de style selon l’objet qui va être produit.
Single source publishing
produire plusieurs objets depuis un même fichier
conserver une sémantisation élevée pour diffusion
réduire les coûts d'infrastructure
adopter des workflows linéaires
Ce concept a été adopté depuis assez longtemps dans la publication académique car il permet produire plusieurs formats
en quelques gestes, de conserver une sémantisation élevée pour diffusion, et, non accessoirement, réduit les coûts d’infrastructure
pour produire des contenus (livres, journals). Cela permet aussi d'avoir un workflows non linéaire, avec des aller-retours
entre les différentes étapes, comme l'a déjà un peu expliqué Antoine.
Le problème de l'imprimé dans le single source publishing
Pour les sites web, les plateformes académiques ou les livres numériques on utilise CSS, donc la composition automatique
avec tous les avantages que l'on a déjà pu voir. Mais comme vous pouvez le voir, pour créer un PDF et ensuite un objet
imprimé, on a besoin de passer par un logiciel de PAO comme InDesign ou de composition comme LaTeX.
L'imprimé dans le single source publishing
workflow linéaire
logiciels seulement utilisé par le designer
tâches répétitives et peu gratifiantes pour le designer (corrections)
pas de versionnage des fichiers = où est la source de vérité ?
Et là, on revient aux vieux démons. Workflow complètement linéaire, le fichier ne peut pas revenir. La moindre correction
doit être intégrée par le designer, cela produit des tâches répétitives et peu gratifiantes pour le designer, impossible
de savoir quel est le fichier source de vérité
Problématique
L'imprimé est le dernier endroit où il manque une évolution pour que ces méthodes d'organisation de la chaîne
éditoriale soient effectives (et réellement transformées).
Problématique = L'imprimé est le dernier endroit où il manque une évolution pour que les méthodes d'organisation de la
chaîne éditoriale soient effectives (et réellement transformées).
http://recherche.julie-blanc.fr/timeline-publishing/
Parallèlement à cela, on peut observer que les technologies de l'édition sont en constante évolution depuis l'apparition
du numérique.
J'ai fait une petite timeline des différentes technologies d'éditions à plusieurs niveaux: hardware, logiciels de lecture,
logiciels de créations, logiciels et systèmes d'écritures, formats et languages. J'ne profite pour vour dire que cette
time line est faite en HTML et CSS, que le code source est ouvert. Ce que l'on constate, c'est que l'on arrive à une
époque où les technologies d'édition sont de plus en plus basées sur les technologies du web.
Faire de l'imprimé avec les technologies du web ?
Voilà donc l'idée qui a émergé ces derniers mois: et si on faisait de l'imprimé avec des technologies du web ?
Imprimer depuis un navigateur web
Je vroudrais commencer par la base. Il est très simple d'utiliser un navigateur web pour créer un PDF, il suffit simplement
d'utiliser la boîte d'impression. Seulement, comme vous pouvez le voir, le résultat ressemble plus à un document qu'à
un livre.
Composer un livre,
ce n'est pas seulement découper un flow en page
Jan Tschichold,
Livre et typographie
Pour un livre, on a besoin de titre courants, numéros de pages, notes en base de page, table des matières... De marges différentes
en fonction de la page de gauche ou de droite ou encore commencer chaque chapitre sur la page de droite...
Tout cela n'a rien à voir avec une page web. Produire un livre, ne peut donc pas simplement être produire découper
un flow de texte en page, comme le fait la boîte d'impression.
♥ Modules CSS print ♥
Heureusement, il existe depuis 2012 des modules CSS qui permettent de composer pour des livres imprimés. Je les appelle les
modules CSS print.
Problème : pas d'implémentation dans les navigateurs
Malheureusement, ils ne sont pas implémenté dans les navigateurs. Qu'est-ce que cela signifie ?
HTML et CSS sont des languages standarisé. Cela signifie que pour une même syntaxe, tous les navigateurs doivent rendrent
la même chose. Mais pour que cela soit possible, il faut que quelqu'un décide de cette syntaxe et décrive ce que celle-ci
signifie, c'est le rôle du W3C.
Je vais utiliser une métaphore pour vous expliquer. Prenons un jardin d'enfant, c'est notre CSS. IL est commposé de différents
modules, ici les différents équipements du jardin d'enfant.
Un groupe d'architecte (W3C) offre des plans (specifications) qui décrivent quelques équipements (les modules CSS).
C'est les constructeurs (les développeurs des navigateurs web) qui doivent batir les équipements et les rendres accessibles.
Certains équipements sont obligatoires (le portillon et une balançoire) afin que tout le monde puisse en profiter, d'autres
ne le sont pas. Les constructeurs ont construit certains équipements mais pas tous.
Et sur les plans, on voit ces supers supers toboggans (les modules CSS print) avec lesquels on a vraiment envie de jouer
mais qui ne sont pas encore construits. Peut être que dans 10-20 ans, les tobbogans seront construit mais on a pas le
temps d'attendre jusque là. C'est aujourd'hui dont on a besoin.
Polyfill
Script javascript permettant de simuler sur un navigateur web des fonctionnalités qui n’y sont pas
nativement disponibles
C'est donc ce qui se passe avec les modules CSS print, on a les spécifications mais elles ne sont pas implémentés dans les
navigateurs. Alors on va nous même faire cette implémentation en construisant un polyfill. Un polyfill est un script
javascript permettant de simuler sur un navigateur web des fonctionnalités qui n’y sont pas nativement disponibles.
C'est ce que fait paged.js. Paged.js prends les spécifications du W3C pour le CSS print et les rend utilisable.
démo
faire apparaître les marges
montrer une modification dans les outils de développement
changer les marges
Comme vous pouvez le voir, on est vraiment sur une composition automatisée. Je donne des instructions en CSS mais c'est
le navigateur web qui fait la composition, au moment où ici je rechearge ma page
Comme vous pouvez le voir, on est vraiment sur une composition automatisée. Je donne des instructions en CSS mais c'est
le navigateur web qui fait la composition, au moment où ici je rechearge ma page
Visualiser un livre à tout moment
Visualiser n’importe quand un livre (le livre est mis en page avant même que l’auteur est fini // collection de livre)
S’adapter aux workflows les plus rapides
→ Booksprint
Par exemple, la semaine dernière, j'ai fait un booksprint où le livre a été écrit en 3 jours et mis en page avec paged.js,
le lendemain, nous avons reçu le livre imprimé
Composer un livre à dix mains
→ Pad2print, Luuse
PAD2print de Luuse pour PrePostPrint / détournement d'un pad transformé en éditeur de texte commun pour faire de la mise
en page à partir du code, nous étions dix personnes à travailler sur ce pad, donc nous faisions une composition à 10
mains
Impression à la demande avec paramétrage de styles
→ Espresso Book Machine
Impression à la demande avec paramétrage de styles laissé à l'utilisateur. Par exemple, il peut grossir la typographie
et générer son livre
Couplages à d'autres scripts
→ Librairie Mathjax
augmentation des possibilités en couplant avec d'autres langages, d'autres librairies ou d'autres scripts, ici Mathjax. Vous
pouvez utiliser plainement toutes les possibilités des navigateurs
Expérimenter de nouvelles formes
→ Programme de la balsamine, Open Source Publishing
Expérimenter de nouvelles formes qui laissent paraître quelque chose de l'époque. Des formes qu'il aurait était impossible
de produire avec un logiciel de PAO
PrePostPrint
Groupe de recherche autour des systèmes
de publication libres alternatifs
À ce propos, je fais partie du groupe de recherche PrePostPrint qui s'intérroge sur ces nouvelles formes. VOus en avez
déjà (bien) entendu parlé dans ce colloque. PrePostPrint cultive un intérêt pour les procédés de création
graphique et les systèmes de publication libres considérés comme « alternatifs » ou « non conventionnels »,
particulièrement s'ils sont conçus avec les technologies du web. Cette initiative a pour vocation
première d'interroger, partager, confronter et encourager ces pratiques naissantes et faciliter l'accès
aux projets et outils existants. Elle prend la forme d’événements ponctuels organisés collectivement et d'une
mailing-list ouverte constituée d'étudiants, graphistes, enseignants, chercheurs, éditeurs, amateurs, etc.
Hybrité, multisupport
Produire numérique et imprimé dans un même
geste éditorial
Enfin, Le fait de travailler sur un flux commun qui génère autant les versions imprimées que numériques permettrait de croiser
les contraintes : la liquidité du numérique aura une influence sur les productions imprimées, et le souci et la maîtrise
typographiques de l’imprimé auront une influence sur les objets numériques.
On peut observer un renouvellement dans le rapport duel entre publication numérique et publication imprimée. Envisager
la programmation comme un outil de design permet de réinventer les convergences éditoriales entre le papier et l'écran
en utilisant les mêmes outils et méthodologies que le web pour les formats imprimés. Tous les objets peuvent être produit
dans un même geste éditorial.
Automatisation ≠ no design
Je voudrais revenir un peu sur le single source publishing et ce que l'adoption des technologies du web pour l'imprimé
pourrait impliquer. L'automatisation de la composition a fait fleurir floppée de template, on l'a vu sur le web mais
cela a aussi gagné l'imprimé. La plupart des productions scientifiques se se signalent trop souvent par un manque de
qualités formelles (choix des caractères typographiques, couleurs, proportions, etc.) et une méconnaissance du potentiel
structurant d'une discipline comme le design graphique (grille, feuille de style, etc.) Lucile en a déjà bien parlé
ce matin.
« Le design des revues académiques est une terre en friche; et même si la terre des livres
est mieux cultivée, les bons designers y sont encore trop souvent réduits à une fonction simplement
réparatrice, au rôle d’anticiper les défaillances ou de corriger les pires excès des compositeurs
qui auraient perdu de vue toute idée de la composition du texte. »
Paul Stiff, « La publication de la recherche en design : la qualité oubliée »,
Azimut , n°40-41, p.44
Paul Stiff le dit très justement : « Le design des revues académiques est une terre en friche; et même si la terre des
livres est mieux cultivée, les bons designers y sont encore trop souvent réduits à une fonction simplement réparatrice,
au rôle d’anticiper les défaillances ou de corriger les pires excès des compositeurs qui auraient perdu de vue toute
idée de la composition du texte. »
Design
Sémantique = Présentation
L'opposition qui se joue souvent dans le monde académique entre sémantique et présentation n'a plus de sens au niveau
du design. Un texte arrive toujours au yeux du lecteur avec sa présentation.
Toute l'histoire de la composition du texte est un mouvement vers l'automatisation, la facilitation de tâche répétitives;
Nous pouvons utiliser les technologies du web afin de réduire le temps nécessaire à la composition ou pour prendre des
décisions pour chaque éléments. Nous pouvons ensuite voir si la mise en page a du sens d'un point de vue sémantique
et esthétique. Mais que faire si l'auteur veut un style spécifique à un certain endroit ? si l'éditeur voulait que quelque
chose ait l'air différent ? Que se passe-t-il si le designer a une idée de mise en page incroyable ? Il faut donc ajouter
de nouvelles règles, spécifique à cet élément. Se pose alors la question: est-ce que cette règle spécifique apparaît
ailleurs dans votre contenu ? Si non, est-elle une règle ?
⟡
La composition
automatisée
est un mythe
⟡
La composition automatisée est un mythe. Il ne faut pas se rendre aveugle face à l’efficacité technique.
La transmission des connaissances aux lecteurs nécessitera toujours une intervention humaine, pour s'assurer
que le message est envoyé dans le bon sens.
L'opposition qui se joue souvent dans le monde académique entre sémantique et présentation n'a plus de sens au niveau du
design. Un texte arrive toujours au yeux du lecteur avec sa présentation. Ce que j'entends lorsque je parle de de composition
automatisée : réduire le nombre de tâches longues et monotones en établissant des règles, et laisser au designer suffisamment
d'espace pour qu'il puisse prendre des décisions de conception spécifiques.
Façonnage matériel de la forme visuelle dans la matière
↓
Programation dans le logiciel
Les processus de production, de composition ont évolué d'un espace de façonnage matériel de la forme visuelle dans la matière
vers un espace de sa programation dans le logiciel.
Raison graphique (Jack Goody)
Raison computationnelle (Bruno Bachimont)
Cette évolution s'intègre aussi dans un questionnement du passage d'une raison graphique (Jack Goody) à une raison computationnelle
(Bruno Bachimont), soit une rationnalité propre au numérique qui repose sur la logique et le calcul Les nouvelles structures
conceptuelles qu'offrent la programmation, particulièrement l'idée d'une logique déclarative ici le css, ont une incidence
sur les formes produites.
Qu'est-ce que le code fait à la pensée visuelle, à la composition ?
Il faudrait donc aussi plus en profondeur cette idée: au-delà de l'automatisation, qu'est-ce que le code fait à la pensée
visuelle, à la forme et la composition ?
Merci
julie-blanc.fr
contact@julie-blanc.fr
@julieblancfr