Introduction
Lors du chapitre précédent, nous avons examiné à travers le cas d’étude Stylo la première phase d’une chaîne éditoriale savante qu’est la saisie d’un texte. En nous concentrant sur l’élaboration du document, élément au coeur du traitement des informations, nous avons opté pour une méthodologie qualitative d’observation des médiations à l’oeuvre pour en comprendre la construction, à l’instar de ce que F. Kittler proposait dans ces travaux. Pour mener à bien cette étude nous nous sommes affranchis de la page qui, en tant qu’élément graphique affiché à l’écran, cache et invisibilise les opérations d’écriture réalisées par la machine. Ainsi nous avons pu mettre en lumière les différentes formes de document par lesquelles passe un texte saisi dans l’éditeur de texte Stylo, au nombre de quatre, dont trois sont écrites par Stylo et une par l’auteur. Dès lors, ceci nous a permis d’affirmer qu’il y a une co-construction du document, que l’on peut considérer comme la source utilisée par une chaîne éditoriale, entre l’environnement numérique d’écriture et l’auteur.
Toutefois, ce document source n’est pas publiable en l’état. En effet, qu’une chaîne d’édition soit orientée vers la publication imprimée ou vers la publication numérique, les formats dans lesquels les textes sont saisis ne sont pas adaptés à ces objets publiés. Dans la plupart des cas de figure, les documents sources fournis par les auteurs sont dans des formats provenant des traitements de texte (ODT pour LibreOffice, DOCX pour MS Word, PAGES pour Pages, etc.) ou encore en texte brut (par exemple Markdown) alors que sont préférés les formats PDF pour les impressions et HTML pour les objets numériques (vers des sites web ou des ePUB).
L’action suivant l’écriture consiste alors à transformer et adapter le contenu textuel de la source à l’objet que l’on souhaite rendre public, tout en respectant un certain nombre de règles éditoriales selon le type d’objet à produire, que ce soit pour aboutir à un objet imprimé ou numérique, et des politiques éditoriales en vigueur dans les maisons d’édition ou les revues savantes concernées. Cette transformation, que pour l’instant nous pouvons associer à des changements de formats, procède à des modifications du texte original pour qu’il soit adapté à l’objet désiré. Ce faisant, la transformation réécrit intégralement le document pour en générer un nouveau qui n’est plus le document source et cela au détriment d’une partie de l’écriture initiale qui doit disparaître et ne sera, ce faisant, jamais publiée.
Dans ce troisième chapitre, nous démontrons qu’en effaçant des traces de l’écriture du document source, ces transformations suppriment et cachent une partie de cette intimité produite par le couple humain machine durant l’action d’écriture. Nous nous appuierons sur des cas concrets de transformations de textes du livre nativement numérique, Contribution numérique : cultures et savoirs réalisées avec le générateur de livre statique Le Pressoir en nous appuyant sur la même méthodologie de recherche que pour le chapitre précédent.
Plan
- Introduire les chaîne éditoriales
- revue de litt sur les chaines numériques
- fabrique de l’édition
- présentation du pressoir (fonctionnement) et du livre contribution numérique
- faire la transition sur les textes sources et les traces
- Les traces numériques
- définir trace numérique et leur lien avec l’intime
- production de documents et désintéressement des fichiers temporaires ou des écrits de la machine (ex: pour la fouille de texte des archives du web on supprime le bruit)
- effacement et oubli des traces intimes (parsing = action d’effacer ?)
- définir l’oubli et l’effacement
- exemple : fouille de texte, traitement des archives du web (et archéologie du web)
- Les transformations et les conversions dans le livre contribution num
- définir ces termes
- transformation des traces
- le single source publishing
- Les AST comme solution aux transformations mais aussi de destructuration du texte (production d’un autre document)
- origine de cet objet
- utilisation pour du texte
- Introduire AST Pandoc
- présenter Living paper comme autre exemple (quelques lignes)
- Conclusion
- Une partie du document construit tout au long de la chaine de publication, que l’on considère comme du bruit, disparaît au fil des transformations de la source en objet à publier.
Notes
Dans cette partie sont traitées les écritures intermédiaires que l’on trouve entre la source rédigée et l’objet final produit. Bien souvent, à l’intérieur d’une chaîne éditoriale, le texte produit par un auteur est dans une forme brute. Ce texte doit subir une série de transformations (allant de une à plusieurs) pour produire les éléments finaux : des fichiers au format PDF à imprimer, des version HTML pour les ePubs ou pour un site web, ou encore des documents au format XML.
Les transformations d’un format vers un autre ne se déroulent pas par magie, et l’ordinateur ne “connait” pas les équivalences entre les syntaxes de chaque format.
Pour cela, il faut établir des règles pour formaliser ces équivalences, quand cela est possible. Parfois, cela n’est pas possible car ce qui existe dans un format n’existe pas dans un autre, et il faut alors trouver des solutions alternatives pour contourner ces problèmes.
Nous avons vu que le format Markdown était un langage de balisage léger pensé en lien avec le format HTML, de cette manière un ## titre de niveau 2
déclaré en Markdown peut être transformé en <h2>titre de niveau 2 </h2> en HTML
.
Ce que l’on remarque c’est que la structure rédigée dans la source est supprimée – et oubliée – pour laisser la place à une structure rédigée par la machine. Dans certains peuvent se retrouver différents formats intermédiaires, entre la source et le produit fini, qui sont quasiment invisibles et dont on ne retient rien, et qui pourtant participé à cette destructuration/restructuration du document.
Par exemple pour produire un document PDF depuis une source au format Markdown il faut utiliser un document intermédiaire comme une transformation au format TeX avant de pouvoir produire le fichier PDF. Cette transformation LaTeX est temporaire, elle peut être préservée pour vérification, mais n’est jamais archivée.
Deux transformations sont effectuées dans cet exemple, et deux structurations de contenus disparaissent.
Note : revenir dans le chapitre sur les archives sur l’oubli de ces traces structurelles.
Si un auteur.e saisit ##
ce n’est pas la même chose que <h2>
. Même si les deux éléments peuvent être lu de la même manière (ceci est un titre niveau deux), dans un cas il s’agit d’un titre de niveau deux en Markdown et dans l’autre un titre de niveau 2 en HTML.
Il y a donc une énorme différence sémantique puisque l’une des balises dépend des spécifications d’un format et la deuxième d’un autre : ce ne sont pas les mêmes signes qui sont inscrits dans la matière et ils ne se lisent pas de la même façon.
Or nous observons la disparition de ces signes lors des transformations des documents alors que ces signes sont pourtant différents.
La machine réécrit le texte et le restructure pour qu’il soit interprétable dans des environnements autres. En faisant cela, elle supprime une partie de l’architexte de la source ou du fichier intermédiaire pour qu’il soit conforme à ce nouvel environnement. Il y a donc un effacement de l’architexte en creux de la réécriture par la machine.
Les questions que nous pouvons nous poser relèvent de la sélection de l’architexte du produit final (politique éditoriale) et de la différence qu’il existe entre la source et l’objet transformé ?
Le livre Contribution numérique … sera étudié pour illustrer l’oubli de ces traces intermédiaires.
Montrer l’arbre abstrait syntaxique de Stylo et celui du Pressoir avec la base commune md, yaml, bibtex + pandoc et montrer que les output ne sont pas les mêmes, que malgré les différences dans l’arborescence en fin de chaine éditoriale, le sens produit diffère …
Est-ce que les traces peuvent être décrites comme étant une unité atomique d’un document ? Un document est-il un ensemble de traces organisés ? (Ça pourrait être intéressant)
Il n’est pas question de littératie numérique : l’objectif de cette analyse n’est pas de mettre en évidence les usages fait des logiciels (et d’amener les utilisateurs à faire usage de
Je m’intéresse à l’intimité produite par l’écriture de publication savante et pas au reste (l’objet document est pris objectivement, comme un support, voir ce qu’il permet de construire ou de véhiculer).
- Mettre la question du travail des assistants d’édition dans le chapitre 3
- Chapitre 5 = Diffusion (impact de la chaine sur la vie de l’objet + diffusion archivage, etc … est-ce que ces èlèments de l’intime restent dans la vie du document)
- modification du document
- annotation (seminaire editorialisation)
- question science ouverte (researchgate ? espace de republication)
- publication avec le pressoir (ASP) veut dire depot au canada pas en France, question de l’archivage
Inverser les chapitres 3 et 4