Introduction

Avec une ligne de code…

Qui écrit ce code?

  • Passage au numérique et entreprises commerciales
  • Qui pense les modèles épistémologiques?

Plan

  1. Enjeux
  2. Word
  3. Markdown
  4. Versions
  5. Stylo

Enjeux

La pensée est une inscription materielle

  • les outils conditionnent la pensée
  • les outils font la pensée
  • la pensée est sa manifestation matérielle
  • modéliser la pensée

Les formats

Formats propriétaires

  • doc, docx, pdf, rtf, kindle
  • Appartiennent à des privés
  • Conditionnent les pratiques
  • Posent des problèmes de pérennité
  • Exigences commerciales avant les exigences de recherche

Formats libres

  • txt, html, xml, tex, odt, epub
  • Appartiennent à la communauté
  • Sont standards - possibilité de pérennité
  • Sont redéfinis par les pratiques
  • Exigences de recherche en premier !

TXT

  • Texte brut
  • ASCII+Unicode
  • Pérenne et lisible
  • Formater en txt: le markdown

Word

À quoi sert un ordinateur?

  • à calculer
  • à enregistrer?
  • à écrire?
  • documenter le code

Les machines à écrire

  • pourquoi ne pas utiliser une machine à écrire?
  1. parce qu’on écrit aussi du code
  2. Pour enregistrer

Avant Word

Écrire du code et de la doc, enregistrer et imprimer.

  • 1976 Electric Pencil
  • 1979 Easy Writer - John Thomas Draper
  • 1979 WordStar: WYSYWYG - car notion de page
  • L’ordinateur pour tous - 1984
  • 1983 Word

Les principes

  • interface graphique
  • imprimé
  • bureautique
  • format=software

Les effets

  • la “désintermédiation”
    • perte de compétences
  • la perte de contrôle
  • la perte d’utilité (utiliser un ordinateur comme une machine à écrire)

Markdown

Texte brut

caractères sans informations graphiques

  • ASCII

  • utf-8, iso8859 etc.

  • editors, formats et syntaxe

Courte histoire

  • 2002 Aaron Swartz (RSS, redit, CC…) et atx

  • 2004: John Gruber markdown

  • Wiki Markup

  • Github md

  • pandoc md

WYSYWYM

md + yaml + bibtex

pandoc

Versions

Les états du texte

Les multiplications de fichiers

Un protocole de versionnage: git

  • 2005 Linus Torvalds
  • de l’informatique à l’écriture de textes en SH

Les notions de base

  • enregistrer les changements
  • le commit
    • identifier des moments significatif pour l’évolution du texte
  • les branches
    • de multiples niveaux de travail

La philosophie de stylo

Une approche

Dans le modèle papier, on devient un auteur lorsqu’on a publié un livre. Dans le modèle numérique, on devient un auteur lorsqu’on publie des documents structurés.

Principes de base

Mettre à profit les compétences sémantiques de l’auteur

Redonner à l’auteur la maîtrise de la structure et de la sémantique du texte.

 

Vers un éditeur :

  • plus simple : interface claire, moins d’options, moins de fonctions
  • plus riche : balisage, gestion bibliographique, métadonnées, exports multiples
  • sémantique : WYSIWYM

Le modèle imprimé -> numérique

Travail de l'auteur sémantique -> graphique
Travail éditorial graphique -> graphique bien formé
Diffuseur numérique graphique bien formé -> sémantique

Il y a un problème !

Le modèle imprimé -> numérique

Travail de l'auteur compétences sémantiques sémantique -> graphique compétences graphiques
Travail éditorial compétences graphiques graphique -> graphique bien formégraphique -> graphique bien formé compétences sémantiques
Diffuseur numérique compétences numériques graphique bien formé -> sémantique compétences sémantiques

Le modèle imprimé -> numérique

Concrètement

  1. Microsoft Word (sans styles) informations sémantiques perdues
  2. Styles sous Word (comité éditorial) temps perdu
  3. Mise en page InDesign temps et informations perdus
  4. Doc (ou docx) -> xml temps et informations perdus

Le problème est au début du processus

Un éditeur complet

  • Workflow fluide de l’auteur à l’éditeur
  • WYSIWYM est affiché ce qui est signifié
  • Plusieurs systèmes de balisage
  • Plusieurs outputs xml TEI, html 5, xhtml, tex, pdf, xml Erudit, …
  • Publications multiples sans perte d’information CMS, Érudit, InDesign
  • Environnement soutenable chaîne modulable basée sur des outils et formats standards
  • sémantique (URI, texte balisé)

Une application modulaire

3 modules principaux + modules techniques :

  1. Éditeur de métadonnées
    • yaml
    • DC, RDFa, Foaf, ScholarlyArticle, Google Scholar, Prism schema
    • Vocabulaire contrôlé
    • Alignement avec des autorités (Rameau, Wikidata, LOC)
    • Via l’API rechercheisidore (Huma-num)
  2. Éditeur de texte avec balisage interne
    • Markdown enrichi
    • autres ?
  3. Gestion bibliographique
    • BibTeX
    • Api Zotero
  1. Conversion
    • pandoc (vers html, LateX, pdf)
    • XSLT (vers TEI-LOD, Erudit)
  2. Versioning
    • git
    • comparateur de versions
  3. API

:::