Introduction

Objectifs

  1. Comprendre les enjeux de l'édition - numérique
    • Techniques
    • Théoriques
    • Sociaux
    • Politiques !
  2. S'orienter dans la technique
  3. Comprendre le lien entre technique et sens
  4. Comprendre la non-neutralité de la matérialité
  5. Donner envie d'en faire davantage

Qu'est-ce que l'édition numérique?

  • De quoi on parle?
    • Livrel?
    • Amazon?
    • Applications mobiles?
    • Le web?
  • Le rôle du web dans les changements de paradigme

Des enjeux très vastes

  • Production et transmission du savoir
  • Liberté et contrôle
  • … une des questions majeures à nos jours…

Quelques exemples pratiques

  • Qui suis-je à l'époque du numérique?
  • Qui pense et qui produit du sens?
  • Copyright, auctorialité et autorité
  • Neutralité d'Internet - protocoles et gestion des contenus
  • Algorithmes et visions du monde

Axes

  • Théorique
  • Historique
  • Pratique

Attention !

  • Cours non exhaustif !
  • Il faut être curieux!
  • Sujet en mouvement !
  • Vous risquez de trouver du travail !

Calendrier

  • 7 septembre - Introduction
  • 14 septembre - Qu’est-ce que l’édition ? Qu’est-ce que le numérique?
  • 21 septembre - Internet et le web: principes de base
  • 28 septembre - Histoire: ordinateurs, réseaux et édition 1
  • 5 octobre - Histoire: ordinateurs, réseaux et édition 2
  • 12 octobre - Histoire: ordinateurs, réseaux et édition 3
  • 19 octobre - Les formats
  • 26 octobre - Semaine de lecture - 1er rendu
  • 2 novembre - Les algorithmes: sens et syntaxe
  • 9 novembre - Le web sémantique 1
  • 16 novembre - Le web sémantique 2
  • 23 novembre - Modèles économiques et droits d’auteur
  • 30 novembre - Édition, API et “intelligence artificielle”
  • 7 décembre - La théorie de l’éditorialisation
  • 14 décembre - Rendu final

À faire

Lire et annoter:

Wikipédia

Être curieux et RTFM

Évaluation

  1. Travail sur Wikipédia jusqu’au 26 octobre: 15%
  2. Travail sur Wikipédia jusqu’au 14 décembre: 50%
  3. Participation et annotation 35%

Wikipédia

  • Contribution continue pendant 90 jours entre le 14 septembre et le 14 décembre
  • Minimum 60 contributions
  • Un compte-rendu d’expérience

Les contributions doivent être liées aux sujets dont traite le cours et possiblement rattachées au portail d’édition numérique

Wikipédia: pourquoi?

Wikipédia est désormais devenue une de nos sources principales d’information. C’est la seule plateforme communautaire en ligne qui puisse concurrencer par impact avec les grandes multinationales du web (Google, Amazon, Microsoft, etc.).

Participer à cette encyclopédie est une manière utile pour comprendre les enjeux de l’édition numérique, mais aussi une bonne manière pour contribuer à la production d’une connaissance libre et publique.

Wikipédia: comment?

Dans le cadre du cours chaque étudiant.e devra contribuer de façon continue, pendant 90 jours sur Wikipédia.

Il est impératif qu’il y ait au moins 60 contributions distribuées sur 60 jours différents dans la période des 90 jours.

Les contributions devront commencer le 14 septembre et finir le 14 décembre.

Les contributions doivent être distribuées dans le temps: il faut que les 60 contributions soient faites pendant 60 jours différents. Dans les 60 contributions ne seront pas comptées deux ou plus contributions faites le même jours. Je vous conseille cependant de dépasser largement le nombre minimal de 60 (un nombre optimal se situe autour de 90/150).

Wikipédia: comment?

Wikipédia: quelles contributions?

Les contributions doivent être liées aux sujets dont traite le cours et possiblement rattachées au portail d’édition numérique

Les contributions peuvent être du type suivant: - Des ajouts mineurs (au moins 20). Un ajout mineur est l’ajout d’une référence bibliographique, par exemple, d’une date, d’un lien etc. - Des ajouts majeurs (au moins 5). Un ajout majeur est l’écriture ou la réécriture d’un paragraphe ou d’une section. - Des corrections de forme (au moins 20) - (orthographe, style) - Wikification (au moins 15) - Participation à la discussion (au moins 5)

Wikipédia: compte-rendu

Compte-rendu d’expérience d’environ 3000 signes espaces compris déposé sur votre espace wikipédia personnel.

Tenez un journal de bord et corrigez-le au fur et à mesure.

Vous devez juste déposer votre nom d’usager (pas le mot de passe!) sur studium. AVANT le 26 octobre.

Annotation

Utiliser Hypothes.is pour annoter les différents chapitres du livre de texte.

Chaque annotation devra être typée par un tag choisi dans la liste suivante:

  • reference: ajout d’une référence, du lien qui redirige vers la source (si possible), et de la pertinence de cette dernière.
  • accord: si vous êtes d’accord avec le passage annoté.
  • desaccord si vous êtes en désaccord avec le passage annoté. N’hésitez pas à argumenter, avec référence ou non.
  • suggestion: enrichissement plus éloigné du sujet et/ou ouverture vers un sujet connexe.
  • debat: identifier une problématique et ouvrir une discussion à son propos.
  • question: si vous souhaitez soulever une question.
  • interessant: pour souligner un passage qui vous semble intéressant. Spécifiez la raison de votre intérêt.

Attention: utilisez les tags dans l’orthographe normalisé ici. Par exemple reference et non référence.

Déposez sur studium votre nip (pas votre mot-de-passe!).

Qu'est-ce que l'édition?

Le préjugé immatériel

  • le sens est immatériel
  • l’édition n’est que de la mise en forme

Qu'est-ce que l'édition?

Des instances institutionnelles :

  • choix des contenus
  • garantie des contenus
  • diffusion des contenus
  • mise en forme, structuration: production de sens

Production, légitimation, circulation

D'Aldus Manutius à Google

  • Un métier? Une entreprise? ou une instance?
  • Un institution
  • Une fonction: la fonction éditoriale
  • Emmanuel Souchier et l’énonciation éditoriale

Qu'est-ce que le numérique?

Qu'est-ce que le numérique?

Plusieurs questions… par exemple :

  • numérique et analogique
  • Signification culturelle
  • Internet et web?
  • en ligne ou pas seulement ?
  • Crise institutionnelle
  • numérique et politique
  • Moderne, contemporain... numérique

Le numérique au sens propre

représentation de la réalité via des éléments discrets et atomiques qui correspondent à des nombres naturels

  • s’oppose à analogique: représentation du réel via un signal continu, “analogue” au réel

Il pleut…

  • Prendre une photo
  • Enregistrer le son
  • Décrire la situation
  • Percevoir l’eau sur la peau
  • Mesurer la température, le pourcentage d’humidité de l’air, la taille d’une goute, le spectre de la lumière…
  • etc…

Unités atomiques et discrètes

Par exemple:

  • goûtes de pluie de forme x, taille y, poids z, à hauteur h

L’échantillonnage

La base 2

Base 10 Base 2
0 0
1 1
2 10
3 11
4 100
5 101
6 110
7 111
Base 10 Base 2
8 1000
9 1001
10 1010
11 1011
12 1100
13 1101
14 1110
15 1111

La base 2

  • 11 en base 10 signifie: 1 dizaine et 1 unité (10+1).

  • 11 en base 2 signifie: 1 couple et une unité ( et donc en base 10: 2+1=3)

  • en base 10 avec 4 chiffres je peux exprimer: 104 = 10x10x10x10 = 10000 chifres (en effet de 0 à 9999)

  • en base 2 avec 4 chiffres je peux exprimer 24 = 2x2x2x2=16

  • en base 2 avec 8 chiffres je peux exprimer 28 = 256 (un octet)

Mais à l'aspect technique s'ajoute un aspect culturel

  • Discours (hi-fi, immatérialité etc.)
  • Pratiques
  • Changement de perception

Immatériel?

Caractéristiques?

  • Discrétisation - et modélisation
  • Multiplicité
  • Calculabilité - algorithmicité
  • Matérialité: l'espace numérique

Implication politiques

  • Modélisation et naturalisation
  • Algorithmes et production du sens - Page Rank
  • Données pures?
  • Machine et compréhension

La modélisation du monde

Trois étapes

  • modèle représentationnel
  • modèle fonctionnel
  • modèle physique

Les trois étapes ne sont pas étanches!

Les “limites” de la machine?

  • une machine ne peut pas…
  • le topos de l’humain qui excède la machine
  • l’angoisse de l’intelligence artificielle

Le modèle représentationnel

  • donner une description en langage naturel de quelque chose

Exemples de modèles représentationnels

  • Une voiture part un matin de Montréal et, en prenant l’autoroute se rend à Ottawa. L’autoroute part de…
  • Andréa et Camille s’aiment. S’aimer signifie: …
  • Proust est un grand écrivain.

Le modèle fonctionnel

  • Transformer la représentation en unité atomiques discrètes et définir des fonctions pour les traiter

Exemples

  • Une voiture = 1 objet O
  • Autouroute = ligne droite de 198 km
  • Vitesse de O = 100 km/h
  • Heure de départ = 10h
  • Fonction pour calculer temps = t =e/v (198/100)

Exemples

  • Andréa et Camille = A et C
  • A et C ont une série de caractéristiques C à un certain niveau x:
    • C1 amour de la culture, valeurs de 0 à 10
    • C2 implication politique de 0 à 10
    • C3 …
  • Fonction pour calculer le niveau d’amour qui lie A et C: calcul des différences de caractéristiques pondérées selon le critère z

Le modèle physique

  • Implémenter le calcul fonctionnel dans une machine de Turing réelle.

calculable = computable

Les limites des machines

  • limites physiques (temps et espace)
  • limites computationnelles
    • Incomplétude (Gödel)
    • Non définissabilité (Tarsky)
    • Decision problem - Hilbert’s Entscheidungsproblem (Turing-Church)
    • Halting problem (Turing)
  • Syntaxe et sémantique (Searle)

Mais non !

Ces problèmes ne concernent pas la réalité de l’informatique, mais plutôt la théorie de la computation définie selon le programme de Hilbert

  • Oracle machines
  • Unité homme-machine dans les réalités informatiques d’aujourd’hui

Et la représentation?

Internet et le web

Principes

  • Internet: un réseau physique et des protocoles
  • Le web (1.0, 2.0, 3.0)
  • Le format html
  • Serveurs, bases de données et CMS

Internet

Protocoles

Internet protocol: établit les règles d'adressage

  • non vérifié
  • non connecté
  • end-to end
  • distribué

Transmission control protocol : controle la transmission des paquets

DNS

  • Serveurs hiérarchisés et requête récursive
  • Root name server (serveurs racine)

Des enjeux politiques

  • Les protocoles ne sont pas neutres
  • Galloway, Alexander R. Protocol: how control exists after decentralization. Leonardo. Cambridge, Mass: MIT Press, 2004.

Netzukuku

Le web

  • URL (Uniform resource locator) - URN ou URI
  • HTTP (Hypertext transfer protocol)
  • HTML (Hypertext markup language)

:::

Le web

  • Pages web
  • Sites web
  • Applications web

URL

HTTP

Stateless

Méthodes

  • GET
  • POST
  • HEAD

Serveurs, bases de données, CMS, API

  • Un web plus dynamique
  • Php (ou autre) et bases de données
  • APIs

CMS

  • Wordpress
  • Drupal
  • Moodle

Le web 1.0-3.0

  • Web 1.0 : statique
  • Web 2.0 : social
  • Web 3.0 : sémantique

Histoire ordinateurs, réseaux et édition

Quelle histoire?

  • Il y a toujours des biais
    • sexisme
    • racisme
    • l’histoire du pouvoir
  • Choisir une histoire

Par où commencer?

  • Pythagore?
  • Leibniz?
  • Légitimité de l’histoire officielle

Et les réseaux?

À quand ça remonte ?
Difficile d'établir un début...

  • Le concept de réseau...
  • Construction de routes
  • Relais de Poste
  • Canalmania? (1790)
  • Raylway mania? (1820)
  • Télégraphe? (1851 Manche, 1866 Atlantique)

Les conjonctures médiatrices

  • un ensemble d’éléments entremêlés:
    • une culture
    • une histoire
    • des compétences techniques
    • un système économique
    • une situation géopolitique

Les conjonctures médiatrices “numériques”

  • tradition computationnelle
  • électronique
  • globalisation
  • économie libérale
  • culture du réseau

Histoire d'Internet

  • 1950
  • Situation politique (les technologies ne sont jamais sans rapport avec la politique!)
  • Recherche universitaire
  • Paul Baran : une réseau moins hiérarchisé pour des raisons militaires... Projet non réalisé
  • ARPAnet (1967, première connexion 1969) : financement militaire
  • 1972 les Hippies veulent créer la People's Computer Company
  • 1974 et 1978 Vint Cerf : TCP, puis IP
  • 1976 Wozniak et Jobs créent Apple

L’ordinateur

Histoire d'Internet

  • 1978 Minitel
  • Ethernet 1980
  • 1980 Usenet (réseau Unix)

Différents réseaux

  • 1981 BITnet (réseau IBM)
  • 1984 National Science Foundation : interconnecter les réseaux régionaux (financement du ouvernement US, Al Gore)
  • Inter- net

Publications

  • 1990 Surfaces... la première revue numérique francophone Jean Claude Guédon, Département de littérature comparée UdeM

Le web

Histoire des Humanités numériques

  • Textes et informatique
  • Digital vs humanities?
  • Machine vs êtres humains?
  • Quantité vs qualité?

Digital?

Le mondaneum

  • Paul Otlet - 1920
  • Savoir, index et paix

Histoire des Digital Humanities

  • 1950 Literary and linguistic Computing Père Roberto Busa → Index Thomisticus
  • amélioration du processus mécanique de recherche et de la quantification de données
  • 1972 fondation de l'association 1976 création revue Literary and linguistic Computing

On oublie quelqu’un?

Livia Canestraro, Rosetta Rossi Bertolli, Gisa Crosta… et toutes les autres!

Histoire des Digital Humanities

  • 1980 Humanities Computing : généralisation des pratiques
  • 1990 Digital Humanities
  • Naissance de revues, web, moteurs de recherche, Google (1998)...
  • Changements de paradigme...
  • Numérisation (Érudit, 1998, revues.org 1999, Persée 2003, Cairn 2006, rechercheisidore.fr 2009)
  • Fonction culturelle : Humanisme numérique

À quoi sert un ordinateur?

  • à calculer
  • à enregistrer?
  • à écrire?
  • documenter le code

Les machines à écrire

  • pourquoi ne pas utiliser une machine à écrire?
  1. parce qu’on écrit aussi du code
  2. Pour enregistrer

Avant Word

Écrire du code et de la doc, enregistrer et imprimer.

  • 1976 Electric Pencil
  • 1979 Easy Writer - John Thomas Draper
  • 1979 WordStar: WYSYWYG - car notion de page
  • L’ordinateur pour tous - 1984
  • 1983 Word

Les principes

  • interface graphique
  • imprimé
  • bureautique
  • format=software

Les effets

  • la “désintermédiation”
    • perte de compétences
  • la perte de contrôle
  • la perte d’utilité (utiliser un ordinateur comme une machine à écrire)

Aujourd’hui

  • 1994 Yahoo!, Amazon
  • 1998 Google
  • 2001 Wikipédia
  • 2004 Facebook
  • 2008 Airbnb

Et en même temps:

  • 2013: W2V
  • 2018: Google Tranlate commence à utiliser des réseaux de Neurones
  • IA et échecs

Les formats

Formats propriétaires

  • doc, docx, pdf, rtf, kindle
  • Appartiennent à des privés
  • Conditionnent les pratiques
  • Posent des problèmes de pérennité
  • Exigences commerciales avant les exigences de recherche

Formats libres

  • txt, html, xml, tex, odt, epub
  • Appartiennent à la communauté
  • Sont standards - possibilité de pérennité
  • Sont redéfinis par les pratiques
  • Exigences de recherche en premier !

Le texte brut

  • Texte brut
  • ASCII+Unicode
  • Pérenne et lisible
  • Formater en txt: le balisage

Ascii

128 caractères sur 7 bits (le 8e est 0)

Iso-8859

  • 256

Mais… pas de Œ, œ, Ÿ, et le signe €

UTF8

  • variable-width character encoding : 1 à 4 octets

1,112,064 de caractères

HTML

  • SGML
  • XML
  • HTML
  • XHTML
  • W3C vs Web Hypertext Application Technology Working Group
  • [HTML5[(https://html.spec.whatwg.org)
  • Compatibilité et tolérance vs structure

Guerre des navigateurs

  • Explorer vs Netscape et ensuite Mozilla et Firefox
  • Standard vs non standards
  • html: Tim Berners Lee et W3C
  • Qui possède le web?

Markdown

  • 2002 Aaron Swartz (RSS, redit, CC…) et atx

  • 2004: John Gruber markdown

  • Wiki Markup

  • Github md

  • pandoc md

WYSYWYM

md + yaml + bibtex

pandoc

Qu’est-ce qu’un algorithme?

Une définition

Ensemble d’instructions qui respectent deux conditions:

  • à chaque instruction il est possible de connaître l’instruction suivante
  • si on suit les étapes on arrive à une instruction qui demande l’arrêt.

Machine de Turing

Une machine de Turing

Une machine morale

De la modélisation à l’algorithme

L’exemple des ‘algorithmes de l’amour’

Sens et syntaxe

Le test de Turing

Turing, A. M. « Computing Machinery and Intelligence ». Mind LIX, nᵒ 236 (1 octobre 1950): 433‑60. https://doi.org/10.1093/mind/LIX.236.433.

Le jeu des rôles - Imitation game

découvrir une différence ou la performer?

Performer l’humain

Take away message

Dans le test de Turing on ne “découvre” pas qui est l’être humain et qui est la machine: on produit la définition de ce qu’est l’humain et de ce qu’est une machine.

La chambre chinoise

Searle, John R. « Minds, Brains, and Programs ». Behavioral and Brain Sciences 3, nᵒ 3 (septembre 1980): 417‑24. https://doi.org/10.1017/S0140525X00005756.

My car and my adding machine, on the other hand, understand nothing: they are not in that line of business.

Qui est le plus intelligent?

  • homme vs femme
  • humain vs animal
  • humain vs machine

Instead of arguing continually over this point it is usual to have the polite convention that everyone thinks. Turing, A. M. « Computing Machinery and Intelligence ». Mind LIX, nᵒ 236 (1 octobre 1950): 433‑60. https://doi.org/10.1093/mind/LIX.236.433.

Le sens et la syntaxe

  • une table d’associations
input output
a? b

Une opération

a?
b

Le sens et la syntaxe

  • une table d’associations
input output
Qu'est-ce que le soleil? Une étoile

Une opération

Qu'est-ce que le soleil?
Une étoile

Le sens et la syntaxe

  • Syntaxe = juste ce qu’on voit: table + symboles
  • Sens = quelque chose de plus… mais quoi?

Et si on complexifiait la table?

Quelque chose de semblable:

Tononi, Giulio. 2012. Phi: A Voyage from the Brain to the Soul. New York: Pantheon

La définition de l’humain

est ‘humain’ ce qui échappe à la machine

Posthuman studies

My posthumanist account calls into question the givenness of the differential categories of human and nonhuman, examining the practices through which these differential boundaries are stabilized and destabilized. Barad, Karen. 2007. Meeting the Universe Halfway: Quantum Physics and the Entanglement of Matter and Meaning. Second Printing edition. Durham: Duke University Press Books.

Web sémantique

L’idée

Métadonnées et informations structurées

Dans cette diapositive on va parler de metadonnées et d’informations structurées

  • Quel est le titre?
  • Quel est le sous-titre?
  • Quel est les mot le plus important ?

Métadonnées

  • Informations qui concernent le document
  • Données qui concernent des données

Et donc:

  • titre
  • auteur
  • date
  • type de document
  • mots-clés

Autorités et référentiels

Comment éviter les ambigüités?

  • identifiants uniques
  • qui les maintient?
    • RAMEAU
    • LOC
    • orcid

Informations structurées

Un exemple

Le web a été inventé en 1989 par Tim Berners-Lee un informaticien qui travaillait à l’époque au CERN à Genève. Il a créé le protocol HTTP et le langage de balisage HTML.

Comment rendre ces informations structurées?

Métadonnées

  • Schémas et implémentations
  • Un schéma: Dublin Core
  • Les métadonnées en HTML
  • Les métadonnées en XML
  • Les métadonnées dans d’autres formats

Form

Titre:
Soutitre:
Texte:
Mots-clés:

Et pour les informations structurées?

  • xml
Le web a été inventé en <date>1989</date> par <nom>Tim Berners-Lee</nom> un informaticien qui travaillait à l'époque au <institution>CERN</institution> à <lieu>Genève</lieu>. Il a créé le protocol HTTP et le langage de balisage HTML.
  • rdf
<web><inventeurDe><Tim Berners-Lee>
<web><lieuDeCreation><Genève>
<web><dateCreation><1989>

Des enjeux théoriques et politiques

  • Quel sera le web de demain ?
  • Sur quels principes théoriques sera-t-il basé?
  • Standards et essais d’orientations : le W3C
  • Le web sémantique
  • Le web des objets
  • Le web des services

3 bases du web sémantique

  • URI (Uniform Resource Identifier) (l’URL - Uniform Resource Locator - en est un cas particulier)
  • XML
  • RDF (OWL)

:::

Web des objets?

Utiliser le web sémantique?

Modèles économiques?

Différents contextes

  • Presse, revues scientifiques, publications grand public
  • Problème : mélange de types de publication
  • Problème : mélange de contenu (paquets)
  • Professionnels ? (professionnalisation de l'auteur et copyright)

Quelques modèles

  • payant
  • premium
  • freemium
  • publicités
  • open access

Payant

(ebook, amazon, revues, médiapart)

  • question des prix
  • questions des DRM
  • question de propriété
  • question de l'accès (à quoi a-t-on accès ?)
  • question du public (qui est prêt à payer ?)
  • Problème pour les contenus scientifiques (wiley, elzevir) : on paye 4 fois ! (production, mise en forme, aide, lecture)
  • Modèles émergents : revenu de création garanti, paquets

Open access

  • Déclaration de Budapest - 2002
  • Voie verte et voie dorée
  • Qui paye ?
  • Les auteurs ?
  • Les institutions ?
  • Et les autres contenus ?

Premium

  • contenus en plus – Quotidiens
  • Ça marche?
  • Pour qui ?

Barrière mobile

  • variante premium
  • contenus scientifiques (Érudit, Cairn)

Freemium

  • services en plus
  • Cléo (openedition)

Publicité

  • Un modèle complexe
  • Le cas de youtube
  • AdSens

La question des licences

  • GNU et la free software foundation
  • Les creative commons

Le domaine public

  • Le principe au Canada (Convention de Berne 1886 pour la protection des œuvres littéraires et artistiques)
  • La licence CC0
  • Le droit à l'image
  • Le droit moral
  • Les oeuvres dérivées
  • Quelques plateformes: Relire, litteratureaudio, archive.org, gallica, gutenberg

Édition, API et “intelligence artificielle”

Le travail d’un éditeur…

Selon McGuire:

A publisher’s job is to provide good APIs (Application Programming Interfaces) for their books. Now that almost all books are made into digital products (that is, ebooks), good publishers of the future will be the ones who provide great APIs.

Penser le sens, penser les données

En amont ou en aval

En amont

  • conception des modèles
  • structuration des données
  • mise à disposition

L’exemple de l’Anthologie Grecque

Techniquement, qu’est-ce qu’une épigramme?

  • une entité abstraite qui comporte
    • textes
    • mots-clés
    • image(s) de manuscrit
    • auteur(s)
    • scholia

Manipulation des données et évolution des modèles épistémologiques

  • alignements (wikidata, tlg…)
  • autorité et collaboration
  • Intelligence Artificielle Littéraire : pour un modèle algorithmique de la variation dans l’Anthologie grecque

Isidore

https://api.isidore.science/resource/search?type=http://isidore.science/ontology#thesis&discipline=http://aurehal.archives-ouvertes.fr/subject/shs.litt&q=Roland+Barthes&output=json

En aval

  • Deviner le sens
  • IA?

La machine comprend le texte

  • systèmes experts
  • statistiques
  • réseau de neurones et apprentissage machine

Des méthodes

  • fréquence des mots
  • topic modeling
  • NPL (TAL) (reconnaissance de texte, morphologie, sens)
// reveal.js plugins