Introduction

Ce cours est inutile (?)

Pourquoi parler d’édition?

  • On n’a plus besoin d’édition
  • Accès immédiat aux informations
  • Ce sont les machines qui lisent les textes!
  • Ce sont les machines qui écrivent les textes!

Vraiment?

  • Data, data, data! (les algorithmes vont évoluer, mais ils auront toujours besoin de données)
  • Quels modèles de texte?
  • Quelles interprétations?
  • Quelles compétences herméneutiques?
  • Quelles compétences éditoriales?

Objectifs

  • Comprendre les enjeux théoriques de la production de la connaissance et de l’accès au savoir aujourd’hui
  • Comprendre les principes de l’infrastructure technique qui régit notre société
  • S’orienter dans les principes technologiques sur lesquels se basent nos activités quotidiennes
  • Développer des compétences éditoriales de base
  • Commencer à devenir des humanistes (rapport matérialité/sens)

Axes

  • Théorique
  • Historique
  • Technique

Calendrier

  • 4 septembre: Introduction
  • 11 septembre: Qu’est-ce que l’édition?
  • 18 septembre: Qu’est-ce que le numérique?
  • 25 septembre: Histoire de l’informatique
  • 2 octobre: Histoire des réseaux
  • 9 octobre: Histoire du traitement numérique des textes
  • 16 octobre: Texte numérique: numérisation et modèles
  • 23 octobre: relâche
  • 30 octobre: Théorie des formats
  • 6 novembre: Écrire en utilisant md + pandoc (Louis-Olivier Brassard et Giulia Ferretti)
  • 13 novembre: Web sémantique
  • 20 novembre: Pas de cours
  • 27 novembre: Diffusion, accès et modèles économiques
  • 4 décembre: Édition et LLMs
  • 11 décembre: Rendu final

À faire

Lire et annoter:

Wikipédia

Être curieux et RTFM

Évaluation

  1. Travail sur Wikipédia jusqu’au 23 octobre: 15%
  2. Travail sur Wikipédia jusqu’au 11 décembre: 50%
  3. Participation et annotation 35%

Wikipédia

  • Contribution continue pendant 90 jours entre le 11 septembre et le 11 décembre
  • Minimum 60 contributions
  • Un compte-rendu d’expérience

Les contributions doivent être liées aux sujets dont traite le cours et possiblement rattachées au portail d’édition numérique

Wikipédia: pourquoi?

Wikipédia est désormais devenue une de nos sources principales d’information. C’est la seule plateforme communautaire en ligne qui puisse concurrencer par impact avec les grandes multinationales du web (Google, Amazon, Microsoft, etc.).

Participer à cette encyclopédie est une manière utile pour comprendre les enjeux de l’édition numérique, mais aussi une bonne manière pour contribuer à la production d’une connaissance libre et publique.

Wikipédia: comment?

Dans le cadre du cours chaque étudiant.e devra contribuer de façon continue, pendant 90 jours sur Wikipédia.

Il est impératif qu’il y ait au moins 60 contributions distribuées sur 60 jours différents dans la période des 90 jours.

Les contributions devront commencer le 11 septembre et finir le 11 décembre.

Les contributions doivent être distribuées dans le temps: il faut que les 60 contributions soient faites pendant 60 jours différents. Dans les 60 contributions ne seront pas comptées deux ou plus contributions faites le même jours. Je vous conseille cependant de dépasser largement le nombre minimal de 60 (un nombre optimal se situe autour de 90/150).

Wikipédia: comment?

Wikipédia: quelles contributions?

Les contributions doivent être liées aux sujets dont traite le cours et possiblement rattachées au portail d’édition numérique

Les contributions peuvent être du type suivant: - Des ajouts mineurs (au moins 20). Un ajout mineur est l’ajout d’une référence bibliographique, par exemple, d’une date, d’un lien etc. - Des ajouts majeurs (au moins 5). Un ajout majeur est l’écriture ou la réécriture d’un paragraphe ou d’une section. - Des corrections de forme (au moins 20) - (orthographe, style) - Wikification (au moins 15) - Participation à la discussion (au moins 5)

Wikipédia: compte-rendu

Compte-rendu d’expérience d’environ 3000 signes espaces compris déposé sur votre espace wikipédia personnel.

Tenez un journal de bord et corrigez-le au fur et à mesure.

Vous devez juste déposer votre nom d’usager (pas le mot de passe!) sur studium. AVANT le 23 octobre.

Annotation

Utiliser Hypothes.is (ce groupe) pour annoter les différents chapitres du livre de texte.

Chaque annotation devra être typée par un tag choisi dans la liste suivante:

  • reference: ajout d’une référence, du lien qui redirige vers la source (si possible), et de la pertinence de cette dernière.
  • accord: si vous êtes d’accord avec le passage annoté.
  • desaccord si vous êtes en désaccord avec le passage annoté. N’hésitez pas à argumenter, avec référence ou non.
  • suggestion: enrichissement plus éloigné du sujet et/ou ouverture vers un sujet connexe.
  • debat: identifier une problématique et ouvrir une discussion à son propos.
  • question: si vous souhaitez soulever une question.
  • interessant: pour souligner un passage qui vous semble intéressant. Spécifiez la raison de votre intérêt.

Attention: utilisez les tags dans l’orthographe normalisé ici. Par exemple reference et non référence.

Déposez sur studium votre nip (pas votre mot-de-passe!).

Qu’est-ce que l’édition?

La “trivialité” de l’édition…

  • Le contenu se fait ailleurs
  • L’auteur (!) qui pense
  • Peu importe la “mise en forme”

Pyramides…

Illusions perdues

Ce Séchard était un ancien compagnon pressier, que dans leur argot typographique les ouvriers chargés d’assembler les lettres appellent un Ours. Le mouvement de va-et-vient, qui ressemble assez à celui d’un ours en cage, par lequel les pressiers se portent de l’encrier à la presse et de la presse à l’encrier, leur a sans doute valu ce sobriquet. En revanche, les Ours ont nommé les compositeurs des Singes, à cause du continuel exercice qu’ils font pour attraper les lettres dans les cent cinquante-deux petites cases où elles sont contenues.

l’Ours solitaire était incapable de se transformer en Singe ; car, en sa qualité d’imprimeur, il ne sut jamais ni lire ni écrire.

Édition: pratique ou théorie?

  • Les “petites” actions de l’éditeur:
    • révision
    • correction
    • relecture
    • mise en forme
  • Mais aussi:
    • choix
    • suivi
    • distribution
    • production

Édition: pratique ou théorie?

La théorie de l’édition est l’approche nécessaire pour comprendre de quelle manière le sens émerge d’un contexte matériel particulier.

D'Aldus Manutius à Google

  • Un métier? Une entreprise? ou une instance?
  • Un institution
  • Une fonction: la fonction éditoriale
  • Emmanuel Souchier et l’énonciation éditoriale

Les fonctions de l'édition?

  • choix des contenus
  • garantie des contenus
  • diffusion des contenus
  • mise en forme, structuration: production de sens

Production, légitimation, circulation

L’exemple des titres et des italiques

L’exemple des titres et des italiques

Une pratique courante, mais pour exprimer quelle idée?

  • mot étranger
  • titre
  • nom scientifique d’animal

Qu’est-ce qu’un titre?

La théorie derrière les pratiques

Types d’édition

  • littéraire
  • savante
  • technique
  • art
  • autoédition?
  • plateformes: édition?
    • Wikipedia
    • Facebook

Qu'est-ce que le numérique?

Qu'est-ce que le numérique?

Plusieurs questions… par exemple :

  • numérique et analogique
  • Signification culturelle
  • Internet et web?
  • en ligne ou pas seulement ?
  • Crise institutionnelle
  • numérique et politique
  • Moderne, contemporain... numérique

Le numérique au sens propre

représentation de la réalité via des éléments discrets et atomiques qui correspondent à des nombres naturels

  • s’oppose à analogique: représentation du réel via un signal continu, “analogue” au réel

Il pleut…

  • Prendre une photo
  • Enregistrer le son
  • Décrire la situation
  • Percevoir l’eau sur la peau
  • Mesurer la température, le pourcentage d’humidité de l’air, la taille d’une goute, le spectre de la lumière…
  • etc…

Unités atomiques et discrètes

Par exemple:

  • goûtes de pluie de forme x, taille y, poids z, à hauteur h

L’échantillonnage

La base 2

Base 10 Base 2
0 0
1 1
2 10
3 11
4 100
5 101
6 110
7 111
Base 10 Base 2
8 1000
9 1001
10 1010
11 1011
12 1100
13 1101
14 1110
15 1111

La base 2

  • 11 en base 10 signifie: 1 dizaine et 1 unité (10+1).

  • 11 en base 2 signifie: 1 couple et une unité ( et donc en base 10: 2+1=3)

  • en base 10 avec 4 chiffres je peux exprimer: 104 = 10x10x10x10 = 10000 chifres (en effet de 0 à 9999)

  • en base 2 avec 4 chiffres je peux exprimer 24 = 2x2x2x2=16

  • en base 2 avec 8 chiffres je peux exprimer 28 = 256 (un octet)

Mais à l'aspect technique s'ajoute un aspect culturel

  • Discours (hi-fi, immatérialité etc.)
  • Pratiques
  • Changement de perception

Immatériel?

Caractéristiques?

  • Discrétisation - et modélisation
  • Multiplicité
  • Calculabilité - algorithmicité
  • Matérialité: l'espace numérique

Implication politiques

  • Modélisation et naturalisation
  • Algorithmes et production du sens - Page Rank
  • Données pures?
  • Machine et compréhension

La modélisation du monde

Trois étapes

  • modèle représentationnel
  • modèle fonctionnel
  • modèle physique

Les trois étapes ne sont pas étanches!

Les “limites” de la machine?

  • une machine ne peut pas…
  • le topos de l’humain qui excède la machine
  • l’angoisse de l’intelligence artificielle

Le modèle représentationnel

  • donner une description en langage naturel de quelque chose

Exemples de modèles représentationnels

  • Une voiture part un matin de Montréal et, en prenant l’autoroute se rend à Ottawa. L’autoroute part de…
  • Andréa et Camille s’aiment. S’aimer signifie: …
  • Proust est un grand écrivain.

Le modèle fonctionnel

  • Transformer la représentation en unité atomiques discrètes et définir des fonctions pour les traiter

Exemples

  • Une voiture = 1 objet O
  • Autouroute = ligne droite de 198 km
  • Vitesse de O = 100 km/h
  • Heure de départ = 10h
  • Fonction pour calculer temps = t =e/v (198/100)

Exemples

  • Andréa et Camille = A et C
  • A et C ont une série de caractéristiques C à un certain niveau x:
    • C1 amour de la culture, valeurs de 0 à 10
    • C2 implication politique de 0 à 10
    • C3 …
  • Fonction pour calculer le niveau d’amour qui lie A et C: calcul des différences de caractéristiques pondérées selon le critère z

Le modèle physique

  • Implémenter le calcul fonctionnel dans une machine de Turing réelle.

calculable = computable

Les limites des machines

  • limites physiques (temps et espace)
  • limites computationnelles
    • Incomplétude (Gödel)
    • Non définissabilité (Tarsky)
    • Decision problem - Hilbert’s Entscheidungsproblem (Turing-Church)
    • Halting problem (Turing)
  • Syntaxe et sémantique (Searle)

Mais non !

Ces problèmes ne concernent pas la réalité de l’informatique, mais plutôt la théorie de la computation définie selon le programme de Hilbert

  • Oracle machines
  • Unité homme-machine dans les réalités informatiques d’aujourd’hui

Et la représentation?

Histoire de l’informatique

Quelle histoire?

  • Il y a toujours des biais
    • sexisme
    • racisme
    • l’histoire du pouvoir
  • Choisir une histoire

Par où commencer?

  • Pythagore?
  • Leibniz?
  • Légitimité de l’histoire officielle

Les conjonctures médiatrices

  • un ensemble d’éléments entremêlés:
    • une culture
    • une histoire
    • des compétences techniques
    • un système économique
    • une situation géopolitique

Les conjonctures médiatrices “numériques”

  • tradition computationnelle
  • électronique
  • globalisation
  • économie libérale
  • culture du réseau

Qu’est-ce qu’un algorithme?

Muhammad ibn Musa al-Khwarizmi

محمد بن موسى الخوارزميّ

780-850

Traité: Al-Jabr

الجبر - reconstruction

Une définition

Ensemble d’instructions qui respectent deux conditions:

  • à chaque instruction il est possible de connaître l’instruction suivante
  • si on suit les étapes on arrive à une instruction qui demande l’arrêt.

Abaque

La pascaline

Une calculatrice en 1642

Babbage et Lovelace

  • Difference Engine 1820: calculer des tables de fonctions polynomiales

Turing

Machine de Turing

Les “premiers” ordinateurs

  • Bombe (Enigma machine) 1939
  • Z3 – 1941 (Konrad Zuse)
  • Colossus 1943
  • Harvard Mark I, Automatic Sequence Controlled Calculator – 1944
  • Electronic Numerical Integrator and Computer (ENIAC) 1945 (John Mauchly et J. Presper Eckert)
  • Harvard Mark II 1947
  • MANIAC I (Mathematical Analyzer Numerical Integrator and Automatic Computer Model I 1952 (John Von Neumann)

L’ordinateur personnel

Aujourd’hui

  • 1994 Yahoo!, Amazon
  • 1998 Google
  • 2001 Wikipédia
  • 2004 Facebook
  • 2008 Airbnb

Et en même temps:

  • 2013: W2V
  • 2017: Transformeurs
  • 2018: Google Translate commence à utiliser des réseaux de Neurones
  • IA et échecs

Histoire des réseaux

Réseaux

À quand ça remonte ?
Difficile d'établir un début...

  • Le concept de réseau...
  • Construction de routes
  • Relais de Poste
  • Canalmania? (1790)
  • Raylway mania? (1820)
  • Télégraphe? (1851 Manche, 1866 Atlantique)

Télégraphe

  • L’idée des signaux optiques
  • Télégraphe Hooke (1772)
  • Le télégraphe Chappe (1790)
  • Le télégraphe Morse (1840)

Histoire d'Internet

  • 1950
  • Situation politique (les technologies ne sont jamais sans rapport avec la politique!)
  • Recherche universitaire
  • Paul Baran : une réseau moins hiérarchisé pour des raisons militaires... Projet non réalisé
  • ARPAnet (1967, première connexion 1969) : financement militaire
  • 1972 les Hippies veulent créer la People's Computer Company
  • 1974 et 1978 Vint Cerf : TCP, puis IP
  • 1976 Wozniak et Jobs créent Apple

Histoire d'Internet

  • 1978 Minitel
  • Ethernet 1980
  • 1980 Usenet (réseau Unix)

Différents réseaux

  • 1981 BITnet (réseau IBM)
  • 1984 National Science Foundation : interconnecter les réseaux régionaux (financement du ouvernement US, Al Gore)
  • Inter- net

Le web

Histoire du traitement numérique des textes

Histoire des Humanités numériques

  • Textes et informatique
  • Digital vs humanities?
  • Machine vs êtres humains?
  • Quantité vs qualité?

Digital?

Le mondaneum

  • Paul Otlet - 1920
  • Savoir, index et paix

Histoire des Digital Humanities

  • 1950 Literary and linguistic Computing Père Roberto Busa → Index Thomisticus
  • amélioration du processus mécanique de recherche et de la quantification de données
  • 1972 fondation de l'association 1976 création revue Literary and linguistic Computing

On oublie quelqu’un?

Livia Canestraro, Rosetta Rossi Bertolli, Gisa Crosta… et toutes les autres!

Histoire des Digital Humanities

  • 1980 Humanities Computing : généralisation des pratiques
  • 1990 Digital Humanities
  • Naissance de revues, web, moteurs de recherche, Google (1998)...
  • Changements de paradigme...
  • Numérisation (Érudit, 1998, revues.org 1999, Persée 2003, Cairn 2006, rechercheisidore.fr 2009)
  • Fonction culturelle : Humanisme numérique

À quoi sert un ordinateur?

  • à calculer
  • à enregistrer?
  • à écrire?
  • documenter le code

Les machines à écrire

  • pourquoi ne pas utiliser une machine à écrire?
  1. parce qu’on écrit aussi du code
  2. Pour enregistrer

Avant Word

Écrire du code et de la doc, enregistrer et imprimer.

  • 1976 Electric Pencil
  • 1979 Easy Writer - John Thomas Draper
  • 1979 WordStar: WYSYWYG - car notion de page
  • L’ordinateur pour tous - 1984
  • 1983 Word

Les principes

  • interface graphique
  • imprimé
  • bureautique
  • format=software

Les effets

  • la “désintermédiation”
    • perte de compétences
  • la perte de contrôle
  • la perte d’utilité (utiliser un ordinateur comme une machine à écrire)

Internet et le web

Principes

  • Internet: un réseau physique et des protocoles
  • Le web (1.0, 2.0, 3.0)
  • Le format html
  • Serveurs, bases de données et CMS

Internet

Protocoles

Internet protocol: établit les règles d'adressage

  • non vérifié
  • non connecté
  • end-to end
  • distribué

Transmission control protocol : controle la transmission des paquets

DNS

  • Serveurs hiérarchisés et requête récursive
  • Root name server (serveurs racine)

Des enjeux politiques

  • Les protocoles ne sont pas neutres
  • Galloway, Alexander R. Protocol: how control exists after decentralization. Leonardo. Cambridge, Mass: MIT Press, 2004.

Netzukuku

Le web

  • URL (Uniform resource locator) - URN ou URI
  • HTTP (Hypertext transfer protocol)
  • HTML (Hypertext markup language)

:::

Le web

  • Pages web
  • Sites web
  • Applications web

URL

HTTP

Stateless

Méthodes

  • GET
  • POST
  • HEAD

Serveurs, bases de données, CMS, API

  • Un web plus dynamique
  • Php (ou autre) et bases de données
  • APIs

CMS

  • Wordpress
  • Drupal
  • Moodle

Le web 1.0-3.0

  • Web 1.0 : statique
  • Web 2.0 : social
  • Web 3.0 : sémantique

Les formats

Formats propriétaires

  • doc, docx, pdf, rtf, kindle
  • Appartiennent à des privés
  • Conditionnent les pratiques
  • Posent des problèmes de pérennité
  • Exigences commerciales avant les exigences de recherche

Formats libres

  • txt, html, xml, tex, odt, epub
  • Appartiennent à la communauté
  • Sont standards - possibilité de pérennité
  • Sont redéfinis par les pratiques
  • Exigences de recherche en premier !

Le texte brut

  • Texte brut
  • ASCII+Unicode
  • Pérenne et lisible
  • Formater en txt: le balisage

Ascii

128 caractères sur 7 bits (le 8e est 0)

Iso-8859

  • 256

Mais… pas de Œ, œ, Ÿ, et le signe €

UTF8

  • variable-width character encoding : 1 à 4 octets

1,112,064 de caractères

HTML

  • SGML
  • XML
  • HTML
  • XHTML
  • W3C vs Web Hypertext Application Technology Working Group
  • [HTML5[(https://html.spec.whatwg.org)
  • Compatibilité et tolérance vs structure

Guerre des navigateurs

  • Explorer vs Netscape et ensuite Mozilla et Firefox
  • Standard vs non standards
  • html: Tim Berners Lee et W3C
  • Qui possède le web?

Markdown

  • 2002 Aaron Swartz (RSS, redit, CC…) et atx

  • 2004: John Gruber markdown

  • Wiki Markup

  • Github md

  • pandoc md

WYSYWYM

md + yaml + bibtex

pandoc

Les modèles textuels

Web sémantique

L’idée

Métadonnées et informations structurées

Dans cette diapositive on va parler de metadonnées et d’informations structurées

  • Quel est le titre?
  • Quel est le sous-titre?
  • Quel est les mot le plus important ?

Métadonnées

  • Informations qui concernent le document
  • Données qui concernent des données

Et donc:

  • titre
  • auteur
  • date
  • type de document
  • mots-clés

Autorités et référentiels

Comment éviter les ambigüités?

  • identifiants uniques
  • qui les maintient?
    • RAMEAU
    • LOC
    • orcid

Informations structurées

Un exemple

Le web a été inventé en 1989 par Tim Berners-Lee un informaticien qui travaillait à l’époque au CERN à Genève. Il a créé le protocol HTTP et le langage de balisage HTML.

Comment rendre ces informations structurées?

Métadonnées

  • Schémas et implémentations
  • Un schéma: Dublin Core
  • Les métadonnées en HTML
  • Les métadonnées en XML
  • Les métadonnées dans d’autres formats

Form

Titre:
Soutitre:
Texte:
Mots-clés:

Et pour les informations structurées?

  • xml
Le web a été inventé en <date>1989</date> par <nom>Tim Berners-Lee</nom> un informaticien qui travaillait à l'époque au <institution>CERN</institution> à <lieu>Genève</lieu>. Il a créé le protocol HTTP et le langage de balisage HTML.
  • rdf
<web><inventeurDe><Tim Berners-Lee>
<web><lieuDeCreation><Genève>
<web><dateCreation><1989>

Des enjeux théoriques et politiques

  • Quel sera le web de demain ?
  • Sur quels principes théoriques sera-t-il basé?
  • Standards et essais d’orientations : le W3C
  • Le web sémantique
  • Le web des objets
  • Le web des services

3 bases du web sémantique

  • URI (Uniform Resource Identifier) (l’URL - Uniform Resource Locator - en est un cas particulier)
  • XML
  • RDF (OWL)

:::

Web des objets?

Utiliser le web sémantique?

Modèles économiques?

Différents contextes

  • Presse, revues scientifiques, publications grand public
  • Problème : mélange de types de publication
  • Problème : mélange de contenu (paquets)
  • Professionnels ? (professionnalisation de l'auteur et copyright)

Quelques modèles

  • payant
  • premium
  • freemium
  • publicités
  • open access

Payant

(ebook, amazon, revues, médiapart)

  • question des prix
  • questions des DRM
  • question de propriété
  • question de l'accès (à quoi a-t-on accès ?)
  • question du public (qui est prêt à payer ?)
  • Problème pour les contenus scientifiques (wiley, elzevir) : on paye 4 fois ! (production, mise en forme, aide, lecture)
  • Modèles émergents : revenu de création garanti, paquets

Open access

  • Déclaration de Budapest - 2002
  • Voie verte et voie dorée
  • Qui paye ?
  • Les auteurs ?
  • Les institutions ?
  • Et les autres contenus ?

Premium

  • contenus en plus – Quotidiens
  • Ça marche?
  • Pour qui ?

Barrière mobile

  • variante premium
  • contenus scientifiques (Érudit, Cairn)

Freemium

  • services en plus
  • Cléo (openedition)

Publicité

  • Un modèle complexe
  • Le cas de youtube
  • AdSens

La question des licences

  • GNU et la free software foundation
  • Les creative commons

Le domaine public

  • Le principe au Canada (Convention de Berne 1886 pour la protection des œuvres littéraires et artistiques)
  • La licence CC0
  • Le droit à l'image
  • Le droit moral
  • Les oeuvres dérivées
  • Quelques plateformes: Relire, litteratureaudio, archive.org, gallica, gutenberg

Édition, API et “intelligence artificielle”

Qu’est-ce que l’“IA”?

  • Notion vague
  • Génératif?

Tout est génératif

LLMs

  • LLM: grand modèle de langue. Modèle (représentation de la langue) dérivé d’un algorithme qui est entrainé à deviner le token suivant à partir d’un contexte donné, sur la base d’un grand corpus. Il n’a donc que des compétences purement linguistique. C’est un modèle de langue!

  • Il produit une représentation numérique de la langue. La langue est transformée en une série de chiffres. Chaque “mot” est transformé en un vecteur.

  • Ce sont des modèles probabilistes

  • Il peuvent être utilisés dans plusieurs applications

LxM

  • Généralisation du principe des LLM, mais sur des données non seulement textuels (images, sons, vidéos…)
  • “Modèles de fondation”
  • Frontier models

Des innombrables applications

Le travail d’un éditeur…

Selon McGuire:

A publisher’s job is to provide good APIs (Application Programming Interfaces) for their books. Now that almost all books are made into digital products (that is, ebooks), good publishers of the future will be the ones who provide great APIs.

Penser le sens, penser les données

En amont ou en aval

En amont

  • conception des modèles
  • structuration des données
  • mise à disposition

L’exemple de l’Anthologie Grecque

Techniquement, qu’est-ce qu’une épigramme?

  • une entité abstraite qui comporte
    • textes
    • mots-clés
    • image(s) de manuscrit
    • auteur(s)
    • scholia

Manipulation des données et évolution des modèles épistémologiques

  • alignements (wikidata, tlg…)
  • autorité et collaboration
  • Intelligence Artificielle Littéraire : pour un modèle algorithmique de la variation dans l’Anthologie grecque

Isidore

https://api.isidore.science/resource/search?type=http://isidore.science/ontology#thesis&discipline=http://aurehal.archives-ouvertes.fr/subject/shs.litt&q=Roland+Barthes&output=json

En aval

  • Deviner le sens
  • IA?

La machine comprend le texte

  • systèmes experts
  • statistiques
  • réseau de neurones et apprentissage machine

Des méthodes

  • fréquence des mots
  • topic modeling
  • NPL (TAL) (reconnaissance de texte, morphologie, sens)